인터넷 아카이브
Internet Archive업종 | 비영리단체 |
---|---|
사이트유형 | 디지털 라이브러리 |
에서 사용 가능 | 영어 |
설립 | 1996년 5월 10일;[1][2] | 전 (
본부 | 리치먼드 구 미국 캘리포니아주 샌프란시스코 37°46'56 ″N 122°28'18 ″W / 37.782321°N 122.471611°W |
설립자 | 브루스터 칼 |
회장님 | 브루스터 칼 |
서비스 | |
수익. | 3,050만 달러(2022) |
총자산 | 730만 달러(2022) |
직원들. | 169 (2022)[3] |
URL | archive |
상업의 | 아니요. |
런칭 | 1996 |
현황 | 활동적인 |
ASN | 7941 |
인터넷 아카이브(Internet Archive)는 1996년 5월 10일 설립된 미국의 비영리 디지털 도서관으로, 자유 정보 옹호자인 브루스터 칼(Brewster Kahle)이 이사장을 맡고 있습니다.[1][2][4] 웹 사이트, 소프트웨어 애플리케이션, 음악, 시청각 및 인쇄 자료를 포함한 디지털화된 자료 모음에 무료로 액세스할 수 있습니다. 아카이브는 또한 자유롭고 개방적인 인터넷을 지지합니다. 2024년[update] 2월 4일 현재 인터넷 아카이브는 4천 4백만 장 이상의 인쇄 자료, 1천 6백만 개의 비디오, 100만 개의 소프트웨어 프로그램, 1천 5백만 개의 오디오 파일, 480만 장의 이미지, 255,000개의 콘서트 및 8천 350억 개 이상의 웹 페이지를 웨이백 머신에 보유하고 있습니다.[5] 그 사명은 "모든 지식에 대한 보편적 접근"을 제공하는 것입니다.[5]
인터넷 보관소는 일반인이 디지털 자료를 데이터 클러스터에 업로드하고 다운로드할 수 있도록 허용하지만, 대부분의 데이터는 웹 크롤러에 의해 자동으로 수집되며, 이는 공용 웹을 최대한 많이 보존하기 위해 작동합니다. 웹 아카이브인 웨이백 머신(Wayback Machine)에는 수천억 개의 웹 캡처가 포함되어 있습니다.[6][7] 아카이브는 또한 세계에서 가장 큰 도서 디지털화 노력 중 하나인 수많은 도서 디지털화 프로젝트를 감독하고 있습니다.
역사
브루스터 칼은 1996년 5월 영리 웹 크롤링 회사 알렉사 인터넷을 시작한 것과 비슷한 시기에 아카이브를 설립했습니다.[8][9] 그 해 10월, 인터넷 아카이브는 월드 와이드 웹을 대량으로 보관하고 보존하기 시작했지만,[10] 1996년 5월 10일 오후 2시 42분에 가장 먼저 알려진 페이지를 저장했습니다.[11][12][13][14] 아카이브된 콘텐츠는 2001년 웨이백 머신을 개발하면서 일반 대중이 처음으로 이용할 수 있게 되었습니다.
1999년 말, 아카이브는 웹 아카이브를 넘어 프렐링거 아카이브를 시작으로 컬렉션을 확장했습니다. 이제 인터넷 아카이브에는 텍스트, 오디오, 동영상 및 소프트웨어가 포함됩니다. 이 밖에도 나사 이미지 아카이브, 계약 크롤링 서비스 아카이브-잇, 위키 편집 가능한 라이브러리 카탈로그 및 도서 정보 사이트 오픈 라이브러리 등 여러 프로젝트를 진행하고 있습니다. 그 직후, 아카이브는 인쇄 장애인들의 정보 접근 요구와 관련된 전문적인 서비스를 제공하기 위한 작업을 시작했습니다. 공개적으로 접근할 수 있는 책은 보호된 DAISY(Digital Accessible Information System) 형식으로 제공되었습니다.[15]
웹사이트에 따르면:[16]
대부분의 사회는 문화와 유산의 유물을 보존하는 것을 중요시합니다. 그러한 인공물이 없다면, 문명은 성공과 실패로부터 배울 수 있는 기억과 메커니즘이 없습니다. 우리 문화는 이제 디지털 형태로 점점 더 많은 공예품을 생산합니다. 아카이브의 임무는 이러한 유물들을 보존하고 연구자, 역사가, 학자들을 위한 인터넷 라이브러리를 만드는 것을 돕는 것입니다.
2012년 8월, 아카이브는 130만 개 이상의 기존 파일과 새로 업로드된 모든 파일에 대한 파일 다운로드 옵션에 BitTorrent를 추가했다고 발표했습니다[17].[18][19] 이 방법은 파일을 다운로드하여 계속 서비스하는 다른 토렌트 클라이언트 외에도 두 개의 아카이브 데이터 센터에서 파일이 제공되기 때문에 아카이브에서 미디어를 다운로드하는 가장 빠른 방법입니다.[18][20] 2013년 11월 6일 샌프란시스코 리치몬드 지구에 있는 인터넷 아카이브의 본사에서 불이 [21]나 장비가 파괴되고 인근 아파트 일부가 파손되었습니다.[22] 아카이브(Archive)에 따르면, 30개의 스캐닝 센터 중 하나인 수십만 달러 상당의 카메라, 조명 및 스캐닝 장비와 "아마도 20개의 책과 필름 상자, 대체할 수 없는 것, 대부분은 이미 디지털화된 것, 그리고 일부는 대체할 수 있는 것"을 잃어버렸습니다.[23] 비영리 아카이브는 예상 피해액 60만 달러를 충당하기 위해 기부금을 구했습니다.[24]
2014년 11월 베타 버전으로 사이트에 대한 정비가 시작되었고, 2016년 3월 레거시 레이아웃이 제거되었습니다.[25][26]
2016년 11월 Kahle은 인터넷 아카이브가 캐나다 어딘가에 기반을 둘 아카이브의 복사본인 캐나다 인터넷 아카이브를 구축하고 있다고 발표했습니다. 이 발표는 외국에 백업 보관소를 건설하기로 한 결정이 곧 있을 도널드 트럼프 대통령 때문이라는 암시 때문에 광범위한 보도를 받았습니다.[27][28][29] 칼레는 다음과 같이 말한 것으로 전해졌습니다.
미국에서 11월 9일, 우리는 급진적인 변화를 약속하는 새로운 행정부에 눈을 떴습니다. 장기적으로 구축된 우리와 같은 기관이 변화를 위해 설계해야 한다는 것을 확실히 상기시켜 주었습니다. 우리에게, 그것은 우리의 문화 자료를 안전하고, 사적이며, 영구적으로 접근할 수 있도록 유지하는 것을 의미합니다. 더 큰 제한에 직면할 수 있는 웹을 준비하는 것을 의미합니다. 이는 정부의 감시가 사라지지 않는 세상에서 고객을 위해 봉사한다는 것을 의미합니다. 실제로 이는 증가할 것으로 보입니다. 역사를 통틀어, 도서관들은 단순히 읽은 것 때문에 사람들이 몰려든, 끔찍한 사생활 침해에 맞서 싸웠습니다. 인터넷 아카이브에서는 디지털 세계에서 독자의 사생활을 보호하기 위해 싸우고 있습니다.[27]
2017년부터 OCLC와 인터넷 아카이브는 아카이브의 디지털화된 책 기록을 WorldCat에서 이용할 수 있도록 협력했습니다.[30]
2018년부터 아미르 세이버 에스파하니(Amir Saber Esfahani)와 앤드류 맥클린톡(Andrew McClintock)이 조직한 인터넷 아카이브(Internet Archive) 시각 예술 레지던시는 아티스트와 아카이브의 48 페타바이트[31] 이상의 디지털화된 자료를 연결하는 데 도움을 줍니다. 1년 동안의 거주 기간 동안, 시각 예술가들은 전시회로 끝나는 작품을 만듭니다. 디지털 역사를 예술과 연결하고 미래 세대가 온라인이나 오프라인에서 감상할 수 있는 것을 만드는 것이 희망입니다.[32] 거주하는 이전의 아티스트로는 타라바트 탈레파산드, 휘트니 린, 제니 오델 등이 있습니다.[33]
인터넷 아카이브는 2017년 보스턴 공립 도서관의 78rpm 디스크 수십만 장,[35] 2018년 트렌트 대학교의 도서 25만 권 기증,[36] 폐관 후 2020년 메리그로브 칼리지 도서관의 전체 소장품 [34]등 대부분의 자료를 기부금에서 획득합니다.[37] 그런 다음 모든 자료가 디지털화되어 디지털 스토리지에 보관되며, 디지털 사본은 원본 소유자에게 반환되고, 인터넷 보관소의 사본은 퍼블릭 도메인이 아닌 경우 CDL(controlled digital lending) 이론에 따라 전 세계 고객에게 한 번에 하나씩 대여됩니다.[38]
오퍼레이션스
이 섹션을 업데이트해야 합니다.(2020년 5월) |
아카이브는 미국에서 운영되는 501(c)(3) 비영리 단체입니다. 2019년에는 웹 크롤링 서비스, 다양한 파트너십, 보조금, 기부 및 칼-오스틴 재단의 수익에서 파생된 연간 3,600만 달러의 예산을 확보했습니다.[39] 인터넷 아카이브는 정기적인 자금 지원 캠페인도 관리합니다. 예를 들어, 2019년 12월 캠페인은 기부금 600만 달러 달성을 목표로 했습니다.[40]
아카이브는 캘리포니아 샌프란시스코에 본사를 두고 있습니다. 1996년부터 2009년까지 본사는 이전 미군 기지인 샌프란시스코 프레지덴시오에 있었습니다. 2009년부터 본사는 이전의 기독교 과학 교회인 샌프란시스코의 펀스턴 애비뉴 300번지에 있습니다. 한때 대부분의 직원이 도서 스캔 센터에서 일했습니다. 2019년 현재 전 세계 100명의 유료 운영자가 스캔을 수행하고 있습니다.[41] 아카이브에는 다음과 같은 캘리포니아 3개 도시에 데이터 센터도 있습니다. 샌프란시스코, 레드우드 시티, 리치몬드. 데이터 손실 위험을 줄이기 위해 아카이브는 이집트의 Bibliotheca Alexandrina와[42][43] 암스테르담의 시설을 포함한 더 먼 곳에 소장품의 일부 복사본을 만듭니다.[44]
아카이브(Archive)는 국제 인터넷 보존 컨소시엄(International Internet Preservation Consortium[45])의 회원이며, 2007년 캘리포니아 주에서 도서관으로 공식 지정되었습니다.[46][47]
웹 아카이빙
웨이백 머신
인터넷 아카이브(Internet Archive)는 로키와 불윙클 만화(특히 피바디의 있을 법하지 않은 역사)의 모험(WABAC Machine)이라는 용어의 대중적인 사용을 기반으로 하며, 월드 와이드 웹의 아카이브를 검색하고 액세스할 수 있는 서비스에 "웨이백 머신(Wayback Machine)"이라는 이름을 사용합니다.[48] 이 서비스를 사용하면 보관된 웹 페이지 중 일부를 볼 수 있습니다. Wayback Machine은 Alexa Internet(Amazon.com 소유)과 Internet Archive(인터넷 아카이브)의 공동 노력으로 만들어졌으며, 보관된 웹 콘텐츠를 검색할 수 있는 3차원 인덱스가 구축되었습니다. 수천억 개의 웹 사이트와 관련 데이터(이미지, 소스 코드, 문서 등)가 데이터베이스에 저장됩니다. 서비스는 이전 버전의 웹 사이트가 어떻게 생겼는지 확인하거나 더 이상 직접 사용할 수 없는 웹 사이트에서 원본 소스 코드를 가져오거나 더 이상 존재하지 않는 웹 사이트를 방문하는 데 사용할 수 있습니다. 많은 웹 사이트 소유자가 해당 사이트를 제외하기로 선택하기 때문에 모든 웹 사이트를 사용할 수 있는 것은 아닙니다. 웹 크롤러의 데이터를 기반으로 하는 모든 사이트와 마찬가지로 인터넷 보관소는 다양한 이유로 웹의 넓은 영역을 놓칩니다. 2004년 논문은 보도 내용에서 국제적 편향성을 발견했지만 "의도적이지 않다"고 판단했습니다.[50]
"페이지 지금 저장" 보관 기능은 2013년 10월에 Wayback Machine의 메인 페이지 오른쪽 하단에서 액세스할 수 있게 되었습니다.[51][52] 대상 URL을 입력하고 저장하면 웹 페이지가 Wayback Machine의 일부가 됩니다.[51] 인터넷 주소 web.archive.org 을 통해 사용자는 PDF 및 데이터 압축 파일 형식을 비롯한 다양한 콘텐츠를 Wayback Machine에 업로드할 수 있습니다. Wayback Machine은 https://archive.org 공식 웹 사이트에서 검색하는 동안 목록에 없는 경우에도 웹에서 액세스할 수 있는 업로드 콘텐츠의 영구 로컬 URL을 만듭니다.
2016년 10월, 웹 페이지의 집계 방식이 변경되어 표시된 보관 페이지 수가 감소할 것이라고 발표되었습니다. 그림, 비디오, 스타일시트, 자바스크립트와 같은 내장 개체는 더 이상 "웹 페이지"로 계산되지 않는 반면 HTML, PDF 및 일반 텍스트 문서는 계속 계산됩니다.[54]
연도 | 아카이브된 페이지(수십억 개) |
---|---|
2002 | 10[55] |
2003 | 11[56] |
2004 | 30[57] |
2005 | 40[58] |
2006–2008 | 85[59][60][61] |
2009–2012 | 150[62][63][64][65] |
2013 | 373[66] |
2014 | 435[67] |
2015 | 459[68] |
2016 | 510[69] |
279[70][a] | |
2017 | 310[71] |
2018 | 345[72] |
2019 | 401[73] |
2020 | 514[74] |
2021 | 640[75] |
2022 | 767[76] |
2024 | 735[5] |
2020년 9월, 인터넷 아카이브는 "Always Online" 서비스를 통해 제공되는 웹 사이트를 자동으로 색인화하기 위해 Cloudflare와 파트너십을 발표했습니다.[77]
아카이브-잇
2006년 초에 만들어진 Archive-It는[78] 기관과 개인이 디지털 콘텐츠 컬렉션을 구축 및 보존하고 디지털 아카이브를 만들 수 있는 웹 아카이빙 구독 서비스입니다. 보관 - 사용자가 문화유산의 이유로 보존하려는 웹 콘텐츠를 캡처하거나 제외할 수 있습니다. Archive-It 파트너는 웹 애플리케이션을 통해 아카이브된 컬렉션을 수집, 카탈로그화, 관리, 찾아보기, 검색 및 보기할 수 있습니다.[79]
접근성 측면에서 아카이브된 웹 사이트는 캡처 후 7일 이내에 전체 텍스트 검색이 가능합니다.[80] Archive-It를 통해 수집된 콘텐츠를 WARC 파일로 캡쳐하여 저장합니다. 기본 및 백업 복사본은 Internet Archive 데이터 센터에 저장됩니다. WARC 파일 사본은 우수 사례 기준에 따라 지리적 중복 보존 및 보관 목적으로 가입 파트너 기관에 제공될 수 있습니다.[81] Archive-It를 통해 캡처된 데이터는 주기적으로 Internet Archive의 일반 아카이브로 인덱싱됩니다.
Archive-It는 2014년[update] 3월 현재 미국 46개 주 및 16개 국가에서 275개 이상의 파트너 기관을 보유하고 있으며, 2,444개 이상의 퍼블릭 컬렉션에 대해 74억 개 이상의 URL을 캡처했습니다. Archive-It 파트너는 대학 및 대학 도서관, 주 기록 보관소, 연방 기관, 박물관, 법률 도서관 및 문화 단체로, 전자 문헌 기구, 노스캐롤라이나 주 기록 보관소 및 도서관, 스탠포드 대학교, 컬럼비아 대학교, 카이로의 아메리칸 대학교, 조지타운 법률 도서관, 그리고 많은 다른 사람들.
인터넷 아카이브 학자
2020년 9월, 인터넷 아카이브는 오픈 액세스 학술지를 아카이브하고 보존하기 위한 새로운 계획을 발표했습니다.[82][83][84] 전체 텍스트 검색 색인에는 2,500만 건 이상의 연구 기사와 인터넷 아카이브에 보존된 기타 학술 문서가 포함됩니다. 이 컬렉션은 최신 오픈 액세스 컨퍼런스 절차를 통해 디지털화된 18세기 저널 사본과 월드 와이드 웹에서 기어 나온 사전 인쇄물에 걸쳐 있습니다.
일반지수
2021년, 인터넷 아카이브는 1억 700만 개의 학술 저널 기사 모음에 공개 가능한 지수인 일반 지수의 초기 버전을 발표했습니다.[85][86]
도서전집
문자수집
인터넷 보관소에서 수행하는 검색은 도서관과 재단에서 재정적으로 지원합니다.[87] 약 100만 개의 텍스트가 있었던 2008년[update] 11월 현재, 전체 컬렉션은 원시 카메라 이미지, 잘라내기 및 왜곡된 이미지, PDF 및 원시 OCR 데이터를 포함하는 0.5 페타바이트 이상이었습니다.[88]
2013년[update] 7월 현재, 인터넷 아카이브는 5개국에 33개의 스캐닝 센터를 운영하고 있으며, 하루에 약 1,000권의 책을 디지털화하여 총 2백만권 이상의 책을 디지털화하고 있으며, 여기에는 다른 사람들에 의해 디지털화된 자료와 인터넷 아카이브에 입력된 자료를 포함하여 총 440만권의 책이 포함됩니다. 그 당시, 사용자는 월 1,500만 건 이상의 다운로드를 수행하고 있었습니다.[89]
다른 사람들에 의해 디지털화된 자료에는 마이크로소프트가 라이브 서치 북스 프로젝트를 통해 2006년에서 2008년 사이에 수집에 기여한 30만권 이상의 책이 포함되어 있으며, 여기에는 재정 지원과 인터넷 아카이브에 직접 기증된 스캔 장비도 포함되어 있습니다.[90] 2008년 5월 23일, 마이크로소프트는 라이브 북 서치 프로젝트를 종료하고 더 이상 책을 스캔하지 않을 것이며, 남은 스캔 장비를 이전 파트너들에게 기증할 것이라고 발표했습니다.[90]
2007년 10월경, 아카이브 사용자들은 Google Book Search에서 퍼블릭 도메인 북을 업로드하기 시작했습니다.[91] 2013년[update] 11월 현재, 아카이브의 컬렉션에는 90만 권 이상의 구글 디지털 도서가 있습니다.[92] 이 도서들은 구글 워터마크가 없는 것을 제외하고는 구글에서 볼 수 있는 사본과 동일하며, 무제한으로 사용 및 다운로드가 가능합니다.[a] 브루스터 칼(Brewster Kahle)은 2013년에 이러한 아카이브 작업을 애런 스와츠(Aaron Swartz)가 조정한 것이라고 밝혔습니다. 그는 "친구들의 무리"와 함께 구글에서 퍼블릭 도메인 북을 충분히 천천히, 그리고 구글의 제한 범위 내에 머물 수 있도록 충분한 컴퓨터에서 다운로드했습니다. 그들은 공용 도메인에 대한 대중의 접근을 보장하기 위해 이 작업을 수행했습니다. 아카이브는 항목이 구글에 귀속되고 다시 연결되도록 보장했고, 구글은 불평하지 않았고, 반면 도서관들은 "거절했다"고 말했습니다. Kahle에 따르면, 이것은 수백만 명의 사람들에게 공공의 이익을 가장 많이 줄 수 있는 것을 연구하는 Swartz의 "천재"의 한 예입니다.[93]
아카이브는 책 이외에도 REACP 웹 브라우저 플러그인을 통해 미국 연방법원의 PACER 전자문서 시스템에서 업로드된 4백만 건 이상의 법원 의견, 법률 개요 또는 전시물에 대한 무료 및 익명의 대중 접근을 제공합니다. 이 문서들은 연방 법원 급여 벽 뒤에 보관되어 있었습니다. 아카이브에는 2013년까지 6백만 명 이상이 액세스했습니다.[93]
아카이브의 BookReader 웹 앱은 웹 사이트에 내장되어 있으며,[94] 단일 페이지, 두 페이지, 썸네일 모드, 전체 화면 모드, 고해상도 이미지의 페이지 확대, 플립 페이지 애니메이션 등의 기능을 갖추고 있습니다.[94][95]
오픈 라이브러리
열린 도서관은 인터넷 보관소의 또 다른 프로젝트입니다. 이 프로젝트는 지금까지 출판된 모든 책의 웹 페이지를 포함하려고 합니다. 2,500만 건의 판본 카탈로그 기록을 보유하고 있습니다. 또한 웹 접근이 가능한 공공 도서관이 되고자 합니다. 이 도서관에는 약 1,600,000권의 공공 도메인 책(메인 텍스트 모음에서 500만권 이상)의 전체 텍스트와 인쇄물 및 저작권 내 책이 포함되어 있으며,[96] 이 중 많은 책은 완전히 읽을 수 있습니다. 다운로드[97][98] 및 전문 검색이 가능하며,[99] 6개국의 1,000개 이상의[89][100] 도서관 파트너와 협력하여 공공 영역이 아닌 647,784권 이상의 도서에 대해 통제된 디지털 대출 프로그램에서 2주간 전자책을 대출해 줍니다. 오픈 라이브러리(Open Library)는 GitHub에서 소스 코드를 자유롭게 사용할 수 있는 자유 및 오픈 소스 소프트웨어 프로젝트입니다.
오픈 라이브러리는 이 프로젝트가 허가 없이 책을 배포하고 있어 저작권법을 위반하고 있다고 주장하는 일부 저자와 저자 협회의 반대에 직면해 있으며,[101] 4개 주요 출판사는 2020년 6월 인터넷 아카이브를 상대로 오픈 라이브러리 프로젝트를 중단하기 위한 저작권 침해 소송을 시작했습니다.[102]
도서 후원자 디지털화
많은 대형 기관 후원자들은 인터넷 보관소가 수백만 개의 스캔된 출판물(텍스트 항목)을 제공하는 것을 도왔습니다.[103] 많은 양의 텍스트를 디지털화한 몇몇 후원자들은 토론토 대학의 로바츠 도서관, 앨버타 도서관, 오타와 대학, 의회 도서관, 보스턴 도서관 컨소시엄 회원 도서관, 보스턴 공공 도서관, 프린스턴 신학교 도서관 등을 포함합니다.[104]
2017년 MIT 출판사는 아카디아 기금의 재정 지원을 [105]받아 인터넷 아카이브에 출판사의 책을 디지털화하고 대출할 수 있도록 허가했습니다.[106][107] 1년 후, 인터넷 아카이브는 아카디아 기금으로부터 더 많은 자금을 지원받아 인터넷 아카이브와 제휴하여 책을 디지털화할 수 있도록 다른 대학 언론사들을 초대했습니다. 이 프로젝트는 "Unlocking University Press Books"입니다.[108][109]
의회 도서관은 인터넷 보관소에서 무료로 디지털화된 책을 가리키는 수많은 핸들 시스템 식별자를 만들었습니다.[110] 인터넷 아카이브 및 오픈 라이브러리는 전자 책의 출처로 의회 도서관 웹사이트에 나열되어 있습니다.[111]
미디어 컬렉션
웹 아카이브 외에도 인터넷 아카이브는 업로더가 미국의 공용 도메인에 있다고 증명하거나 Creative Commons 라이센스와 같이 재배포를 허용하는 라이센스로 라이센스를 부여받은 광범위한 디지털 미디어 컬렉션을 유지 관리합니다. 미디어는 미디어 유형별 컬렉션(움직이는 이미지, 오디오, 텍스트 등)과 다양한 기준에 의해 하위 컬렉션으로 구성됩니다. 각 주요 컬렉션에는 대중의 일반적인 기여가 저장되는 "커뮤니티" 하위 컬렉션(이전 이름은 "오픈 소스")이 포함됩니다.
오디오
오디오 아카이브
오디오 아카이브는 음악, 오디오북, 뉴스 방송, 오래된 라디오 쇼, 팟캐스트 및 기타 다양한 오디오 파일을 포함하는 오디오 아카이브입니다. 2023년[update] 1월 현재 컬렉션에는 15,000,000,000개 이상의 무료 디지털 녹음이 있습니다. 하위 컬렉션에는 오디오 책 및 시, 팟캐스트, 영어 외 오디오 및 기타 많은 것이 포함됩니다.[112] 사운드 컬렉션은 B가 선별합니다. 조지, 현대음악 아카이브 감독.[113]
재고 HTML5 오디오 플레이어 옆에 Winamp 유사 웹amp를 사용할 수 있습니다.
아마추어 무선통신 디지털 도서관
아마추어무선디지털커뮤니케이션즈재단의 지원을 받아 아마추어무선전송 녹화물을 보존하는 사업.[114][115]
라이브 뮤직 아카이브
Live Music Archive 하위 컬렉션에는 독립 음악가들의 170,000개 이상의 콘서트 녹음뿐만 아니라 감사의 죽음, 그리고 최근에는 The Smashing Pumpkins와 같은 그들의 콘서트 녹음에 대한 허가된 규칙을 가진 더 많은 기성 아티스트와 앙상블이 포함되어 있습니다. 또한, Jordan Zevon은 인터넷 아카이브가 그의 아버지 Warren Zevon의 콘서트 녹음의 최종 컬렉션을 개최하도록 허락했습니다. 제본 컬렉션은 1976년부터 2001년까지 다양하며 1,137곡을 포함한 126곡의 콘서트를 포함하고 있습니다.[116]
대 78 프로젝트
Great 78 Project(위대한 78 프로젝트)는 1880년부터 1960년 사이에 다양한 수집가와 기관에서 기증한 25만 개의 78rpm 싱글(50만 곡)을 디지털화하는 것을 목표로 합니다. 오디오 디지털화를 담당하는 현대 음악 아카이브 및 George Blood Audio와 협력하여 개발되었습니다.[113]
넷라벨
보관소에는 Netlabels 서비스를 통해 스트리밍되고 다운로드할 수 있는 자유롭게 배포 가능한 음악 모음이 있습니다. 이 컬렉션의 음악에는 일반적으로 가상 레코드 레이블의 크리에이티브 커먼즈 라이센스 카탈로그가 있습니다.[117][118]
영상수집
이 컬렉션에는 350만 개 이상의 아이템이 포함되어 있습니다.[119] 커버 아트 아카이브, 메트로폴리탄 미술관 – 갤러리 이미지, NASA 이미지, Occupy Wall Street Flickr Archive 및 USGS Maps는 이미지 컬렉션의 일부 하위 컬렉션입니다.
커버 아트 아카이브
커버 아트 아카이브(Cover Art Archive)는 인터넷 아카이브(Internet Archive)와 뮤직브레인즈(MusicBrainz)의 공동 프로젝트로, 인터넷에서 커버 아트 이미지를 만드는 것이 목표입니다. 2021년 4월 현재 [update]이 컬렉션에는 1,400,000개 이상의 아이템이 포함되어 있습니다.[120]
메트로폴리탄 미술관 이미지
이 컬렉션의 이미지는 메트로폴리탄 미술관에서 가져온 것입니다. 이 컬렉션에는 140,000개 이상의 아이템이 포함되어 있습니다.[121]
나사 이미지
나사 이미지 아카이브는 인터넷 아카이브와 나사 간의 스페이스 액트 계약을 통해 생성되어 검색 가능한 단일 리소스에서 나사의 이미지, 비디오 및 오디오 컬렉션에 대중이 액세스할 수 있도록 했습니다. IA NASA Images 팀은 계속 증가하는 컬렉션에 계속해서 추가하기 위해 모든 NASA 센터들과 긴밀히 협력했습니다.[122] nasaimages.org 사이트는 2008년 7월에 시작되었으며 2012년 호스팅 종료 시 10만 개 이상의 항목을 온라인에 보유하고 있었습니다.
Wall Street Flickr 아카이브 점유
이 컬렉션에는 월스트리트 점령 운동과 관련된 플리커의 크리에이티브 커먼즈 라이선스 사진이 포함되어 있습니다. 이 컬렉션에는 15,000개 이상의 품목이 포함되어 있습니다.[123]
USGS 지도
이 컬렉션에는 리브르 맵 프로젝트의 59,000개 이상의 아이템이 포함되어 있습니다.[124]
머니마 아카이브
인터넷 보관소의 비디오 보관소의 하위 컬렉션 중 하나는 Machinima 보관소입니다. 이 작은 섹션에는 많은 Machinima 비디오가 있습니다. Machinima는 컴퓨터 게임, 게임 엔진 또는 소프트웨어 엔진을 샌드박스와 같은 모드로 사용하여 영화를 만들고, 연극을 다시 만들거나 프레젠테이션이나 키노트를 출판하는 디지털 아트 형태입니다. 이 아카이브는 독립 제작사뿐만 아니라 루스터 티스(Rooster Tethes), Machinima.com 와 같은 인터넷 출판사로부터 다양한 Machinima 영화를 수집합니다. 이 서브 컬렉션은 인터넷 아카이브, 스탠포드 대학의 How They Got Game 연구 프로젝트, Machinima Arts and Sciences 아카데미, 그리고 Machinima.com 의 공동 노력입니다.
마이크로필름 모음
이 컬렉션에는 시카고 대학 도서관, 일리노이 대학 어바나 샴페인, 앨버타 대학, 앨런 카운티 공공 도서관 및 국가 기술 정보 서비스를 포함한 다양한 도서관에서 약 160,000개의 마이크로 촬영된 물품이 포함되어 있습니다.[126][127]
동영상수집
인터넷 아카이브에는 약 3,863편의 장편 영화 모음집이 있습니다.[128] 또한 인터넷 아카이브의 움직이는 이미지 컬렉션에는 뉴스릴, 고전 만화, 전쟁 반대 및 선전, 비디오 저장실 컬렉션, 스킵 엘샤이머의 "A.V."가 포함되어 있습니다. "긱스" 컬렉션, 초기 텔레비전 및 광고, 교육 및 산업 영화, 아마추어 및 가정용 영화 컬렉션과 같은 프레링거 아카이브의 일시적인 자료.
이 컬렉션의 하위 범주는 다음과 같습니다.
- 레고 블록으로 촬영한 스톱 모션 애니메이션이 포함된 IA의 브릭 필름 컬렉션, 그 중 일부는 장편 영화의 "리메이크"입니다.
- 2004년 미국 대통령 선거와 관련된 비디오 자료를 공유하기 위한 비당권적 공공 자원인 IA's Selection 2004 컬렉션.
- IA의 FedFlix 컬렉션, National Technical Information Service와 Public 간의 조인트 벤처 NTIS-1832.자원."훈련 영화에서 역사에 이르기까지, 우리 국립공원에서 미국 소방 아카데미와 우편 검사관에 이르기까지, 미국 정부의 최고의 영화"[129]를 특징으로 하는 오르간
- IA's Independent News Collection은 2001년부터 인터넷 아카이브의 World At War 대회와 같은 하위 컬렉션을 포함하며, 참가자들은 "역사에 대한 접근이 중요한 이유"를 보여주는 단편 영화를 만들었습니다. 그들이 가장 많이 다운로드한 비디오 파일 중에는 파괴적인 2004년 인도양 지진의 목격자 녹음이 포함되어 있습니다.
- IA의 '9·11 TV 아카이브'는 2001년 9·11 테러 공격의 세계 주요 TV 네트워크가 생방송으로 공개한 기록물을 담고 있습니다.[130]
오픈 교육 리소스
Open Educational Resources는 archive.org 의 디지털 컬렉션입니다. 이 컬렉션에는 수백 개의 무료 강좌와 동영상 강의, 미국과 중국 대학의 보충 자료가 포함되어 있습니다. 이 컬렉션의 기여자는 Ars Digita University, Hewlett Foundation, MIT, Montrey Institute, 그리고 Naropa University입니다.[131]
TV 뉴스 검색 및 대출
2012년 9월, 인터넷 아카이브는 미국의 전국 뉴스 프로그램을 검색하는 TV 뉴스 검색 및 대출 서비스를 시작했습니다.[132] 이 서비스는 폐쇄 캡션 녹취록을 기반으로 하며 사용자가 30초 분량의 동영상을 검색하고 스트리밍할 수 있습니다. 시작과 동시에, 그 서비스는 "샌프란시스코와 워싱턴 D.C.에 있는 전국적인 미국 네트워크와 방송국들로부터 3년에 걸쳐 수집된 35만 개의 뉴스 프로그램"을 포함했습니다.[133] 칼에 따르면, 그 서비스는 텔레비전 방송되는 네트워크 뉴스 프로그램들의 비슷한 도서관인 밴더빌트 텔레비전 뉴스 아카이브로부터 영감을 받았다고 합니다.[134] 가입 대학과 관련된 개인에게 스트리밍 비디오에 대한 액세스를 제한하는 Vanderbilt와는 대조적으로, TV 뉴스 검색 및 대출은 스트리밍 비디오 클립에 대한 공개 액세스를 허용합니다. 2013년, 아카이브는 필라델피아 여성 Marion Stokes의 사유지로부터 "약 40,000개의 잘 정리된 테이프"를 추가로 기증받았습니다. Stokes는 "그녀의 VHS와 Betamax 기계로 필라델피아와 보스턴에서 35년 이상의 TV 뉴스를 녹화했습니다."[135]
잡화집
브루클린 박물관 소장품은 브루클린 박물관의 약 3,000점을 소장하고 있습니다.[136] 2020년 12월, 릴리안 마이컬슨의 영화 연구 도서관이 아카이브에 기증되었습니다.[137]