Anna's Archive
![]() | |
![]() Anna's Archive ホームページ(2025年1月15日) | |
URL |
annas-archive |
---|---|
タイプ | |
設立者 | アンナ(Anna Archivist)、Pirate Library Mirror |
営利性 | No |
登録 | 任意 |
開始 | 2022年11月 |
ファイル共有 |
---|
![]() |
Anna's Archiveは、2022年のZ-Libraryを閉鎖しようとする法執行機関の動きの直後、アンナという偽名の人物によって開設されたオープンソースの検索エンジンであり、シャドウライブラリを対象としている。Z-Library、Sci-Hub、Library Genesisを含む主要なシャドウライブラリなどの記録を集約している。自身を「人類史上最大の真にオープンな図書館」[† 1]と称し、「存在するすべての書籍をカタログ化し、これらすべての書籍をデジタル形式で簡単に利用可能にするという人類の進展を追跡する」ことを目指すと述べている[1]。このサイトは著作権のある資料のダウンロードについて責任を負わないと主張している[† 1]。これは、このサイトがメタデータをインデックス化するのみで、ファイル自体は直接ホストせず、第三者によるダウンロードリンクを提供するのみであるためである。しかしながら、政府によるネット検閲や出版社および出版業界の業界団体による訴訟の対象となっており、大規模な著作権侵害に関与しているとされている。
起源
[編集]Anna's Archiveは、Pirate Library Mirror(PiLiMi)プロジェクトから派生したものである。これは、匿名の有志によるシャドウライブラリのミラーサイト化を目的とした取り組みであり、2022年9月にZ-Libraryの完全なコピーを完成させた[2][3]。PiLiMiは「多くの国において著作権法に意図的に違反した」と認めており[2][3]、当初の重点は検索可能性ではなく保存にあった[4]。2022年11月、米国の法執行機関がZ-Libraryの複数のドメインを押収し、その運営者とされる人物を逮捕した数日後、PiLiMiのメンバーであるアンナ(Anna Archivist)はAnna's Archiveを立ち上げた。当初はZ-LibraryおよびLibrary Genesisからの検索結果を表示していた[1][2][3][5]。
ウェブサイトと運営
[編集]Anna's Archiveは検索エンジン[1]、メタ検索エンジン[2]、シャドウライブラリなど、様々な形で説明されている[3]。サイトはファイルを直接ホスティングしているわけではなく、第三者によって提供されたダウンロードリンクを掲載している[† 1][6]。また、IPFSプロトコルを通じたダウンロードも提供している[注釈 1][2][7]。
ソースコードはパブリックドメインとしてCC0ライセンスの下で公開されている[† 3]。また、同プロジェクトのデータ[注釈 2]はトレントファイルを通じて一括配布され、ウェブサイトの閉鎖に対する耐性を持たせている[† 1]。現在、.li
、.se
、.org
という異なるトップレベルドメイン下に3つのミラーサイトを運営している[† 1]。
2025年1月15日[update]、Anna's Archiveには40,369,782冊の書籍と98,401,746本の論文が収録されており[† 1]、組み込みのトレントのリストはおよそ1ペタバイトの規模に達している[† 5]。「ソースライブラリ」としてLibrary Genesis、Sci-Hub、Z-Library、Internet Archive、DuXiu、MagzDB、Nexus/STCなどが挙げられており、Open LibraryおよびWorldCatはメタデータのみの提供元とされている[† 6]。これらのデータセットの一部は公式に公開されているが、その他はスクレイピングや非公開の手段によって取得され、配布されている[† 6][8]。
現在資金面
[編集]Anna's Archiveでは、高速ダウンロードは有料会員のみに提供されており、非会員はブラウザ認証による低速な手段を使用する必要がある。これはボットによる悪用を防ぐためである。同サイトは自らを非営利団体と称しており、会費や寄付の大半がサーバーインフラの維持に使われ、運営者の私的使用には充てられていないと主張している[† 1]。一部のボランティア貢献者には会員資格や報酬が提供されている[† 7]。
Anna's Archiveは、大規模な金銭的またはデータの貢献と引き換えに、大規模言語モデルの学習を行うグループに対して、SFTP経由で全コレクションへの高速アクセスを提供している[9]。2025年1月時点では、主に中国を拠点とする約30社にこのアクセスを提供しており、その中にはLLM企業とデータブローカーの両方が含まれているとされている[10]。DeepSeekのVLモデルは、同サイトのデータを用いて学習された[11]。
動機
[編集]アンナは、プログラマであり情報活動家であるアーロン・スワーツからこのプロジェクトの着想を得たと語っており[† 1]、彼および他のシャドウライブラリアンたちは「情報は自由になりたがっている」と信じていると述べている[12]。
サイトのブロックと法的問題
[編集]
アメリカ合衆国
[編集]2023年以降、Anna's Archiveのドメインは、アメリカ合衆国通商代表部による年次の悪名高い市場のリストに掲載されている。このリストは、大規模な知的財産権の侵害に関与しているとされるデジタル市場および物理的市場に焦点を当てるものである。これらの報告書では、同サイトはSci-HubおよびLibrary Genesisと関連があると記述されている[13][14][15]。2023年のリストに関する通商代表部からのコメント要請に対し、アメリカ出版協会はAnna's Archiveを侵害サイトとして特定し、その暗号通貨ウォレットを分析した結果、2023年7月時点で29,000ドル以上の資金を受け取っていたことが判明した[16][17]。
OCLCによる訴訟
[編集]2023年10月、Anna's Archiveが世界最大の書誌データベースであるWorldCatの全データをスクレイピングし、その専有データを無料で公開したと報じられた。アンナはこれを「世界中の書籍をマッピングする上での大きなマイルストーン」と表現した[8]。WorldCatの運営元であるOCLCは、2024年1月にオハイオ州南部地区連邦地方裁判所に同サイトを提訴し、このスクレイピングが自社サーバーへのサイバー攻撃によって行われたと主張した[6]。OCLCは、Anna's Archiveに対して合計500万ドル超の損害賠償と、スクレイピングやデータ共有の差し止めを求めた[18]。OCLCは、自社の内部システムが侵害されたわけではないが、同サイトの行為は法的にはハッキングに該当すると考えていると述べた[19]。訴訟で名指しされた唯一の被告は、Anna's Archiveまたはスクレイピングへの関与を否定した[20]。技術ジャーナリストのグリン・ムーディは、この訴訟は「費用がかかる上に無意味」であり、情報のアクセスを促進するというOCLCの公式な使命に反していると批判した[21]。
2024年7月、訴訟を受けて、Anna's Archiveの.org
ミラーはアメリカの法域を回避するために新たな.gs
ミラーへと置き換えられた。しかしその直後、.gs
ドメインは停止され、ミラーは元の.org
ドメインへと戻された[18][22]
2025年3月、本件の法的な新規性に関する懸念から、裁判所は一部の判断をオハイオ州最高裁判所に委ね、OCLCによる欠席判決の申し立ておよび被告による却下申立ての双方を却下した[23]。4月には、OCLCは名指しされた被告と和解し、彼女を訴訟から除外する代わりに、サイト自体に対する判決の取得に焦点を移した[24]。
NVIDIA訴訟
[編集]2024年3月、作家のグループが、NVIDIAの生成AIプラットフォームNeMoがオープンソースのデータセットBooks3を学習に使用したとして、カリフォルニア州北部地区連邦地方裁判所にてNVIDIAを提訴した[25][26]。このデータセットにはAnna's Archiveを含む複数のシャドウライブラリからの著作権保護データが含まれていた[27]。同社は回答書において、これらのサイトをシャドウライブラリとする性格付けに異議を唱えたが、アンナ自身はこの用語を使用していた[27][28]。
Meta訴訟
[編集]2025年2月、MetaがAIモデルの学習に著作権保護作品を使用したとしてカリフォルニア州の裁判所で提訴された訴訟において、内部メールが開示され、同社がLibrary Genesisに加えてAnna's Archiveのトレントを通じて81テラバイト以上のデータをダウンロードしていたことが明らかとなった。原告はリチャード・キャドリー、サラ・シルバーマン、クリストファー・ゴールデンらを含む作家グループであり、CEOのマーク・ザッカーバーグがシャドウライブラリの利用を個人的に承認したと主張した。同社はAI学習における著作権保護データの使用はフェアユースであると主張していた[29][30][31]。
オランダ
[編集]2024年3月、ロッテルダムの地方裁判所は、BREINの要請により、オランダの主要なインターネットサービスプロバイダに対し、Anna's ArchiveおよびLibrary Genesisのブロッキングを命じた。この命令は「動的」なものであり、対象サイトが将来ドメインやIPアドレスを変更した場合でも、ISPはそのブロックを更新する義務を負うものである[32][33][34][35]。
イタリア
[編集]2024年1月、イタリア通信規制庁は、イタリア出版社協会による著作権侵害の申し立てに基づき、国内のインターネットサービスプロバイダに対しAnna's Archiveのブロックを命じた[36]。イタリアのデジタルサービス局による調査では、当該サイトに著作権保護された資料が存在することが確認され、その一部のサーバーはウクライナのホスティング業者が所有している可能性が高いとされたが、運営者の身元は判明しなかった[3]。
イギリス
[編集]2024年12月、英国出版協会は高等法院から命令を勝ち取り、主要インターネットサービスプロバイダに対しAnna's Archiveおよび他の著作権侵害サイトのブロックを義務付けた。この命令は、2015年以降1988年著作権・意匠・特許法第97A条の下でブロックされたサイトのリストを拡張するものである。同協会は、Anna's Archiveのドメイン上で100万件以上の著作権保護された書籍および学術論文の記録を特定したと述べている[37][38]。
その他の問題
[編集]Anna's Archiveは、2024年6月時点でGoogle 検索においてDMCA削除要請の対象となったドメインの中で上位10位に入っていた[39]。また、大手出版社を代理してGoogleや他の検索エンジンに削除要請を送っているオランダの反海賊版サービスLink-Bustersによって、最も頻繁に標的とされているサイトの一つである[40][41][42]。
2025年1月、メッセージングアプリTelegramは、著作権侵害を理由にAnna's Archiveのチャンネルを停止した。運営者はアプリ上での侵害投稿を避けるための措置を講じていたとされているにもかかわらず、この措置が取られた。同週にはZ-LibraryのTelegramチャンネルも停止された。両者とも事前通知は受けていなかった。これらの削除措置は、デリー高等裁判所による法的措置に関連しているとの憶測がある[43]。
関連項目
[編集]脚注
[編集]注釈
[編集]出典
[編集]- ^ a b c Manos, Leda (2022年11月22日). “Free Z-Library E-Book Download Search Engine "Anna's Archive" Launches Amid Arrests” (英語). LA Weekly. 2024年12月29日閲覧。
- ^ a b c d e Van der Sar, Ernesto (2024年4月16日). “"Anna's Archive" Opens the Door to Z-Library and Other Pirate Libraries” (英語). TorrentFreak. 2024年8月19日閲覧。
- ^ a b c d e Maxwell, Andy (2024年1月4日). “Silenzio! 'Anna's Archive' Shadow Library Blocked Following Publishers' Complaint” (英語). TorrentFreak. 2024年12月29日閲覧。
- ^ Booth, Callum (2022年7月4日). “The Pirate Library Mirror wants to preserve all human knowledge… illegally” (英語). TNW. 2024年10月19日閲覧。
- ^ Newson, Georgie (2022年12月14日). “In the Shadow Library” (英語). LRB Blog. 2025年1月22日閲覧。
- ^ a b Van der Sar, Ernesto (2024年2月7日). “Lawsuit Accuses Anna's Archive of Hacking WorldCat, Stealing 2.2 TB Data” (英語). TorrentFreak. 2024年12月30日閲覧。
- ^ Son, Jihun; Kim, Gyubin; Jung, Hyunwoo; Bang, Jewan; Park, Jungheum (2023-10-01). “IF-DSS: A forensic investigation framework for decentralized storage services”. Forensic Science International: Digital Investigation 46: 301611. doi:10.1016/j.fsidi.2023.301611. ISSN 2666-2817.
- ^ a b Van der Sar, Ernesto (2023年10月3日). “Anna's Archive Scraped WorldCat to Help Preserve 'All' Books in the World” (英語). TorrentFreak. 2024年8月19日閲覧。
- ^ Van der Sar, Ernesto (2025年1月31日). “Pirate Libraries Are Forbidden Fruit for AI Companies. But at What Cost?” (英語). TorrentFreak. 2025年2月1日閲覧。
- ^ Van der Sar, Ernesto (2025年2月1日). “Anna's Archive Urges AI Copyright Overhaul to Protect National Security” (英語). TorrentFreak. 2025年2月2日閲覧。
- ^ Lu, Haoyu; Liu, Wen; Zhang, Bo; Wang, Bingxuan; Dong, Kai; Liu, Bo; Sun, Jingxiang; Ren, Tongzheng et al. (2024-03-11), DeepSeek-VL: Towards Real-World Vision-Language Understanding, arXiv:2403.05525
- ^ Woodcock, Claire (2022年11月30日). “‘Shadow Libraries’ Are Moving Their Pirated Books to The Dark Web After Fed Crackdowns” (英語). VICE. 2025年4月15日閲覧。
- ^ Maxwell, Andy (2024年1月31日). “World's Most Notorious Pirate Sites Listed in New USTR Report” (英語). TorrentFreak. 2025年1月17日閲覧。
- ^ “2023 Review of Notorious Markets for Counterfeiting and Piracy”. United States Trade Representative (2024年1月30日). 2025年1月23日閲覧。
- ^ “2024 Review of Notorious Markets for Counterfeiting and Piracy”. United States Trade Representative (2025年1月8日). 2025年1月23日閲覧。
- ^ Van der Sar, Ernesto (2023年10月13日). “Pirate Sites Exploit 'Interplanetary File System' Gateways, Publishers Warn” (英語). TorrentFreak. 2025年1月17日閲覧。
- ^ “Comment from Association of American Publishers”. Regulations.gov (2023年10月9日). 2025年1月17日閲覧。
- ^ a b Van der Sar, Ernesto (2024年7月8日). “Anna's Archive Faces Millions in Damages and a Permanent Injunction” (英語). TorrentFreak. 2024年12月30日閲覧。
- ^ Price, Gary (2024年2月7日). “Report: "Lawsuit Accuses Anna's Archive of Hacking WorldCat, Stealing 2.2 TB Data"” (英語). Library Journal infoDOCKET. 2025年1月20日閲覧。
- ^ Van der Sar, Ernesto. “Key Defendant in Anna's Archive Lawsuit Denies Any Involvement With the Site” (英語). TorrentFreak. 2024年8月19日閲覧。
- ^ Moody, Glyn (2024年8月21日). “OCLC says "what is known must be shared", but sues Anna's Archive to stop it sharing knowledge” (英語). Walled Culture. 2025年1月19日閲覧。
- ^ Van der Sar, Ernesto (2024年7月18日). “Anna's Archive Loses .GS Domain Name But Remains Resilient” (英語). TorrentFreak. 2024年12月29日閲覧。
- ^ Van der Sar, Ernesto (2025年3月31日). “Anna's Archive Scraping: Court Defers Key Questions to State Supreme Court”. TorrentFreak. 2025年3月30日閲覧。
- ^ Van der Sar, Ernesto (2025年4月17日). “Alleged Anna's Archive Operator Dropped from U.S. 'Scraping' Lawsuit”. TorrentFreak. 2025年4月18日閲覧。
- ^ Stempel, Jonathan (2024年3月11日). “Nvidia is sued by authors over AI use of copyrighted works” (英語). Reuters 2025年1月19日閲覧。
- ^ Belanger, Ashley (2024年3月11日). “Nvidia sued over AI training data as copyright clashes continue” (英語). Ars Technica. 2025年1月18日閲覧。
- ^ a b Belanger, Ashley (2024年5月28日). “Nvidia denies pirate e-book sites are "shadow libraries" to shut down lawsuit” (英語). Ars Technica. 2025年1月18日閲覧。
- ^ Van der Sar, Ernesto (2024年5月27日). “NVIDIA Denies Copyright Infringement Claims in Authors' AI Lawsuit” (英語). TorrentFreak. 2025年1月18日閲覧。
- ^ Belanger, Ashley (2025年2月6日). “"Torrenting from a corporate laptop doesn't feel right": Meta emails unsealed” (英語). Ars Technica. 2025年2月9日閲覧。
- ^ Van der Sar, Ernesto (2025年2月6日). “Meta Torrented over 81 TB of Data Through Anna's Archive, Despite Few Seeders” (英語). TorrentFreak. 2025年2月9日閲覧。
- ^ Pontefract, Dan. “Authors Challenge Meta’s Use Of Their Books For Training AI” (英語). Forbes. 2025年3月27日閲覧。
- ^ Van der Sar, Ernesto (2024年3月23日). “Dutch Court Orders ISP to Block 'Anna's Archive' and 'LibGen'” (英語). TorrentFreak. 2024年12月29日閲覧。
- ^ “Blokkering shadow libraries bevolen” [Blocking shadow libraries ordered] (オランダ語). BREIN (2024年3月21日). 2025年1月17日閲覧。
- ^ “BREIN wil blokkering shadow libraries” [BREIN wants to block shadow libraries] (オランダ語). ICT Magazine (2024年4月4日). 2025年1月18日閲覧。
- ^ “Succesvolle toepassing Convenant Blokkeren Websites voor Library Genesis en Anna's Archive” [Successful application of Covenant Blocking Websites for Library Genesis and Anna's Archive] (オランダ語). Recht.nl (2024年4月26日). 2025年1月18日閲覧。
- ^ Stefanello, Viola (2024年1月12日). “Che fine ha fatto il movimento per il libero accesso alle pubblicazioni accademiche” [What happened to the movement for open access to academic publications?] (イタリア語). Il Post. 2025年1月19日閲覧。
- ^ Battersby, Matilda (2024年12月20日). “Publishers Association wins High Court bid ordering internet service providers to block pirate websites” (英語). The Bookseller. 2025年1月21日閲覧。
- ^ Joynson, Jasmine (2024年12月20日). “Authors and Publishers Win High Court Support in Fight Against Infringement”. Publishers Association. 2025年1月21日閲覧。
- ^ Van der Sar, Ernesto (2024年6月22日). “Google Search Processed a Billion DMCA Takedowns in Four Months” (英語). TorrentFreak. 2025年1月18日閲覧。
- ^ Van der Sar, Ernesto (2024年5月31日). “Link-Busters Flagged Over 56 Million 'Pirate' URLs to Google in a Week” (英語). TorrentFreak. 2025年1月18日閲覧。
- ^ Van der Sar, Ernesto (2024年7月29日). “Link-Busters Sent a Billion DMCA Takedown Requests to Google Search” (英語). TorrentFreak. 2025年1月18日閲覧。
- ^ Van der Sar, Ernesto (2025年1月17日). “More Than Half of All Google Search Takedowns Now Come from Link-Busters” (英語). TorrentFreak. 2025年1月18日閲覧。
- ^ Van der Sar, Ernesto (2025年1月15日). “Telegram Shuts Down Z-Library & Anna's Archive Channels Over Copyright Infringement” (英語). TorrentFreak. 2025年1月16日閲覧。
一次資料
[編集]- ^ a b c d e f g h “Frequently Asked Questions (FAQ)”. Anna's Archive. 2024年8月19日閲覧。
- ^ “Putting 5,998,794 books on IPFS”. Anna's Blog (2022年11月19日). 2025年1月15日閲覧。
- ^ “AnnaArchivist / annas-archive” (英語). GitLab. 2025年1月23日閲覧。
- ^ “Anna's Archive Containers (AAC): standardizing releases from the world's largest shadow library”. Anna's Blog (2023年8月15日). 2025年1月17日閲覧。
- ^ “Torrents”. Anna’s Archive. 2025年1月15日閲覧。
- ^ a b “Datasets”. Anna’s Archive. 2025年1月15日閲覧。
- ^ “Volunteering & Bounties”. Anna’s Archive. 2025年1月18日閲覧。
外部リンク
[編集]- 公式ウェブサイト
- PiLiMi ウェブサイト(アーカイブ)