상세 컨텐츠

본문 제목

안나스 아카이브, 스포티파이 음악 8,600만 곡 스크래핑 논란

IT 소식

by 웨어러블서치 2025. 12. 23. 14:30

본문


The scrape accessed 86 million audio files, and Spotify disabled the accounts involved.

해당 스크래핑으로 8,600만 개의 오디오 파일이 분석하였으나, 스포티파이는 이에 관여한 계정들을 차단했습니다.


사진출처) ChatGPT로 만든 이미지

 

인터넷상에서 저작권자의 허락 없이 다양한 저작물을 대량으로 모아두는 섀도 라이브러리(Shadow Library, 그림자 도서관)로 알려진 안나스 아카이브(Anna’s Archive)가 세계최대 규모의 오디오 스트리밍 및 미디어 서비스 제공업체 스포티파이(Spotify)의 음악 데이터를 대규모로 수집·배포했다고 주장하면서 글로벌 음악 산업과 기술 업계에 큰 파장을 일으키고 있습니다.

이에 대해 스포티파이는 불법 접근 정황을 확인하고 관련 계정을 차단했으며, 현재 사건을 조사 중이라고 합니다.

안나스 아카이브는 최근 블로그를 통해 스포티파이에서 약 300테라바이트(TB)에 달하는 데이터를 확보했으며, 이는 2억5600만 개 트랙의 메타데이터와 8600만 개의 오디오 파일를 포함한다고 주장했습니다.

이 데이터는 P2P 네트워크를 통해 대용량 토렌트 형태로 배포될 예정이며, 전체 스포티파이 청취량의 99% 이상을 포괄한다고 설명합니다.

 

사진출처) Anna’s Archive

 

다만 현재까지 실제로 공개된 것은 메타데이터 중심이며, 음악 파일은 단계적으로 공개될 가능성도 있다고 언급된 상태입니다. 안나스 아카이브 측은 2025년 7월 기준 스포티파이 전체 곡 중 약 37%에 해당하는 파일을 확보했으며, 재생 빈도가 거의 없거나 품질이 낮은 곡, AI 생성 음악 등은 우선순위에서 제외했다고 밝혔습니다.

안나스 아카이브는 이번 프로젝트의 목적을 “인류의 음악 유산을 영구적으로 보존하기 위한 오픈 보존 아카이브 구축”이라고 주장합니다. 자연재해, 전쟁, 예산 삭감 등으로 문화 자산이 소실될 위험에 대비해야 한다는 논리입니다. 이들은 스포티파이 스크래핑을 “모든 음악을 대표하는 권위 있는 토렌트 목록을 만들기 위한 출발점”으로 규정하고 있습니다.

그러나 이러한 설명에도 불구하고, 업계와 이용자 반응은 엇갈리고 있습니다. 특히 AI 학습 데이터 확보를 위한 사실상의 대규모 불법 수집 아니냐는 의혹이 제기됩니다. 안나스 아카이브는 웹사이트를 통해 AI 연구기관과 기업을 대상으로 고속·대규모 데이터 접근(엔터프라이즈급 LLM 데이터셋)을 후원 및 협업 형태로 제공하고 있어, AI 개발 지원이 실질적 동기라는 분석도 있습니다.

 

사진출처) Anna’s Archive

 

스포티파이는 이번 사안과 관련해 공식 입장은 다음과 같습니다. “조사 결과, 제3자가 공개 메타데이터를 스크래핑하고 DRM을 우회하는 불법 수단을 사용해 일부 오디오 파일에 접근한 사실을 확인했습니다. 관련된 악의적 사용자 계정은 이미 차단했으며, 향후 유사한 저작권 침해 공격을 막기 위한 추가적인 보호 조치를 시행하였습니다.”

또한 스포티파이는 “아티스트 커뮤니티와 함께 해적 행위에 반대해 왔으며, 산업 파트너들과 협력해 창작자의 권리를 보호할 것”이라고 강조했습니다. 실제로 안나스 아카이브가 주장하는 데이터 규모가 어느 정도까지 사실인지, 그리고 법적 대응이 이어질지는 아직 불확실합니다.

안나스 아카이브의 기존 이용자층—주로 학술 논문, 도서, 잡지를 찾는 사용자들—사이에서는 우려가 확산되고 있습니다. 해커뉴스(Hacker News)와 레딧(Reddit)에서는 “이번 스포티파이 스크래핑이 아카이브 전체를 법적 표적으로 만들 수 있다”는 비판이 이어졌습니다.

일부 이용자는 과거 인터넷 아카이브(Internet Archive)가 음반사들과의 소송 끝에 합의에 이르렀던 사례를 언급하며, 이번 사건이 안나스 아카이브의 존속 자체를 위협할 수 있다고 지적했습니다. 반면, 안나스 아카이브는 분산 구조를 통해 “플랫폼이 폐쇄되더라도 데이터와 소프트웨어는 반복적으로 재등장할 수 있도록 설계됐다”고 주장해 왔습니다.

 

사진출처) Anna’s Archive

 

이번 논란은 음악 저작권 보호, 디지털 아카이빙, AI 학습 데이터의 합법성이라는 세 가지 이슈가 정면으로 충돌하는 사례로 평가됩니다. 이론적으로는 개인 서버와 충분한 저장 공간만 있다면 “개인용 무료 스포티파이”를 구축할 수 있다는 주장까지 제기되며, 업계 전반에 구조적 긴장감을 불러일으키고 있습니다.

안나스 아카이브가 주장하는 ‘보존’의 명분이 법적·윤리적으로 어디까지 인정될 수 있을지, 그리고 스포티파이 및 주요 음반사들의 대응이 어디까지 확산될지는 향후 AI와 콘텐츠 산업의 관계를 가늠하는 중요한 시험대가 될 전망입니다.


※ 기사 내용 참조

[Ars Technica] World’s largest shadow library made a 300TB copy of Spotify’s most streamed songs | by Ashley Belanger | 4:34 AM on December 23, 2025 | https://arstechnica.com/tech-policy/2025/12/worlds-largest-shadow-library-brags-it-scraped-300tb-of-spotify-music-metadata/

[Billboard] Spotify Music Library Scraped by Pirate Activist Group

The scrape allegedly accessed 86 million audio files. | By Mitchell Peters | 12/21/2025 | https://www.billboard.com/business/streaming/spotify-music-library-leak-1236143970/

[Anna’s Blog] Backing up Spotify | 2025-12-20 | https://annas-archive.li/blog/backing-up-spotify.html


 

https://pf.kakao.com/_UCxoxnT

 

웨어러블서치

기술이 어디를 향하고 개인과 사회에 어떤 영향을 미치는지 연구합니다.

pf.kakao.com

 

 
728x90
반응형

관련글 더보기

댓글 영역