x

이메일로 만나보는 스타트업 가이드

투자, 행사, 정부사업 등 스타트업 생태계 소식을 이메일로 편하게 받아보세요.

소셜 커뮤니티인 레딧(Reddit)이 구글 검색 결과에 표시된 레딧 콘텐츠를 스크래핑해 데이터를 불법으로 훔쳤다며 AI 기업 퍼플렉시티(Perplexity) 등 4개 기업을 상대로 소송을 제기했다. 레딧은 지난 6월 AI 클로드 개발사인 앤트로픽을 제소한 바 있다.

레딧이 소송을 제기한 대상은 퍼플렉시티 외에 텍사스주 오스틴에 본사를 둔 SerpApi, 리투아니아에 본사를 둔 Oxylabs, 러시아에 본사를 둔 AWMProxy다.

레딧은 2023년부터 게시된 콘텐츠에 접근해 AI 훈련에 활용하려는 기업으로부터 대가를 받아 수익을 올리는 비즈니스를 시작했으며 구글과 오픈AI와 라이선스 계약을 체결했다. 구글의 경우 라이선스 비용은 연간 6,000만 달러로 알려졌다.

구글 검색 결과에 표시된 레딧 콘텐츠를 이용해 이런 라이선스 비용 지불을 회피했다며 레딧은 4개 기업을 상대로 금전적 손해배상과 과거에 스크래핑한 래딧 콘텐츠를 훈련용 데이터로 판매하는 걸 금지하는 영구적 금지 명령을 요구하고 있다.

제소된 기업 중 퍼플렉시티는 라이선스 비용을 지불하지 않은 콘텐츠를 훈련용으로 유용한 사실이 이미 밝혀진 바 있으며 스크래핑을 방지하기 위해 웹사이트가 마련한 robots.txt를 무시하고 있다는 지적도 받았다. 지적을 받았을 당시 아라빈드 스리니바스(Aravind Srinivas) CEO는 자사 크롤러로 무시하고 있는 건 아니지만 제3자 크롤러에도 의존하고 있다고 해명했다.

레딧에 따르면 퍼플렉시티에게 이미 스크래핑을 중단하도록 요청했지만 구글 검색에서의 크롤링 외에는 접근 불가능한 테스트 게시물을 작성해 퍼플렉시티가 스크래핑을 계속하고 있음을 확인했다고 한다.

소송에 대해 SerpApi, Oxylabs, AWMProxy는 논평하지 않았다. 퍼플렉시티는 아직 소장을 받지 못했지만 자사는 공공 지식에 자유롭고 공정하게 접근하는 사용자 권리를 위해 항상 강력히 싸워나갈 것이라면서 자사 접근 방식은 정확한 AI를 통해 사실 기반 답변을 제공하는 것이며 원칙적이고 책임감 있는 것으로 변함이 없으며 개방성과 통상에 대한 위협을 용인하지 않을 것이라고 논평했다. 관련 내용은 이곳에서 확인할 수 있다.

뉴스 레터 구독하기

Related Posts

No Content Available
Next Post