
아동 인신매매 및 성적 학대 혐의로 체포되어 옥중 사망한 제프리 앱스타인(Jeffrey Epstein) 수사 관련 데이터, 이른바 앱스타인 파일(Epstein File)이 2025년 12월부터 2026년 1월 말에 걸쳐 대량 공개되며 전 세계를 뒤흔드는 대형 스캔들로 번지고 있다. 이 앱스타인 파일을 클로드 오퍼스 4.6과 패스터 위스퍼(faster-whisper)로 구조화해 분석한 과학 분석 라이브러리 앱스타인 리서치(Epstein-research)가 공개됐다.
앱스타인 리서치는 미국 법무부(DOJ)가 공개한 제프리 앱스타인 수사 관련 218GB에 달하는 방대한 데이터셋을 기반으로 165개 이상 포렌식 분석 리포트를 정리한 라이브러리다.
AI 분석 기법으로는 텍스트 분석에 클로드 오퍼스 4.6이 채택됐으며 검색 가능한 데이터베이스를 구축한 뒤 전체 문서를 정밀 검토했다. 모든 페이지에 대해 전문 추출과 FTS5 인덱싱이 실시됐고 258만 건 이상 수정 기록 분석과 1,614명에 이르는 인물 등록부 작성이 이뤄졌다. 음성 및 영상 전사에는 패스터 위스퍼 라지-v3(faster-whisper large-v3)가 활용됐으며 GPU(A100)를 사용해 1,628개 항목이 처리됐다.
분석 대상 데이터에는 277만 페이지 이상 138만 건 문서와 함께 영상, 음성, 스프레드시트 등 비 PDF 파일 3,864건이 포함됐다. 분석 결과 7억 5,500만 달러를 초과하는 자금 흐름이 추적됐으며 95개 이상 유령 회사 존재와 수사 단계에서의 실패 등이 밝혀졌다.
앱스타인 리서치에는 이용자가 자신의 환경에 데스크톱 버전 또는 CLI 버전을 설치할 수 있는 클로드 기반 앱스타인 인베스티게이터(Claude-powered Epstein Investigator)라는 설정이 마련되어 있다. 데이터베이스 구축에 사용된 36개 이상 파이썬 도구 등 처리 스크립트도 공개됐으며 모든 분석은 클라우드를 거치지 않고 로컬 환경에서 실행되는 구조다.
리포트 내 사실적 주장은 모두 고유 EFTA 번호와 연결되어 있으며 링크를 통해 법무부가 공개한 원문 PDF를 직접 확인할 수 있는 투명성이 확보됐다.
앱스타인 리서치를 공개한 코네티컷 대학 계산과학자 라이 하워드 스톤(Rai Howard Stone)은 자신을 탐사 저널리스트가 아닌 데이터 과학자로 규정하며 내용이 인간에 의한 독립적 검증을 거치지 않은 만큼 무비판적으로 수용하지 말고 신중하게 다룰 걸 당부했다.
또 데이터셋에 충격적인 내용이 포함된 만큼 이차적 PTSD 위험과 정기적인 휴식 필요성이 강하게 경고됐으며 열람은 만 18세 이상 성인으로 제한됐다. 아울러 법무부에 의한 문서 변조 가능성과 FBI 기기에서 추출된 데이터 57%가 공개 데이터에 포함되지 않는 등 비정상적인 누락이 감지된 점도 언급됐으며 제공되는 정보는 법적 조언이나 정부 기관 공식 견해가 아니라는 게 명시됐다. 관련 내용은 이곳에서 확인할 수 있다.
![[DailyRecipe] 생활 밀접 AI 개발…11개 부처 지원 분야 체크리스트](https://startuprecipe.co.kr/wp-content/uploads/2026/03/260318_ax_ai_50023050525-75x75.jpg)
![[DailyRecipe] 올해 서울시 창업허브 지원사업…핵심만 추려봤다](https://startuprecipe.co.kr/wp-content/uploads/2026/03/20260319-SEOULSTARTUPHUB-350x250.jpg)
