|
월스트리트저널(WSJ) 등은 챗GPT 개발사 오픈AI의 데이터가 딥시크와 관련된 그룹에 의해 허가 없이 무단으로 획득됐는지에 대해 오픈AI와 마이크로소프트(MS)가 조사하고 있다고 소식통을 인용해 29일(현지시간) 보도했다.
WSJ에 따르면 오픈AI 대변인은 "딥시크가 오픈AI에서 대량의 데이터를 빼내 자체 기술 개발에 활용했을 가능성을 검토하고 있다"며, 이 과정에서 '증류(distillation)'라는 기법이 사용됐을 가능성을 배제할 수 없다고 밝혔다.
증류는 AI 모델이 다른 모델의 출력 결과를 훈련 목적으로 사용, 유사한 기능을 개발하는 것을 의미한다.
오픈AI는 자사의 모델을 증류하려 한다고 의심되는 계정을 금지했으며, 자사의 주요 파트너인 MS와 협력해 이런 시도의 배후에 있는 주체를 파악했다고 설명했다.
오픈AI는 딥시크에 대한 구체적인 조치를 공개하지는 않았지만, "우리의 기술을 보호하기 위해 적극적이고 선제적인 대응을 하고 있으며, 미국 정부와 긴밀히 협력해 최첨단 모델의 보안을 강화할 것"이라고 강조했다.
이번 조사로 인해 딥시크의 AI 모델 성능이 당초 예상보다 낮을 가능성이 제기되고 있다.
딥시크의 AI 모델 R1이 세계적인 AI 모델들과 견줄 만한 성능을 보인다는 평가를 받았지만, 이 과정에서 오픈AI의 데이터를 활용한 것으로 드러날 경우 성능에 대한 신뢰성이 흔들릴 수 있기 때문이다.
이와 함께 AI 모델 개발에 수억 달러를 투자하는 기업들이 경쟁사의 무단 복제를 효과적으로 차단할 수 있을지에 대한 우려도 커지고 있다.
앞서 지난 28일 도널드 트럼프 행정부의 AI·가상화폐 정책을 총괄하는 차르로 임명된 데이비드 색스는 "딥시크가 오픈AI 모델을 증류해 자사 AI를 구축했다는 상당한 증거가 있다"고 주장했다.