베이징, 9월19일 (로이터) - 중국의 인공지능(AI) 개발업체 딥시크는 자사의 AI 모델인 R1의 훈련에 29만4000달러를 지출했다고 밝혔는데, 이는 미국 경쟁업체들이 보고한 수치보다 훨씬 낮은 수준으로 AI 개발 경쟁에서 중국의 입지를 둘러싼 논쟁을 재점화할 것으로 보인다.
항저우에 본사를 둔 딥시크가 처음으로 공개한 R1의 훈련 비용 추정치는 수요일에 발행된 학술지 네이처의 피어리뷰 기사에 등장했다.
딥시크가 1월에 저가형 AI 시스템을 출시하자 글로벌 투자자들은 새로운 모델이 엔비디아( NVDA.O)를 비롯한 AI 선도업체의 지배력을 위협할 수 있다는 우려로 기술주를 처분했었다.
그 후 딥시크와 설립자 량원펑은 몇 가지 신제품 업데이트를 발표한 것을 제외하고는 대중의 시야에서 거의 사라졌다.
량원펑을 공동 저자 중 한 명으로 소개한 네이처 기사에 따르면 딥시크의 추론 중심 R1 모델은 훈련 비용이 29만 4,000달러가 소요됐으며 512개의 엔비디아 H800 칩을 사용했다고 밝혔다. 1월에 게시된 기사에는 이 정보가 포함되어 있지 않았다.
미국 AI 대기업 오픈AI의 샘 알트먼 CEO는 2023년 기본 모델 훈련에 1억 달러가 넘는 비용이 들었다고 말했지만, 구체적인 수치는 밝히지 않았다.
딥시크의 개발 비용과 사용된 기술에 대한 일부 발언에 대해 미국 기업과 관계자들은 의문을 제기하고 있다.
딥시크가 언급한 H800 칩은 엔비디아가 2022년 10월 미국이 더 강력한 H100 및 A100 AI 칩을 중국에 수출하는 것을 불법화한 이후 중국 시장을 위해 설계한 칩이다.
미국 관리들은 지난 6월 딥시크가 미국의 수출 규제가 시행된 후 조달한 "대량의" H100 칩에 접근할 수 있다고 로이터에 밝혔다. 당시 엔비디아는 딥시크가 H100이 아닌 합법적으로 획득한 H800 칩을 사용했다고 로이터에 밝혔다.
네이처 기사에 첨부된 보충 정보에서 딥시크는 처음으로 A100 칩을 보유하고 있음을 인정하고 개발 준비 단계에 사용했다고 밝혔다.
연구원들은 "딥시크-R1에 대한 연구와 관련하여 우리는 더 작은 모델로 실험을 준비하기 위해 A100 GPU를 활용했다"고 썼다. 이 초기 단계가 끝난 후 R1은 512개의 H800 칩으로 구성된 클러스터로 총 80시간 동안 훈련되었다고 덧붙였다.
로이터는 과거 딥시크가 중국에서 가장 뛰어난 인재를 유치할 수 있었던 이유 중 하나가 A100 슈퍼컴퓨팅 클러스터를 운영하는 몇 안 되는 국내 기업 중 하나이기 때문이라고 보도한 바 있다.
* 원문기사 nL2N3V600S