Deepseek 빌드에 대한 생각에 대해 Liang Wenfeng과 나눈 드문 인터뷰

"메기" 량원펑(梁文锋 Liang Wenfeng): 왼손은 환팡퀀트(幻方量化), 오른손은 딥시크(DeepSeek)

지난해 온라인에서는 중국에서 고성능 GPU를 가장 많이 보유한 기관이 인공지능 회사가 아닌 한 양적 펀드(퀀트 펀드)라는 소문이 돌았습니다. 바로 양적 펀드 업계 4대 기업 중 하나인 환팡퀀트(幻方量化)였죠.

창립자 량원펑(Liang Wenfeng)은 최근 몇 년간 여러 AI 회사에 투자를 주도해왔습니다. 그가 직접 설립한 딥시크(DeepSeek)는 실리콘밸리에서 "동방에서 온 신비한 힘"으로 불리며, AI 업계에서 주목받고 있습니다. 딥시크의 등장으로 바이트댄스(ByteDance), 텐센트(Tencent), 바이두(Baidu), 알리바바(Alibaba) 등 대기업들의 대형 AI 모델 가격이 인하되는 현상까지 일어났습니다.

온라인에서조차 사진을 거의 찾아볼 수 없는 이 수학 모델링 애호가는 기술적 이상주의를 품고 있습니다. 그는 "API든 AI든, 모두가 누릴 수 있고 누구나 사용할 수 있어야 한다"고 말합니다.

몇 년 전, 한 매체는 그와 양적 투자에 대해 두 차례 인터뷰를 나눈 적이 있습니다. 당시 환팡퀀트의 규모는 50억 위안도 되지 않았지만 빠르게 성장하고 있었죠. 그때 그가 가장 하고 싶었던 일을 묻자, 그는 잠시 생각한 뒤 "일반 투자자들도 사용할 수 있는 오픈 소스 전략 플랫폼을 만들고 싶다"고 답했습니다.

이번 인터뷰에서 량원펑은 사용자 확보를 위한 가격 경쟁에 뛰어든 것이 아니라고 부인했습니다. 그는 "우리의 원칙은 적자 보전을 하지도 않고, 과도한 이익을 추구하지도 않는 것이다. 이 가격은 원가를 기준으로 약간의 이윤을 남기는 수준"이라고 말했습니다.

국내 AI 탐구 과정에서 하부 구조에 관심을 갖는 사람은 적고, 응용 계층에 초점을 맞추는 경우가 많습니다. 후자가 상업화하기 더 쉽기 때문이죠. 엄청난 노력을 들여 하부 최적화를 하는 사례는 드물기 때문에 딥시크는 특히 특별한 존재로 보입니다.

량원펑은 《시몬스 전기》의 서문에서 "많은 신기술과 마찬가지로, 양적 투자도 처음 등장했을 때는 조롱의 대상이었다. 컴퓨터가 인간처럼 투자를 할 수 있다고 믿는 사람은 아무도 없었다"고 썼습니다.

2015년 이후, 국내 양적 투자는 빠르게 성장했습니다. 2015년 6월, 환팡퀀트가 설립되었죠. 환팡퀀트는 구장자산(九章资产)과 닝보 환팡퀀트(宁波幻方量化)로 구성됩니다. 창립 팀은 2008년부터 양적 헤지 분야 연구를 시작했으며, 2015년 10월 첫 번째 사모펀드 상품을 출시했습니다.

이후 규모가 빠르게 확장되어 2016년 말에는 관리 규모가 10억 위안을 넘었고, 2017년에는 30억 위안, 2018년에는 60억 위안에 달했습니다. 적어도 2019년 중반에는 규모가 100억 위안을 넘어섰죠. 이후 국내 양적 펀드 업계 "4대 기업" 중 하나로 자리 잡았습니다.

회사에는 기본적 연구 팀뿐만 아니라 인공지능 팀도 있습니다. 2016년 처음 AI 전략을 도입한 후, 2017년 말에는 투자 전략이 완전히 AI화되었습니다.

현재까지 중국의 대형 AI 모델 스타트업 7개 중 딥시크는 유일하게 To C(소비자 대상) 애플리케이션을 만들지 않고 오픈 소스 경로를 선택한 회사입니다. 또한 아직까지 투자 유치를 하지 않았죠.

저장대학교 소프트웨어 공학 출신인 량원펑은 국내 최고 대학 출신의 신입 졸업생들과 몇 명의 박사 과정 인턴들로 구성된 팀을 이끌고 있습니다. 어떻게 딥시크가 AI 대형 모델 업계의 "메기"가 될 수 있었을까요?

"암흑의 물결(Waves)"은 딥시크 구축 배경에 대한 고민과 량원펑의 이번 인터뷰를 소개하며, 이 흔치 않은 이야기를 공유합니다.

"다크 웨이브"는 스마트한 투자자(ID: Capital-nature)가 여러분과 공유한 딥시크 빌드에 대한 생각에 대해 Liang Wenfeng과 나눈 드문 인터뷰입니다.

**가격 전쟁의 첫 번째 발포는 어떻게 시작되었나?**

DeepSeek V2 모델 출시 후, 대형 AI 모델 시장에서 치열한 가격 경쟁이 벌어졌습니다. 어떤 이들은 딥시크를 업계의 "메기"라고 불렀습니다.

**량원펑(Liang Wenfeng):** 우리는 의도적으로 메기가 되려 한 것이 아니에요. 어쩌다 보니 메기가 되어버렸을 뿐입니다.

**이 결과가 예상 밖이었나요?**

**량원펑:** 매우 놀라웠어요. 가격이 사람들에게 그렇게 민감한 문제가 될 줄은 몰랐습니다. 우리는 그저 우리의 페이스대로 일을 진행했고, 원가를 계산해 가격을 책정했을 뿐이에요. 우리의 원칙은 적자를 보전하지도 않고, 과도한 이익을 추구하지도 않는 것입니다. 이 가격은 원가를 기준으로 약간의 이윤을 남기는 수준입니다.

**5일 후, Zhipu AI가 가격 인하에 동참했고, 이후 바이트댄스(ByteDance), 알리바바(Alibaba), 바이두(Baidu), 텐센트(Tencent) 등 대기업들도 따라갔습니다.**

**량원펑:** Zhipu AI가 인하한 것은 입문용 제품이었고, 우리와 동급의 모델은 여전히 비싸게 팔리고 있었어요. 바이트댄스가 진정한 첫 번째 후발 주자였죠. 그들이 플래그십 모델을 우리와 같은 가격으로 내리자, 다른 대기업들도 줄줄이 가격을 인하했습니다.

대기업들의 모델 원가가 우리보다 훨씬 높기 때문에, 누군가가 적자를 감수하면서까지 이런 일을 할 줄은 몰랐어요. 결국 이는 인터넷 시대의 "돈을 태우며 시장을 점유하는" 논리로 이어졌습니다.

**외부에서는 가격 인하가 사용자 확보를 위한 전략으로 보입니다. 인터넷 시대의 가격 전쟁은 보통 그렇게 진행되죠.**
**량원펑:** 사용자 확보가 우리의 주요 목적은 아니에요.

우리가 가격을 인하한 이유는 한편으로는 차세대 모델 구조를 탐구하는 과정에서 원가가 먼저 낮아졌기 때문이고, 다른 한편으로는 API든 AI든 모두가 누릴 수 있고 누구나 사용할 수 있어야 한다고 믿기 때문입니다.

**이전에는 대부분의 중국 기업들이 Llama 구조를 그대로 복사해 애플리케이션을 만들었는데, 왜 딥시크는 모델 구조부터 접근했나요?**

**량원펑:** 만약 목표가 애플리케이션을 만드는 것이라면, Llama 구조를沿用해 빠르게 제품을 출시하는 것도 합리적인 선택이에요.

하지만 우리의 목표는 AGI(일반 인공지능)입니다. 이는 새로운 모델 구조를 연구하고, 한정된 자원으로 더 강력한 모델 성능을 구현해야 함을 의미하죠. 이는 더 큰 모델로 확장하기 위해 필요한 기초 연구 중 하나입니다. 모델 구조 외에도, 우리는 데이터를 어떻게 구성할지, 모델을 어떻게 더 인간처럼 만들지 등 다양한 연구를 진행했고, 이는 우리가 출시한 모델에 반영되었습니다. 또한, Llama 구조는 훈련 효율성과 추론 비용 측면에서 이미 해외 최신 기술과 2세대 정도의 격차가 있는 것으로 추정됩니다.

**이런 격차는 주로 어디에서 오는 건가요?**

**량원펑:** 먼저, 훈련 효율성에서 차이가 있습니다. 우리의 추정으로는, 국내 최고 수준과 해외 최고 수준을 비교했을 때, 모델 구조와 훈련 역학 측면에서 약 2배의 격차가 있습니다. 이 점만 보더라도, 우리는 동일한 효과를 내기 위해 2배의 연산 자원을 소모해야 해요.

또한, 데이터 효율성에서도 약 2배의 격차가 있을 수 있습니다. 즉, 동일한 효과를 내기 위해 우리는 2배의 훈련 데이터와 연산 자원을 소모해야 한다는 뜻이죠. 이를 합치면 4배의 연산 자원이 더 필요합니다. 우리가 해야 할 일은 이러한 격차를 계속 좁혀나가는 것입니다.

**대부분의 중국 기업들은 모델과 애플리케이션을 모두 추구하는데, 왜 딥시크는 현재 연구와 탐구에만 집중하나요?**

**량원펑:** 우리는 지금 가장 중요한 것이 글로벌 혁신의 물결에 참여하는 것이라고 생각합니다. 지난 몇 년간, 중국 기업들은 다른 사람들이 기술 혁신을 하고, 우리는 그것을 가져와 애플리케이션으로 수익을 내는 데 익숙해졌어요. 하지만 이는 당연한 것이 아닙니다.

이번 혁신 물결에서 우리의 출발점은 기회를 틈타 돈을 버는 것이 아니라, 기술의 최전선에 서서 전체 생태계를 발전시키는 것입니다.

**인터넷과 모바일 인터넷 시대는 대부분의 사람들에게 미국은 기술 혁신을, 중국은 애플리케이션 구현을 잘한다는 인식을 남겼습니다.**
**량원펑:** 우리는 경제 발전에 따라 중국도 점차 기여자의 역할을 해야 한다고 생각합니다. 계속해서 편승만 해서는 안 되죠.

지난 30여 년간의 IT 혁명에서 우리는 진정한 기술 혁신에 참여하지 못했습니다. 우리는 무어의 법칙이 하늘에서 뚝 떨어지고, 집에 앉아서 18개월만 기다리면 더 나은 하드웨어와 소프트웨어가 나올 것이라고 생각해왔어요.

Scaling Law도 마찬가지로 대접받고 있습니다. 하지만 이는 서양이 주도하는 기술 커뮤니티가 대를 이어가며 끊임없이 창조해낸 결과물입니다. 우리가 이 과정에 참여하지 않았기 때문에 그 존재를 간과했을 뿐이죠.

**진정한 격차는 1~2년이 아니라, 원창(原創)과 모방의 차이입니다.**

**왜 DeepSeek V2가 실리콘밸리의 많은 사람들을 놀라게 했나요?**

**량원펑(Liang Wenfeng):** 미국에서는 매일 수많은 혁신이 일어납니다. 그런 면에서 보면 이는 매우 평범한 일이에요. 그들이 놀라는 이유는, 이번에 중국 기업이 혁신의 기여자로서 그들의 게임에 참여했기 때문입니다. 대부분의 중국 기업들은 모방(follow)에 익숙하지, 혁신을 주도하는 경우는 드물죠.

하지만 이런 선택은 중국의 맥락에서 보면 너무나도 사치스러워 보입니다. 대형 AI 모델은 엄청난 투자가 필요한 게임입니다. 모든 회사가 상업화를 고려하지 않고 오직 연구와 혁신만을 추구할 자본을 가지고 있지는 않아요.

**량원펑:** 혁신의 비용은 분명히 높습니다. 과거의 '가져오기 주의' 관성은 당시의 국정과도 관련이 있었죠. 하지만 지금은, 중국의 경제 규모나 바이트댄스(ByteDance), 텐센트(Tencent) 같은 대기업들의 이익을 보면, 전 세계적으로도 결코 낮은 수준이 아닙니다.

우리에게 혁신에 부족한 것은 자본이 아니라, 자신감과 고밀도 인재를 조직화해 효과적인 혁신을 이루는 방법입니다.

**왜 중국 기업들—자금이 충분한 대기업들조차—빠른 상업화를 최우선으로 여기나요?**

**량원펑:** 지난 30년간, 우리는 오직 돈을 버는 것만 강조해왔고, 혁신은 소홀히 했습니다. 혁신은 단순히 상업적 동기에만 driven되지 않아요. 호기심과 창조 욕구도 필요합니다. 우리는 과거의 관성에 묶여 있을 뿐이지만, 이는 일종의 단계적 현상이기도 합니다.

**하지만 당신들은 상업 조직이지, 공공 연구 기관이 아닙니다. 혁신을 선택하고, 오픈소스로 공유한다면, 어디에서 경쟁력을 유지할 건가요? 5월의 MLA 아키텍처 혁신도 다른 회사들이 금방 복제하지 않을까요?**

**량원펑:** 파괴적인 기술 앞에서, 폐쇄적 시스템으로 형성된 경쟁력은 일시적입니다. OpenAI가 폐쇄적이라 해도, 다른 이들이 따라잡는 것을 막을 수는 없어요. 그래서 우리는 가치를 팀에 쌓아두고 있습니다. 우리의 동료들이 이 과정에서 성장하고, 많은 노하우를 축적하며, 혁신할 수 있는 조직과 문화를 형성하는 것이 바로 우리의 경쟁력입니다.

오픈소스와 논문 발표는 사실 잃는 것이 없습니다. 기술자들에게, 다른 이들이 따라하는 것은 매우 성취감 있는 일이에요. 사실, 오픈소스는 상업적 행위라기보다 문화적 행위에 가깝습니다. 주는 것은 일종의 추가적인 영예입니다. 한 회사가 이런 행동을 하면 문화적 매력도 생기죠.

**주소호(朱嘯虎) 같은 시장 신봉파의 관점을 어떻게 보나요?**

**량원펑:** 주소호는 자기 논리에 맞는 사람입니다. 하지만 그의 전략은 빠르게 돈을 버는 회사에 더 적합해요. 반면 미국에서 가장 수익성이 높은 회사들은 오랜 시간 축적된 기술력을 바탕으로 성장한 하이테크 기업들입니다.

**하지만 대형 AI 모델을 만들 때, 단순히 기술적 우위만으로는 절대적인 경쟁력을 형성하기 어렵습니다. 당신들이 기대하는 더 큰 것은 무엇인가요?**

**량원펑:** 우리가 보는 것은 중국 AI가 영원히 추종자의 위치에 머물 수 없다는 점입니다. 우리는 종종 중국 AI와 미국의 격차가 1~2년이라고 말하지만, 진정한 격차는 원창과 모방의 차이입니다. 이것이 바뀌지 않는다면, 중국은 영원히 추종자일 수밖에 없어요. 그래서 어떤 탐구는 피할 수 없는 것입니다.

**OpenAI의 선두 주자는 단순히 한 회사의 노력이 아니라, 서양 기술 커뮤니티와 산업 전체의 협력 결과입니다. 그들은 차세대 기술 트렌드를 보고, 로드맵을 가지고 있습니다. 중국 AI의 발전도 이런 생태계가 필요합니다.**

**많은 국산 칩이 발전하지 못하는 이유도, 이를 지원할 기술 커뮤니티가 부족하고, 제2의 정보만을 의존하기 때문입니다. 그래서 중국은 누군가가 기술의 최전선에 서야 합니다.**

**더 많은 투자가 반드시 더 많은 혁신을 만들어내는 것은 아닙니다.**

현재 DeepSeek은 초기 OpenAI의 이상주의적 분위기를 풍기며, 오픈소스로 운영되고 있습니다. 앞으로 폐쇄적 시스템으로 전환할 계획이 있나요? OpenAI와 Mistral 모두 오픈소스에서 폐쇄적 시스템으로 전환한 경험이 있습니다.

**량원펑(Liang Wenfeng):** 우리는 폐쇄적 시스템으로 전환하지 않을 것입니다. 우리는 먼저 강력한 기술 생태계를 구축하는 것이 더 중요하다고 생각합니다.

**자금 조달 계획이 있나요? 일부 언론 보도에 따르면, 환팡퀀트(幻方量化)가 DeepSeek을 독립적으로 분할 상장할 계획이 있다고 하는데, 실리콘밸리의 AI 스타트업들도 결국 대기업과의 협력이 불가피한 것으로 보입니다.**

**량원펑:** 단기적으로는 자금 조달 계획이 없습니다. 우리가 직면한 문제는 돈이 아니라, 고급 칩의 수출 금지입니다.

**많은 사람들이 AGI(일반 인공지능)를 만드는 것과 양적 투자를 하는 것은 완전히 다른 일이라고 생각합니다. 양적 투자는 조용히 진행할 수 있지만, AGI는 더 큰 목소리를 내고, 동맹을 맺어야 할 수도 있습니다. 이는 투자를 더 크게 만드는 방법이죠.**

**량원펑:** 더 많은 투자가 반드시 더 많은 혁신을 만들어내는 것은 아닙니다. 그렇지 않다면 대기업들이 모든 혁신을 독점했을 겁니다.

**현재 애플리케이션을 만들지 않는 이유는 운영에 대한 유전적 소질이 없기 때문인가요?**

**량원펑:** 우리는 현재가 기술 혁신의 폭발기라고 생각합니다. 애플리케이션의 폭발기는 아니죠.

장기적으로, 우리는 업계가 우리의 기술과 산출물을 직접 사용하는 생태계를 형성하고 싶습니다. 우리는 기본 모델과 최전선의 혁신에만 집중하고, 다른 회사들이 DeepSeek을 기반으로 ToB(기업용), ToC(소비자용) 비즈니스를 구축하도록 하는 것이죠. 완전한 산업 생태계가 형성된다면, 우리가 직접 애플리케이션을 만들 필요는 없습니다.

물론 필요하다면, 우리도 애플리케이션을 만드는 데 문제는 없지만, 연구와 기술 혁신은 항상 우리의 최우선 순위입니다.

**하지만 API를 선택한다면, 왜 대기업이 아니라 DeepSeek을 선택해야 하나요?**

**량원펑:** 미래의 세계는 전문적인 분업화가 될 가능성이 높습니다. 기본 대형 모델은 지속적인 혁신이 필요하고, 대기업은 그들의 능력 한계가 있어서 반드시 적합한 것은 아닙니다.

**하지만 기술이 정말로 격차를 벌릴 수 있나요? 당신도 절대적인 기술 비밀은 없다고 말한 적이 있습니다.**

**량원펑:** 기술에는 비밀이 없지만, 재구성에는 시간과 비용이 듭니다. NVIDIA의 그래픽 카드는 이론적으로는 어떤 기술 비밀도 없고, 쉽게 복제할 수 있습니다. 하지만 팀을 재구성하고 차세대 기술을 따라잡는 데는 시간이 필요합니다. 그래서 실제 경쟁력은 여전히 큽니다.

**당신들이 가격을 인하하자, 바이트댄스(ByteDance)가 먼저 따라갔습니다. 이는 그들이 어떤 위협을 느꼈기 때문일까요? 스타트업과 대기업 간의 경쟁에 대한 새로운 해결책을 어떻게 보나요?**

**량원펑:** 솔직히 우리는 그다지 신경 쓰지 않습니다. 그저 우연히 그렇게 했을 뿐이죠. 클라우드 서비스를 제공하는 것이 우리의 주요 목표는 아닙니다. 우리의 목표는 여전히 AGI를 실현하는 것입니다.

현재로서는 새로운 해결책을 보지 못했지만, 대기업도 확실한 우위를 점하고 있지는 않습니다. 대기업은 기존 사용자를 보유하고 있지만, 그들의 현금 흐름 사업은 동시에 그들의 발목을 잡는 짐이 되기도 합니다. 그들은 언제든지 뒤집힐 수 있는 대상이죠.

**DeepSeek을 제외한 다른 6개의 대형 모델 스타트업의 최종 결과를 어떻게 보나요?**

**량원펑:** 아마 2~3개 정도가 살아남을 겁니다. 현재는 모두 돈을 태우는 단계이기 때문에, 자기 위치를 명확히 하고 더 세밀하게 운영할 수 있는 회사들이 살아남을 가능성이 높습니다. 다른 회사들은 탈바꿈할 수도 있습니다. 가치 있는 것은 사라지지 않지만, 다른 형태로 존재할 것입니다.

**환팡퀀트 시대에도, 경쟁에 대한 당신의 자세는 "내 방식대로 한다"는 평가를 받았습니다. 수평적 비교에는 거의 관심을 두지 않았죠. 경쟁에 대해 생각하는 근본적인 원점은 무엇인가요?**

**량원펑:** 저는 종종 어떤 것이 사회의 운영 효율을 높일 수 있는지, 그리고 그 산업 분업 체인에서 자신이 잘할 수 있는 위치를 찾을 수 있는지 생각합니다.

최종 결과가 사회의 효율을 높이는 것이라면, 그것은 성립합니다. 중간 과정은 대부분 단계적이며, 지나치게 신경 쓰면 눈이 어지러워질 뿐입니다.

**"고상하고 이해하기 어려운 일"을 하는 젊은이들**

OpenAI의 전 정책 책임자이자 Anthropic의 공동 창립자인 Jack Clark은 DeepSeek이 "이해하기 어려운 괴짜들"을 고용했다고 평가했습니다. DeepSeek V2를 만든 이들은 어떤 사람들인가요?

**량원펑(Liang Wenfeng):** 이해하기 어려운 괴짜들은 없습니다. 모두 국내 최고 대학의 신입 졸업생들, 아직 졸업하지 않은 박사 과정 4~5년 차 인턴들, 그리고 졸업한 지 몇 년 안 된 젊은이들입니다.

많은 대형 모델 회사들이 해외에서 인재를 영입하려고 애쓰는데, 많은 사람들이 이 분야에서 상위 50위 안에 드는 인재들은 중국 회사에 없을 것이라고 생각합니다. 당신들의 인재들은 어디에서 왔나요?

**량원펑:** V2 모델에는 해외에서 돌아온 사람은 없습니다. 모두 국내 인재들입니다. 상위 50위 안에 드는 인재들은 중국에 없을지 모르지만, 우리가 그런 인재를 직접 키울 수도 있습니다.

**이번 MLA 혁신은 어떻게 발생했나요? 아이디어가 처음에는 한 젊은 연구원의 개인적 관심에서 시작되었다고 들었습니다.**

**량원펑:** Attention 아키텍처의 주요 변화 규칙을 정리한 후, 그는 대체 방안을 설계하는 아이디어를 떠올렸습니다. 하지만 아이디어에서 실제 구현까지는 긴 과정이 필요했습니다. 이를 위해 우리는 팀을 꾸렸고, 몇 달이 걸려서야 실행에 옮겼습니다.

**이런 발산적 아이디어의 탄생은 당신들의 완전히 혁신적인 조직 구조와 관련이 깊어 보입니다. 환팡퀀트(幻方量化) 시절에도 당신들은 상향식으로 목표나 업무를 할당하는 경우가 거의 없었죠. 하지만 AGI와 같이 불확실성이 큰 최전선 탐구에서는 관리적 접근이 더 필요하지 않나요?**

**량원펑:** DeepSeek도 전적으로 하향식입니다. 그리고 우리는 일반적으로 사전에 업무를 분담하지 않고, 자연스럽게 분업이 이루어지도록 합니다. 각자 독특한 성장 경험을 가지고 있고, 모두 자신만의 아이디어를 가지고 있기 때문에 누군가를 강제로 밀어붙일 필요는 없습니다.

탐구 과정에서 문제가 발생하면, 그들은 스스로 사람들을 모아 토론을 시작합니다. 하지만 아이디어가 잠재력을 보이면, 우리는 상향식으로 자원을 배분하기도 합니다.

**DeepSeek은 GPU(그래픽 카드)와 인력 배치에 매우 유연하다고 들었습니다.**

**량원펑:** 우리는 GPU와 인력 배치에 대해 상한선을 두지 않습니다. 누구나 아이디어가 있다면, 언제든지 훈련 클러스터의 GPU를 승인 없이 사용할 수 있습니다. 또한 계층 구조나 부서 간 경계가 없기 때문에, 모든 인력을 유연하게 활용할 수 있습니다. 상대방도 관심이 있다면 말이죠.

**이런 느슨한 관리 방식은 당신들이 강한 열정을 가진 사람들을 잘 선별했기 때문에 가능한 것 같습니다. 당신들은 세부 사항에서 인재를 발굴하는 데 능숙하다고 들었는데, 전통적인 평가 기준에서는 눈에 띄지 않지만 우수한 사람들을 뽑아낸다고 합니다.**

**량원펑:** 우리의 인재 선발 기준은 항상 열정과 호기심이었습니다. 그래서 많은 사람들이 독특한 경험을 가지고 있고, 매우 흥미롭죠. 많은 이들이 연구를 하고 싶어 하는 열망이 돈에 대한 관심을 훨씬 뛰어넘습니다.

**Transformer는 Google의 AI Lab에서 탄생했고, ChatGPT는 OpenAI에서 탄생했습니다. 대기업의 AI Lab과 스타트업이 혁신을 만들어내는 데 있어서 어떤 차이가 있다고 생각하나요?**

**량원펑:** 실험실이든, OpenAI든, 심지어 중국 대기업의 AI Lab이든 모두 가치가 있습니다. 결국 OpenAI가 성공한 것은 역사적 우연성도 작용했습니다.

**혁신은 어느 정도 우연의 결과인가요? 당신들의 사무실 중앙 회의실 양쪽에는 자유롭게 열 수 있는 문이 있다고 들었습니다. 동료들은 이를 '우연을 위한 공간'이라고 말하더군요.**

**Transformer가 탄생할 때도, 우연히 지나가던 사람이 아이디어를 듣고 참여하면서 결국 범용 프레임워크로 발전한 이야기가 있습니다.**

**량원펑:** 저는 혁신이 우선 믿음의 문제라고 생각합니다. 왜 실리콘밸리가 그렇게 혁신적인가? 첫 번째는 용기입니다. ChatGPT가 나왔을 때, 중국 전체가 최전선 혁신에 대한 자신감이 부족했습니다. 투자자부터 대기업까지 모두 격차가 너무 크다고 생각했고, 애플리케이션에 집중하자고 했죠.

하지만 혁신은 우선 자신감이 필요합니다. 이런 자신감은 보통 젊은이들에게서 더 뚜렷하게 나타납니다.

**하지만 당신들은 자금 조달에 참여하지 않고, 외부에 발언도 거의 하지 않습니다. 사회적 영향력 측면에서 활발히 자금을 조달하는 회사들보다는 뒤처질 수밖에 없는데, 어떻게 DeepSeek이 대형 모델을 만드는 사람들의 첫 번째 선택이 될 수 있을까요?**

**량원펑:** 왜냐하면 우리는 가장 어려운 일을 하고 있기 때문입니다. 최고의 인재를 가장 끌어당기는 것은 세계에서 가장 어려운 문제를 해결하는 것입니다. 사실, 중국에서는 최고의 인재들이 과소평가되고 있습니다.

왜냐하면 사회 전반적으로 하드코어 혁신이 너무 적기 때문에, 그들이 인정받을 기회가 없습니다. 우리는 가장 어려운 일을 하고 있고, 그것이 그들에게 매력적입니다.

**최근 OpenAI의 발표에서 GPT-5가 나오지 않자, 많은 사람들이 기술 곡선이 분명히 느려지고 있다고 느끼고, Scaling Law에 대한 의문도 제기하고 있습니다. 당신들은 어떻게 보나요?**

**량원펑:** 우리는 낙관적입니다. 전체 업계가 예상대로 움직이고 있다고 봅니다. OpenAI도 신은 아니에요. 항상 앞서 나갈 수는 없습니다.

**AGI가 실현되기까지 얼마나 걸릴 것 같나요? DeepSeek V2를 발표하기 전에, 코드 생성과 수학 모델을 발표했고, dense 모델에서 MOE로 전환했습니다. 당신들의 AGI 로드맵에는 어떤 좌표들이 있나요?**

**량원펑:** 아마 2년, 5년, 혹은 10년이 걸릴 겁니다. 우리가 살아있는 동안에는 실현될 것입니다. 로드맵에 대해서는, 우리 회사 내부에서도 통일된 의견은 없습니다.

하지만 우리는 세 가지 방향에 베팅하고 있습니다. 첫 번째는 수학과 코드, 두 번째는 멀티모달, 세 번째는 자연어 그 자체입니다.

수학과 코드는 AGI의 자연스러운 실험장입니다. 바둑과 비슷하게, 닫힌 시스템이며 검증 가능한 시스템이기 때문에, 자기 학습을 통해 높은 지능을 달성할 가능성이 있습니다.

반면에, 멀티모달과 인간의 실제 세계에 참여하여 학습하는 것도 AGI에 필요할 수 있습니다. 우리는 모든 가능성에 열려 있습니다.

**대형 모델의 최종 형태는 어떻게 될 것 같나요?**

**량원펑:** 기본 모델과 기본 서비스를 제공하는 전문 회사들이 생길 것이고, 긴 분업 체인이 형성될 것입니다. 더 많은 사람들이 그 위에서 사회의 다양한 요구를 충족시키기 위해 노력할 것입니다.

**"모든 패턴은 이전 세대의 산물이다"**

지난 한 해 동안, 중국의 대형 모델 스타트업들은 많은 변화를 겪었습니다. 예를 들어, 작년 초반까지 활발히 활동하던 왕후이원(王慧文)이 중간에 물러났고, 이후 참여한 회사들도 차별화를 보이기 시작했습니다.

**량원펑(Liang Wenfeng):** 왕후이원은 모든 손실을 자신이 떠안았고, 다른 이들이 무사히 빠져나갈 수 있게 했습니다. 그는 자신에게 가장 불리하지만 모두에게 이로운 선택을 했습니다. 그래서 그는 매우 너그러운 사람이라고 생각합니다. 그 점에서 저는 그를 존경합니다.

**현재 당신의 가장 큰 관심사는 무엇인가요?**

**량원펑:** 주된 관심사는 차세대 대형 모델 연구에 있습니다. 아직 해결되지 않은 문제들이 많죠.

**다른 대형 모델 스타트업들은 기술과 제품을 모두 잡으려고 합니다. 기술이 영원한 우위를 가져다주지는 않기 때문에, 시간 창을 활용해 기술적 우위를 제품으로 연결하는 것도 중요합니다. DeepSeek이 모델 연구에 집중할 수 있는 이유는 모델 능력이 아직 부족하기 때문인가요?**

**량원펑:** 모든 패턴은 이전 세대의 산물입니다. 미래에는 그 패턴이 통하지 않을 수도 있습니다. 인터넷 시대의 비즈니스 논리로 미래 AI의 수익 모델을 논의하는 것은, 마화텅(马化腾)이 창업할 때 당신이 그와 같은 논의를 하는 것과 비슷합니다. 이는 마치 배가 지나간 자리에 칼로 표시를 해두는 것과 같을 수 있습니다.

**과거 환팡퀀트(幻方量化)는 강한 기술과 혁신 DNA를 가지고 있었고, 성장도 순조로웠습니다. 이것이 당신이 낙관적인 이유인가요?**

**량원펑:** 환팡퀀트는 어느 정도 기술 주도형 혁신에 대한 우리의 자신감을 높여주었지만, 항상 순탄한 길만 있었던 것은 아닙니다. 우리는 긴 축적 과정을 겪었습니다. 외부에서 보는 환팡퀀트는 2015년 이후의 모습이지만, 사실 우리는 16년 동안 이 일을 해왔습니다.

**원창(原創) 혁신에 대한 이야기로 돌아가보죠. 현재 경제가 하락세에 접어들고, 자본도 냉각기에 들어섰습니다. 이것이 원창 혁신을 더 억누르는 결과를 가져올까요?**

**량원펑:** 저는 그렇지 않을 것 같습니다. 중국의 산업 구조 조정은 하드코어 기술 혁신에 더 의존할 것입니다. 많은 사람들이 과거 빠르게 돈을 버는 것이 시대의 운에 불과했다는 것을 깨닫게 되면, 진정한 혁신에 더 몰두하게 될 것입니다.

**그래서 당신은 이 문제에 대해 낙관적인가요?**

**량원펑:** 저는 80년대에 광동(广东)의 한 작은 도시에서 자랐습니다. 제 아버지는 초등학교 교사였고, 90년대 광동에는 돈을 벌 기회가 많았습니다. 당시 많은 학부모들이 저희 집을 찾아왔고, 그들은 기본적으로 "공부는 쓸모없다"고 생각했습니다.

하지만 지금 돌아보면, 그런 생각들은 모두 변했습니다. 왜냐하면 돈을 버는 것이 더 어려워졌고, 택시를 운전할 기회조차 없어졌기 때문입니다. 한 세대만에 모든 것이 바뀌었습니다.

앞으로 하드코어 혁신은 점점 더 많아질 것입니다. 지금은 아직 이해하기 어려울 수 있지만, 이는 사회 전체가 사실을 통해 배워야 하기 때문입니다. 이 사회가 하드코어 혁신을 이루는 사람들에게 성공과 명예를 안겨준다면, 집단적 사고방식도 바뀔 것입니다. 우리는 단지 더 많은 사실과 시간이 필요할 뿐입니다. 기사 원문 참고.

**편집: 이나(伊娜)**
**감수: 아이쉰(艾暄)**

저작자표시 비영리 변경금지

'WebAnarchist' 카테고리의 다른 글

결국 손해를 보는 것은 책을 사랑하는 독자와 작가들입니다 (0)	2025.01.05
2024 노동자권리찾기 안내수첩 pdf 파일 다운로드 (0)	2025.01.03
Valve's Handbook for New Employees (2)	2024.12.20
집회 참가 가이드 (0)	2024.12.09
한강, 스웨덴 한림원에서 ‘빛과 실’이란 제목으로 강연 전문 (5)	2024.12.09
서구의 쇠퇴를 폭로하는 스레드 (5)	2024.12.02
최고의 온라인 사업 아이디어 25가지 (21)	2024.11.12
초보자가 시작하기 좋은 21가지 작은 사업 (33)	2024.11.11

더욱 좋은 정보를 제공하겠습니다.~ ^^

기린

Deepseek 빌드에 대한 생각에 대해 Liang Wenfeng과 나눈 드문 인터뷰

'WebAnarchist' 카테고리의 다른 글

티스토리툴바

Deepseek 빌드에 대한 생각에 대해 Liang Wenfeng과 나눈 드문 인터뷰

'WebAnarchist' 카테고리의 다른 글

'WebAnarchist' Related Articles

티스토리툴바