Digestly

Apr 27, 2025

"OpenAI is Not God” - The DeepSeek Documentary on Liang Wenfeng, R1 and What's Next

AI Explained - "OpenAI is Not God” - The DeepSeek Documentary on Liang Wenfeng, R1 and What's Next

Deepseek R1은 2025년 1월에 출시된 중국의 AI 모델로, 저렴한 가격과 개방성을 특징으로 한다. 이 모델은 서구의 AI 모델과 경쟁할 수 있는 성능을 갖추고 있으며, 특히 OpenAI의 모델과 비교해도 뒤지지 않는 성능을 보여준다. Deepseek의 창립자 Leang Wenfang은 AI 연구와 탐구에 집중하며, 중국이 기술 혁신의 선두주자가 되기를 희망한다. Deepseek R1은 다양한 기술 혁신을 통해 효율성을 극대화했으며, 이는 제한된 자원으로도 높은 성능을 발휘할 수 있게 한다. 이러한 혁신은 중국이 AI 분야에서 서구와의 격차를 좁히는 데 기여하고 있다.

Key Points:

  • Deepseek R1은 저렴하고 개방적이며 서구의 AI 모델과 경쟁할 수 있는 성능을 갖추고 있다.
  • Leang Wenfang은 AI 연구와 탐구에 집중하며, 중국이 기술 혁신의 선두주자가 되기를 희망한다.
  • Deepseek R1은 다양한 기술 혁신을 통해 효율성을 극대화했다.
  • 중국은 AI 분야에서 서구와의 격차를 좁히고 있다.
  • Deepseek의 혁신은 제한된 자원으로도 높은 성능을 발휘할 수 있게 한다.

Details:

1. 📢 Deepseek R1의 등장과 AI 시장의 변화

1.1. Deepseek R1의 소개

1.2. AI 시장에 미친 영향

2. 🤖 류양 웬팡과 Deepseek의 배경 이야기

2.1. Deepseek R1의 논란

2.2. Deepseek R2의 출시와 시장 영향

3. 🧠 AI 발전과 Deepseek의 기술 혁신

  • Deepseek R1의 출시는 AI 기술 혁신의 주요 사건으로, 서구 연구소들인 OpenAI와 Anthropic이 이에 대응하여 그들만의 내러티브를 발행하고 있다.
  • Deepseek는 다양한 내러티브의 그물에 걸린 고래와 같으며, 이 내러티브들은 종종 서로 모순된다. 이는 Deepseek의 기술이 다양한 해석과 반응을 불러일으킬 만큼 혁신적임을 보여준다.
  • Deepseek의 AI 기술은 특히 고객 맞춤형 전략에서 활용되어, 고객 유지율을 32% 개선하는 등의 성과를 올리고 있다.

4. 💡 금융 시장에서의 AI 활용과 하이플라이어의 성공

4.1. 금융 시장에서의 AI 활용 개요

4.2. 하이플라이어의 설립과 성공 전략

4.3. AI가 금융 시장에 미치는 영향

5. 📈 하이플라이어의 도전과 Deepseek의 시작

  • 하이플라이어는 2021년 말까지 94억 달러의 자산을 운용하며, 주식 시장 벤치마크보다 20%에서 50% 포인트 더 높은 수익률을 제공했습니다. 특히 모든 시장 전략에 인공지능(AI)을 활용하여 10,000개의 Nvidia GPU로 구동되는 슈퍼컴퓨터를 보유하고 있습니다.
  • 하이플라이어의 AI 시스템은 과도한 위험을 감수하는 성향을 보였으며, 이는 때때로 손실을 초래했습니다. 이는 너무 많은 자산이 쌓여 효과적으로 운용할 수 없게 되면 거래가 모방되고 경쟁 우위가 감소할 수 있다는 문제로 이어졌습니다.
  • 2018년부터 2024년 초까지 중국 S&P 지수에 비해 높은 성과를 기록했지만, 그 후 몇 차례의 실수를 경험했습니다. 이러한 도전에도 불구하고 리앙은 AI에 대한 신념을 포기하지 않았습니다.
  • 이러한 배경에서 리앙은 2023년 4월, Deep Seek라는 연구 기관을 설립하여 일반 지능의 본질을 해독하는 작업을 시작했습니다. 하이플라이어의 경험은 Deep Seek의 설립에 중요한 교훈을 제공했으며, AI의 잠재력을 탐구하는 데 새로운 방향을 제시했습니다.

6. 🔍 초기 모델과 Deepseek의 혁신적 접근법

  • Deepseek는 2023년 11월에 첫 번째 챗봇 Deepseek V1을 출시하면서, 일반 인공지능의 안전성의 중요성을 깊이 인식하고 있음을 강조하는 디스클레이머를 추가하였습니다.
  • Deepseek V1의 출시는 인간의 가치와 일치하고 인류에 우호적인 인공지능 모델을 구축하는 것이 중요하다는 전제를 바탕으로 진행되었습니다.
  • OpenAI의 GPT4가 2023년 3월에 공개되어 AGI의 가능성을 보여주었으며, Deepseek는 그 해 7월에 공식 설립되었습니다.
  • Deepseek V1은 사용자와의 상호작용을 통해 학습하며, 안전하고 책임 있는 AI 사용을 촉진하기 위한 구체적인 안전 기능을 포함하고 있습니다.
  • 챗봇의 설계는 사용자 피드백을 적극적으로 반영하여 지속적으로 개선되고 있습니다.

7. 🌐 AI 모델의 오픈 소스와 비밀 유지

  • Deepseek R1은 2025년 초 세계의 주목을 받으며 시장을 혼란에 빠뜨림. 이 모델의 저렴한 비용과 개방적인 접근성 덕분에 큰 주목을 받았으며, 중국에서 개발되었음에도 서구보다 성능이 뛰어났음.
  • Deepseek는 2023년 여름까지는 서구 AI 연구소에 비해 뒤쳐져 있었으나, 이후 급격히 발전함.
  • Llama 2 모델은 Gypsy 4보다 주요 벤치마크에서 덜 똑똑했지만, 오픈 가중치를 제공하여 누구나 다운로드, 수정, 배포할 수 있었음. 이는 AI 모델 개발의 투명성과 접근성을 높이는 데 기여함.
  • 오픈 가중치와 오픈 소스는 다르며, 모델의 완전한 오픈 소스를 위해서는 데이터의 공개도 필요함. 이는 기업과 개발자들이 AI 모델을 활용하여 혁신을 이루고, 업계 전반에 걸쳐 신뢰와 협력을 증진하는 데 중요한 역할을 함.

8. 🚀 Deepseek의 성장과 국제적인 도전

  • OpenAI와 같은 서구 AI 연구소는 언어 모델 훈련의 방법론을 점점 더 비밀로 유지하려고 합니다. 이는 경쟁을 피하고 기술 우위를 유지하기 위한 전략입니다.
  • OpenAI의 CEO인 Sam Orman은 스타트업이 OpenAI와 같은 하이퍼스케일러와 경쟁하기 어렵다고 언급하며, 특히 기초 모델 훈련에서의 경쟁은 절망적이라고 설명합니다.
  • Orman은 하이퍼스케일러의 비공개 모델과 오픈 소스 커뮤니티의 발전 사이에 몇 년의 격차가 있을 것이라고 강조하며, 이는 Deepseek와 같은 기업이 마주하는 주요 도전 과제가 됩니다.
  • Deepseek는 이러한 도전 속에서 성장하기 위해 오픈 소스 기술의 발전을 활용하고, 지역 시장에서의 강점을 극대화하려는 전략을 채택할 수 있습니다.
  • Deepseek는 또한 글로벌 시장에서의 입지를 넓히기 위해 특정 지역의 규제와 문화적 차이를 전략적으로 대응해야 합니다.

9. 🧬 Deepseek R1의 혁신과 기술적 도전

9.1. Deepseek R1의 혁신

9.2. Deepseek R1의 기술적 도전

10. 🔧 Deepseek의 효율성 혁신

  • Deepseek은 KPI나 할당량 대신 독창적인 평가 기준을 설정하여 최소한의 간섭으로 혁신을 장려합니다.
  • 2023년 11월에 출시된 Deepseek의 AI 모델은 초기에는 독창적이지 않았으나, 장기적 관점을 중시하는 전략을 통해 발전했습니다.
  • Deepseek은 맞춤형 데이터 세트에서 객관식 질문을 제외하여 실제 성능을 개선하고 테스트에 과적합하지 않도록 했습니다.
  • Deepseek은 벤치마크에 과적합하는 것이 모델의 실제 지능 달성에 기여하지 않는다고 강조하며, 이를 방지하는 전략을 채택했습니다.

11. 📊 Deepseek의 수학적 모델과 GRPO

  • Deepseek은 모델의 지능을 더 적은 비용으로 얻기 위한 새로운 접근법을 개척함.
  • Llama 2와 같은 모델은 사용자 프롬프트에 대한 응답을 계산하기 위해 수십억의 가중치를 사용함.
  • 전문가 혼합 접근법은 사용자의 입력에 따라 가중치의 전문 하위 집합을 사용하여 모델 내 전문가의 집합을 활용하는 방법임.
  • 모든 요청에 대해 모델 가중치의 하위 집합만 응답하므로 모델 내 모든 전문가가 공통된 역량을 가져야 함.
  • Deepseek은 이러한 비효율성을 극복하기 위해 'Towards Ultimate Expert Specialization' 논문에서 혁신적인 해결책을 제시함.
  • 언어 모델 내 특정 전문가 하위 네트워크가 항상 활성화되어 일반 전문가로 역할을 수행함으로써 다른 전문가들이 진정으로 전문성을 발휘할 수 있게 함.

12. 🌟 Deepseek의 기술적 성과와 R1의 준비

12.1. Deepseek Math의 혁신

12.2. Deepseek V2와 멀티헤드 잠재 주의력

13. 🔒 기술 제한과 Deepseek의 대응

13.1. 모델 최적화 전략

13.2. Deepseek의 글로벌 공개

13.3. 미국의 칩 수출 제한과 대응 전략

14. 🌏 중국과 서방의 기술 경쟁

  • 중국 기업들은 서방의 기술 봉쇄에 대응하기 위해 싱가포르와 말레이시아를 칩 밀수의 주요 거점으로 활용하고 있다. 이는 중국이 기술 확보를 위해 어떤 경로든 활용하고자 하는 전략을 보여준다.
  • GPU 밀수를 통해 중국 내에서 AI 개발에 필요한 계산을 지원하고 있으며, 이는 중국이 서방의 기술을 모방하는 수준을 넘어 자국의 기술 발전을 가속화하려는 의지를 나타낸다.
  • 2024년 Leang Wenfang은 연구 논문을 분석하고 코드를 작성하며, AI 분야의 혁신을 주도하기 위해 심야까지 토론에 참여하고 있다. 이는 중국이 AI 분야에서 글로벌 리더십을 목표로 하고 있음을 시사한다.
  • Leang Wenfang은 서구의 발명을 모방하는 것에 머무르지 않고, 중국이 기술 기여자로 자리매김해야 한다고 주장하며, 이는 중국의 전략적 목표 변화를 의미한다.

15. 🔍 Deepseek V3와 글로벌 혁신

  • Deepseek V3는 언어 모델의 성능을 향상시키기 위해 파라미터 수와 고품질 데이터의 중요성을 강조하며 실리콘 밸리의 원칙을 활용함.
  • 과거 중국의 기술 혁신 참여가 부족했던 것과 달리, Deepseek는 연구 결과를 공개하여 글로벌 연구자들이 학습 및 적응할 기회를 제공함.
  • 2024년 말 출시 예정인 Deepseek V3는 기존 혁신과 새로운 기술을 통합 및 확장할 계획임.
  • 혼합 정밀도 훈련을 통해 효율성을 극대화하고, NVIDIA GPU에 최적화된 명령어 코드를 작성하여 성능을 향상시킴.
  • Deepseek의 효율성 최적화 노력은 서구 연구소들이 이를 연구할 팀을 구성하게 만들었으며, 글로벌 기술 산업에 큰 영향을 미침.
  • Anthropic의 CEO Dario Ammedday는 Deepseek V3를 실제 혁신으로 평가하며, 글로벌 기술 혁신에의 기여를 인정함.

16. 💥 Deepseek R1의 글로벌 영향

16.1. Deepseek R1의 개발

16.2. Deepseek R1의 글로벌 영향

17. 🧩 Deepseek R1의 가격과 경제적 영향

17.1. Deepseek R1의 기술 혁신

17.2. 경제적 영향과 시장 변화

18. 💸 Deepseek의 자금 조달과 미래 전망

18.1. 💸 Deepseek의 자금 조달과 미래 전망

18.2. Deepseek의 미래 전략

19. 🔮 AI의 미래와 Deepseek의 역할

  • Deepseek은 기초 모델에 '소리 내어 생각하기' 및 최적화 기능을 추가하여 초기에는 큰 수익을 얻었으나, AGI(범용 인공지능)에 도달하려면 수백억 달러의 컴퓨팅 비용이 필요함.
  • Amade는 현재 여러 회사가 좋은 추론 모델을 생산할 수 있는 교차점에 있으며, 이러한 상태는 모델 확장 곡선이 높아짐에 따라 곧 사라질 것이라고 언급함.
  • 거의 모든 인간보다 더 똑똑한 AI를 만들려면 수백만 개의 칩과 적어도 수백억 달러가 필요하며, 이는 2026년 또는 2027년에 가능할 것으로 예측됨.
  • 경제 활동 10억 달러는 숨길 수 있지만, 100억 달러 이상은 숨기기 어렵다는 점에서 수백만 개의 칩 밀반입은 물리적으로도 어려운 문제임.
  • Deepseek의 R2와 R3는 칩 수급이 부족하여 뒤처질 수 있으며, Deepseek 엔지니어들이 수십억 달러 규모의 자원을 가진 경쟁자들과 같은 속도로 계속 개발할 수 있을지 불확실함.

20. 📜 Deepseek의 오픈성에 대한 논란

  • ByteDance의 Dobau 1.5 Pro는 TikTok의 제작자로서 R1 출시 몇 시간 내에 발표되었으며, 그 전에 iFly Techch와 Huawei의 Spark Deep Reasoning X1이 발표되었음. 이 모델은 중국 기술 시험에서 서구 모델을 능가하고, 이미 거의 1억 명이 사용 중임.
  • Moonshot AI는 R1이 출시된 같은 날 Kimmy K1.5을 발표하여 인기 있는 수학 벤치마크에서 96.2%의 점수를 기록했으며, 이는 OpenAI의 01보다 높은 점수임.
  • Deep Seek의 R1 모델은 MIT 라이센스로 출시되었으나, 민감한 중국 주제에 대한 출력은 제한되어 있음. Weaguers에 대한 질문에 대한 답변이 이를 보여줌.
  • 이 모델의 오픈성은 논란의 여지가 있으며, Leang Wenfang과 DeepS가 이 문제를 주목하고 있을 것임.

21. 🔍 OpenAI와의 경쟁 및 논란

  • OpenAI는 DeepSeek이 자사의 01 모델의 사고 과정을 무단으로 접근하고 학습했다고 주장했습니다. 이는 DeepSeek이 OpenAI의 모델을 증류(distillation) 방법을 통해 모방하려는 시도로 보입니다.
  • 중국의 그룹들이 미국의 고급 AI 모델을 모방하기 위해 증류(distillation)를 사용하는 것으로 알려져 있으며, OpenAI는 DeepSeek이 부적절한 방법으로 자사의 모델을 증류했다는 증거를 검토 중입니다.
  • OpenAI는 자사의 기술을 보호하기 위해 공격적이고 선제적인 대응 조치를 취하고 있으며, 이는 미국 정부와의 긴밀한 협력을 통해 이루어지고 있습니다.
  • 미국의 일부 법률 제정자들은 Deepseek R1을 사용하는 미국 사용자에게 형벌을 부과하는 것을 제안하고 있으며, 이는 OpenAI의 기술 보호를 위한 법적 조치의 일환입니다.
  • OpenAI는 저작권이 있는 작품을 보상 없이 학습시킨 혐의로 많은 소송에 직면해 있으며, 이러한 법적 도전은 기술 보호와 관련된 문제의 핵심입니다.

22. 🚀 Deepseek의 미래와 AGI의 가능성

  • Deepseek는 자동화된 인공지능 시대의 시작을 나타내며, 향후 3년 내에 AI가 직업의 95%를 수행할 수 있을 가능성을 제시합니다.
  • Tacetern Leang Wenfang 팀은 무한한 컨텍스트와 전설적인 트랜스포머 아키텍처의 대체품 개발을 지속하고 있습니다.
  • 무한한 컨텍스트 모델은 사용자가 들었거나 본 모든 정보를 참조하여 다음 답변을 제공할 수 있는 능력을 가질 것입니다.
  • Deepseek가 AGI에 도달할 가능성과 이를 오픈 소스로 공개할 가능성이 논의되고 있으며, 세계가 이 변화를 이해할지 여부가 불확실합니다.
View Full Content
Upgrade to Plus to unlock complete episodes, key insights, and in-depth analysis
Starting at $5/month. Cancel anytime.