Digestly

Feb 28, 2025

GPT-4.5 shocks the world with its lack of intelligence...

Fireship - GPT-4.5 shocks the world with its lack of intelligence...

GPT 4.5는 OpenAI가 출시한 가장 비싼 AI 모델이지만, 혁신적인 기능이나 성능 향상을 보여주지 못했다. 이 모델은 자연스러운 대화를 목표로 하지만, 실제로는 주관적인 평가에 의존한다. 또한, 프로그래밍 및 과학 분야에서의 성능은 기존 모델에 비해 떨어지며, 비용도 매우 높다. OpenAI는 여전히 최고의 모델을 목표로 하고 있지만, 시장의 기대에 부응하지 못하고 있다. AI 기술의 발전이 정체된 상황에서, 컴퓨터 과학 학생들에게는 AI 코딩 도구가 유용할 수 있다. 이러한 도구는 실제 프로그래머에게 가장 유용하며, Brilliant와 같은 플랫폼을 통해 무료로 프로그래밍을 배울 수 있다.

Key Points:

  • GPT 4.5는 가장 비싼 AI 모델로, 혁신적인 기능 부족.
  • 자연스러운 대화 목표지만 주관적 평가에 의존.
  • 프로그래밍 및 과학 분야 성능 저하, 높은 비용.
  • OpenAI의 시장 기대 미달, 기술 발전 정체.
  • AI 코딩 도구는 프로그래머에게 유용, 무료 학습 가능.

Details:

1. 📉 GPT 4.5의 실망스러운 출시

  • GPT 4.5는 기대 이하의 성과로 출시되었습니다.
  • Open AI는 역사상 가장 비싼 AI 모델을 공개했으나, 주요 벤치마크를 넘어서지 못하고 어떠한 기록도 세우지 못했습니다.
  • GPT 4.5의 출시 전에 고성능과 혁신적인 기능에 대한 높은 기대가 있었습니다. 하지만, 실제 성능은 기존 모델 대비 뚜렷한 개선점을 보이지 않았습니다.
  • 특히 언어 처리 및 이해 능력에서 예상했던 혁신적인 개선이 없었습니다.

2. 🧠 기술적 특이점의 종말

  • 현재 모델은 새로운 능력이나 혁신적인 기능을 제공하지 않으며, 'Vibes'라는 유일한 장점으로 더 자연스럽고 인간적인 대화를 제공하려고 합니다.
  • 이 모델은 좋은 모델이지만 AI 열풍을 유지하기에는 충분하지 않으며, 기술적 특이점 대신 시그모이드 곡선에 도달할 가능성이 높아 보입니다.
  • 기술적 특이점은 AI가 인간을 초월하는 시점을 의미하지만, 현재의 AI 발전은 한계에 직면해 있으며, 점진적인 개선과 발전이 예상됩니다.
  • 현재 AI 모델의 한계는 혁신적인 기능의 부족으로, 이는 기술적 특이점에 도달하는데 장애물이 되고 있습니다.

3. 🤖 AI 규제와 기술 리더들

  • 2023년에 기술 리더들은 오리온과 같은 대형 모델의 훈련을 중단하기 위한 청원에 서명하였다.
  • 이 청원은 AI 모델의 안전성과 윤리적 사용을 보장하기 위한 규제의 필요성을 강조하였다.
  • 주요 서명자로는 테슬라의 엘론 머스크, 스페이스X의 지휘자들이 포함되었다.
  • 이 청원은 전 세계적으로 AI 개발의 속도를 조절하고, 윤리적 기준을 강화하려는 움직임의 일환으로 볼 수 있다.
  • AI 산업계에서는 이러한 규제 요구에 대해 다양한 반응이 있었으며, 일부는 혁신의 속도를 늦출 것이라는 우려를 표명했다.

4. 📅 2025년 2월 28일: 코드 리포트

  • GPT 4.5보다 실망스러운 것은 에프스타인 파일의 공개입니다. 이는 대중에게 큰 충격을 주었으며, 윤리적 문제와 관련된 논의의 필요성을 강조합니다.
  • 오늘의 비디오에서는 생성적 사전 훈련 변환기의 사전 훈련의 한계에 도달했는지 알아봅니다. 이 과정에서 사전 훈련의 효율성을 높이기 위한 새로운 접근법을 모색할 필요가 있음이 드러났습니다.

5. 💸 GPT 4.5의 비용 문제

  • GPT 4.5는 매우 비싸며, Claude의 비용이 백만 토큰당 $15인 것과 비교해 5배 더 비싼 백만 출력 토큰당 $75이다.
  • 정정하면, 이는 입력 토큰의 비용으로 백만 토큰당 $150이다.
  • 이러한 높은 비용은 기업이 대규모 AI 모델을 활용할 때 상당한 부담이 될 수 있다.
  • 특히 고빈도 데이터 처리나 실시간 응답이 필요한 애플리케이션에서는 비용이 과도할 수 있다.
  • 비용 절감 및 효율성을 위해 다른 모델과의 병행 사용을 고려해야 한다.

6. 🗣️ Vibes 벤치마크와 GPT 4.5의 한계

  • GPT 4.5는 현재 월 200달러의 Pro 사용자에게만 제공됩니다.
  • Vibes 벤치마크는 창의적 사고를 측정하기 위한 새로운 기준으로 도입되었습니다.
  • GPT 4.5는 낮은 환각률을 가졌으나 여전히 많은 사소한 실수를 저지릅니다.
  • 사용자와의 대화에서 'Chill Vibes'를 발산하지만 이는 주관적입니다.
  • 모델이 자각이 없으며 자신이 무엇인지 인지하지 못합니다.
  • GPT 4.5는 이전 버전과 비교하여 창의적인 문제 해결 능력이 향상되었습니다.
  • 경쟁 모델과 비교 시, GPT 4.5는 특정 작업에서 더 높은 정확도를 보입니다.
  • 사소한 실수는 주로 문맥 이해의 미세한 차이에서 발생합니다.

7. 💻 프로그래밍 성능 및 비용 문제

  • 프로그래밍의 정확성 문제: 텍스트 분석에서 'Strawberry'의 R의 수를 정확히 알려준 반면 'laap paloa'의 L의 수는 잘못 산출되었습니다. 이는 텍스트 분석 알고리즘의 신뢰도를 개선할 필요가 있음을 시사합니다.
  • 프로그래밍 및 과학 분야에서 성능 저조: 깊이 있는 사고가 필요한 모델들에 비해 성능이 떨어지며, 이는 더 정교한 알고리즘 개발이 필요함을 보여줍니다. 예를 들어, 특정 모델은 03 모델에 비해 성능이 떨어집니다.
  • AER polyglot 코딩 벤치마크에서 성능이 저조하며, 이는 deep seek보다 비용이 수백 배 더 많이 듭니다. 이는 코딩 효율성을 향상시키기 위한 리소스 최적화가 필요함을 시사합니다.

8. 📉 XAI와 시장의 의견

8.1. XAI 모델의 시장 평가

8.2. Open AI의 도전과 자금 조달

9. 🤔 GPT 5와 미래에 대한 실망

  • GPT 5의 훈련에서 유의미한 개선이 이루어지지 않았다는 의견이 제기됨. 이는 매개변수와 컴퓨팅 파워를 확대한 것에도 불구하고 발생한 문제로, GPT 4.5가 현재까지 가장 큰 모델이지만 기대에 미치지 못함.
  • 얼트먼은 GPT 5를 사용자 프롬프트에 따라 최적의 모델을 자동으로 선택하는 라우터와 비슷하다고 설명했으나, 이는 기대 이하로 실망스러운 결과로 평가됨.
  • GPT 5의 기대에 미치지 못하는 성능은 주로 기술적 제한과 사용자 경험의 한계에서 비롯됨. 이는 더 큰 모델이 항상 더 나은 결과를 제공하지 않는다는 것을 시사함.
  • 전문가들은 GPT 5의 한계를 극복하기 위해서는 알고리즘 혁신과 사용자 인터페이스 개선이 필요하다고 강조함.

10. 🎓 AI와 프로그래밍 교육

10.1. AI 코딩 도구의 역할과 혜택

10.2. 프로그래밍 교육 플랫폼

View Full Content
Upgrade to Plus to unlock complete episodes, key insights, and in-depth analysis
Starting at $5/month. Cancel anytime.