AI Explained - OpenAI Backtracks, Gunning for Superintelligence: Altman Brings His AGI Timeline Closer - '25 to '29
OpenAI의 CEO는 AGI(인공지능 일반화)의 정의를 더욱 공격적으로 수정하고, 2025년까지 AGI가 개발될 가능성을 언급했습니다. 이는 이전에 2030년으로 예상했던 것에서 크게 앞당겨진 것입니다. OpenAI는 AGI를 넘어 초지능 개발을 목표로 하고 있으며, 이는 회사의 초기 목표와는 다소 상충됩니다. AI 모델의 현재 한계는 기본적인 작업 수행 능력 부족에 있으며, 이는 강화 학습을 통해 개선될 수 있습니다. 최근 연구에 따르면 AI 모델은 실제 직업에서 수행되는 작업의 24%만을 자동으로 완료할 수 있지만, 이는 빠르게 개선될 수 있습니다. OpenAI는 이러한 발전을 가속화하기 위해 다양한 벤치마크와 경쟁을 도입하고 있습니다.
Key Points:
- OpenAI는 AGI 개발 일정을 2025년으로 앞당겼습니다.
- AGI의 정의가 더욱 공격적으로 변경되었습니다.
- AI 모델은 현재 실제 작업의 24%만 자동화할 수 있습니다.
- 강화 학습을 통해 AI 모델의 성능이 빠르게 개선되고 있습니다.
- OpenAI는 초지능 개발을 목표로 하고 있습니다.
Details:
1. 🔮 2025년 AI 전망: 조용한 해가 될까?
1.1. AGI 타임라인 수정 및 영향
1.2. 오픈 AI의 슈퍼 인텔리전스 작업
1.3. 새로운 논문과 LLM의 한계 및 가능성
1.4. 경쟁과 최신 기술 데모
2. 📅 오픈AI CEO의 AGI 타임라인 변화와 그 의미
2.1. AGI 정의 및 타임라인 변화
2.2. AGI 개발의 사회적 및 경제적 영향
3. 🤖 오픈AI의 초지능 목표와 내부 모순
- 오픈AI는 공식적으로 초지능 개발이 목표가 아니라고 했지만, 일부 대변인은 초지능 연구 가능성을 인정했습니다.
- 오픈AI는 초지능 정의를 지속적으로 변경하고 있으며, 일부 직원은 현재 시스템이 AGI에 해당한다고 주장합니다.
- 마이크로소프트는 오픈AI가 AGI 기술을 개발할 경우 해당 기술의 권리를 포기하는 조건을 가지고 있습니다.
- AGI로 인정받기 위해서는 시스템이 자체적으로 1,000억 달러 수익을 창출해야 한다는 정의가 있습니다.
- 오픈AI의 목표와 발표의 모순은 초지능 개발의 윤리적, 사회적 영향에 대한 논쟁을 불러일으킵니다.
- 마이크로소프트와의 협력은 오픈AI의 전략적 방향에 큰 영향을 미칠 수 있으며, 이는 초지능 개발에 대한 기대와 우려를 동시에 증폭시킵니다.
4. 🔍 AGI 정의 변동 및 오픈AI의 초기 전략
- 오픈AI는 초기 전략으로 AGI(인공지능 일반) 개발을 목표로 삼았으며, 이는 당시 이단적 접근으로 여겨졌다. 오픈AI의 설득 포인트는 단순한 AGI 개발이 아닌, AGI를 올바르게 활용하겠다는 것이었다.
- 오픈AI는 AGI가 비영리 조직에 의해 통제될 것이라고 주장했으며, 이는 여전히 현재 상황이다. 그러나 최근 오픈AI는 AGI 통제 구조 변경 계획을 발표했으며, 이는 장기적 미션의 성공을 위한 것이라고 설명했다.
- 이 계획에 따르면 비영리 조직은 AGI를 통제하지 않고, 대신 건강, 교육, 과학 분야에 많은 자금을 제공받게 된다. 이에 대해 오픈AI의 전 정책 연구 책임자는 비영리 조직의 자금 조달이 원래의 안전성 완화 미션과 일치하지 않는다고 비판했다.
- 오픈AI의 전 연구 책임자는 AGI가 전 인류에게 혜택을 준다는 목표가 덜 야심찬 자선 활동으로 대체되었다고 실망을 표명했다. 반면 마이크로소프트는 AGI 정의 조건과 그것으로부터 얻는 이익을 진지하게 규명하고 있다.
5. 📈 AI 모델의 한계와 과제 자동화의 가능성
- 현재 AI 모델은 실제 세계의 직업에서 수행되는 가장 일반적인 작업 중 24%만을 자동으로 완료할 수 있으며, 이는 18개월 전 GPT-4의 성능과 유사합니다. 최근 6개월 동안 AI 모델의 개선 속도가 급격히 증가했으며, 2025년 말까지 84%의 작업 자동화 달성이 예상됩니다.
- 작업 성능 평가에서는 모델이 작업을 완전히 완료할 수 있는지 여부에 중점을 두며, 부분 완료 시 항상 절반 이하의 점수를 받습니다. 작업이 길어질수록 LLMs는 처리에 어려움을 겪으며, 이는 모델이 복잡한 작업을 완료하는 데 장애물이 됩니다.
- AI 모델은 사회적 기술 부족으로 인해 작업 벤치마크에서 실패하며, 이는 종종 동료와의 상호작용에서 나타납니다. 강화 학습을 통해 AI 모델은 반복적인 시도로 작업을 완료하도록 훈련되며, 이는 최근 성능 향상의 비결입니다.
6. 🏆 AI 벤치마크 대회와 모델의 상식 테스트
- 01 Pro 모델은 모니터에서 2개의 축구장 거리에서도 글자를 구분하는 데 어려움이 있어 상식 부족을 보여준다.
- 대회에서는 20개의 질문 중 20개를 맞히는 목표를 두고 있으며, 참가자들은 시스템 프롬프트를 조정하여 모델의 성능을 시험할 수 있다.
- 경쟁에 참여하기 위해서는 OpenAI API 또는 Anthropics API 키가 필요하며, 01 프리뷰 모델을 추천한다.
- 대회의 우승자는 Rayban 안경을 받으며, 2위는 상품권, 3위는 기념품을 받는다.
- 참가자들은 20개의 질문 중 12~13개를 맞히는 전략을 사용하며, 시스템 프롬프트에 정답을 직접 넣지 않고 일반적인 힌트를 제공해야 한다.
- 문제는 현재 AI 모델이 간단한 명제를 이해하는 데 어려움을 겪고 있으며, 이는 AI의 상식적 추론 능력의 부족을 시사한다.
7. 🎥 텍스트-비디오 기술의 진보와 비교 분석
- 텍스트-비디오 기술의 발전이 2025년까지 가속화되고 있음.
- 최고의 세 가지 도구에 대한 빠른 비교를 제공함: Cling 1.6, Google DeepMind의 VO2, Sora 1080p.
- 모든 도구가 동일한 프롬프트를 사용하여 테스트됨.
- 이 도구들 간의 비교를 통해 성능의 차이를 분석 가능.
- Cling 1.6은 3D 렌더링과 정밀도 향상에 강점을 보임.
- Google DeepMind의 VO2는 자연스러운 움직임과 음성 합성에서 탁월함.
- Sora 1080p는 고해상도 비디오 출력에 최적화됨.
- 각 도구의 성능은 특정 활용 사례에 따라 다르게 평가될 수 있음.