Digestly

Dec 23, 2024

AI 뉴스 - AGI급 o3 & o3-mini 공개, GPT-5 소식, Veo2, Deep Research, 물리 시뮬레이션, Copilot 무료, 앤트로픽 AI 속임수 등

조코딩 JoCoding - AI 뉴스 - AGI급 o3 & o3-mini 공개, GPT-5 소식, Veo2, Deep Research, 물리 시뮬레이션, Copilot 무료, 앤트로픽 AI 속임수 등

OpenAI의 O3 모델은 코드포스 알고리즘 테스트에서 1891점에서 2727점으로 성능이 크게 향상되었으며, 이는 인간의 최상위 0.05%에 해당하는 수준이다. 또한, AGI 감별 테스트에서 87.5%의 점수를 기록하며 인간의 85%를 넘어섰다. 이러한 성능 향상은 AI가 인간의 추론 능력을 넘어섰다는 평가를 받게 했다. O3 미니 모델도 발표되어 기존의 5원 모델을 뛰어넘는 성능을 보여주며, 컴퓨팅 파워 대비 효율성이 높아졌다. 추가적으로, 구글은 AI 생성 영상 기술을 선보이며, 물리적 현상을 시뮬레이션하는 기능을 제공하고 있다. 이는 AI 기술이 다양한 분야에서 인간의 능력을 보완하거나 대체할 수 있음을 보여준다.

Key Points:

  • O3 모델은 코드포스 알고리즘 테스트에서 2727점을 기록, 인간 최상위 0.05% 수준.
  • AGI 감별 테스트에서 87.5% 기록, 인간의 85%를 초과.
  • O3 미니 모델은 기존 5원 모델을 뛰어넘는 성능, 컴퓨팅 효율성 높음.
  • 구글 AI는 물리적 현상 시뮬레이션 기능 제공, AI의 다양한 분야 활용 가능성 시사.
  • AI 기술은 인간의 추론 능력을 보완하거나 대체할 수 있는 수준으로 발전.

Details:

1. 🔍 O3 모델의 혁신과 성능 향상

  • O3 모델은 HII에 도달한 첫 번째 모델로 평가받고 있습니다.
  • 코드포스 알고리즘 테스트에서 O3 모델의 점수는 1891에서 2727로 증가했습니다.
  • O3 모델은 전 세계 0.05% 안에 드는 코딩 능력을 보유하고 있습니다.
  • AGI 감별 테스트에서 O3 모델은 87.5%의 점수를 기록하며 인간의 85%를 초과했습니다.
  • 리서치 매스 벤치마크에서 O3 모델의 점수는 2점에서 25.2점으로 상승했습니다.
  • GPQA 벤치마크에서 O3 모델은 87.7%의 점수를 기록하며 전문가의 65%를 초과했습니다.
  • O3 미니는 코드포스 점수 기준으로 5원 풀 버전을 넘었습니다.

2. 🛠️ 새로운 기능과 태스크 공개

  • 새로운 기능으로 '자본'이라는 태스크가 유출됨. 이 기능은 스케줄을 정할 수 있는 기능을 제공하여, 크론잡과 유사하게 서버에서 에이전트를 준비하는 전단계로 활용 가능.
  • 태스크 기능을 통해 매주 AI 뉴스를 요약하거나, 매일 프랑스어 연습을 도와주는 등의 작업을 자동화할 수 있음.
  • 개인화된 알림 기능으로 엄마 생일 상기, 1일 운세 전송 등의 서비스 제공 가능.

3. 🔎 검색 및 API 업데이트

3.1. 검색 기능 개선

3.2. API 성능 향상

3.3. 리얼타임 API 개선

3.4. SDK 출시

3.5. 전화통화 기능 추가

3.6. 앱 연동 기능 확대

4. 🎁 GPT-5와 가격 논의

  • 소라를 무제한으로 사용할 수 있는 기회 제공
  • 12월 말 휴가 기간 동안 GPU 사용량 감소 예상
  • 플러스 유저에게 무제한 영상 생성 제공
  • 무제한 사용 기회는 사용자 참여를 높이기 위한 전략
  • GPU 사용량 감소는 비용 절감 및 효율성 향상에 기여
  • 플러스 유저 혜택은 고객 충성도를 강화하기 위한 조치

5. 💡 AI 에이전트와 기능 통합

5.1. AI 에이전트 개발 및 출시 지연

5.2. 출시 지연의 영향 및 대처 방안

6. 💰 AI 서비스의 비용과 가치

  • AI 서비스의 월 사용료가 288만 원에 이를 수 있다는 보도가 있음
  • 현재 프로 기준으로 200달러의 열배인 2,000달러로 책정된 상품 출시 가능성 언급
  • 이 정도 비용은 기업용으로 적합하며, 1인분의 직원을 채용할 만큼의 가치가 있을 수 있음

7. 🎥 구글의 AI 영상 생성 기술

7.1. 구글의 AI 영상 생성 기술

7.2. 오픈AI의 에이전트 제품

8. 🖼️ 이미지 생성과 편집 기술

  • 구글에서 AI 기반 동영상 생성 기술인 AI bo2를 출시하여 자연스러운 영상 생성이 가능해졌습니다.
  • AI bo2는 복잡한 물리 유체 흐름을 정확하게 반영하여 자연스러운 동작을 구현하며, 이는 다양한 산업에서 활용될 수 있습니다.
  • 예를 들어, 트위터에서 바이럴된 윌 스미스가 파스타를 먹는 장면은 실제와 유사한 정교함을 보여주며, 광고 및 엔터테인먼트 분야에서 큰 잠재력을 가지고 있습니다.
  • 비교 분석 결과, 구글의 AI 생성 영상은 다른 기업의 기술보다 전반적으로 더 선호되며, 이는 사용자 경험을 크게 향상시킵니다.
  • 프롬프트 정확도에서도 구글의 AI 기술이 다른 기업보다 앞서가는 것으로 평가되며, 이는 사용자 요구에 대한 높은 대응력을 의미합니다.

9. 🖌️ 텍스트 없이 이미지 생성

  • 이미지 생성은 텍스트 프롬트 없이도 가능하며, 사용자는 물체와 스타일을 지정하여 원하는 이미지를 생성할 수 있습니다.
  • 이 서비스는 한국에서 직접 사용이 불가능하며, VPN을 통해 접근해야 합니다.

10. 🧠 제미나이 2.0의 추론 모델

  • 구글이 제미나이 2.0 플래시 추론 모델을 출시했습니다.
  • 이 모델은 구글 AI 스튜디오에서 즉시 사용할 수 있습니다.
  • 사용자는 제미나이 2.0 플래시 thinking 익스페리멘탈을 선택할 수 있습니다.
  • 모델은 사용자가 질문을 하면 추론 과정을 시각적으로 보여줍니다.
  • 제미나이 2.0은 이전 버전보다 향상된 성능과 더 빠른 처리 속도를 제공합니다.
  • 이 모델은 복잡한 문제 해결에 적합하며, 다양한 산업 분야에서 활용될 수 있습니다.

11. 🔬 딥 리서치와 AI 조사 기능

  • 익스페리멘탈 어드밴스 2.0 버전이 12월 6일에 출시되었으며, 성능이 개선되어 호평을 받음.
  • 딥 리서치 기능이 공개되어 사용자가 직접 조사할 수 있게 되었으며, 조 코딩에 대한 심층 조사가 가능함.
  • 조사 기능은 기사, 블로그, 소셜 미디어 게시물 등을 통해 정보를 수집하고, 유튜브에 대한 심층 조사도 가능함.
  • 조사 결과는 보고서 형식으로 제공되며, 실제 사용 사례에서 브랜드 히스토리와 위키피디아 정보를 찾아냄.
  • 조사 과정에서 할루시네이션이 발생할 수 있으며, 자동화된 딥 리서치 기능이 퍼플렉시티를 줄여줌.

12. 📽️ 인스타그램의 AI 영상 변환

  • 인스타그램은 AI 기반의 영상 변환 기술인 무비 젠을 티저로 공개했습니다. 이 기술은 사용자가 기존의 영상을 새로운 스타일로 변환할 수 있도록 도와줍니다.
  • 내년에 AI를 활용한 영상 변환 기능을 도입할 계획이며, 이는 사용자들이 더욱 창의적인 콘텐츠를 제작할 수 있도록 지원할 것입니다.
  • 이 기술은 기존의 영상 편집 솔루션과 비교하여 더 빠르고 효율적인 변환을 제공할 것으로 기대됩니다.
  • 사용자 경험을 향상시키기 위해 인스타그램은 이 기술을 지속적으로 발전시킬 계획입니다.

13. 👓 레이밴 스마트 안경 업데이트

  • 레이밴 스마트 안경은 영상 분석 기능을 업데이트하여 실시간 번역이 가능해졌습니다.
  • 영어, 스페인어, 프랑스어, 이탈리아어 등 네 개 언어에 대한 실시간 번역 기능이 포함되었습니다.
  • 메타 커넥트에서 데모로 공개된 후 실제 업데이트가 이루어졌습니다.
  • 비디오 분석 기능은 프로젝트 애스트라와 같은 화면을 보면서 대화하는 것이 가능하게 합니다.
  • 이전에는 텍스트 번역만 가능했으나, 이번 업데이트로 영상 번역이 추가되어 사용자 경험이 크게 향상되었습니다.
  • 사용자는 이제 다양한 언어로 된 영상을 실시간으로 이해할 수 있어, 여행이나 국제 회의에서 유용하게 활용할 수 있습니다.

14. 🎨 AI 이미지 편집과 크레아 AI

  • 피카 2.0이 프리 언리미티드 행사를 진행 중이며, 21시간 남았다는 점을 강조합니다.
  • AI를 활용하여 개인 사진을 예술 작품처럼 변환하는 기능을 소개하며, '진주 귀걸이를 한 소녀'와 같은 스타일로 변환된 결과가 만족스럽다는 평가를 받았습니다.
  • 피카 2.0의 AI 기능은 사용자가 자신의 사진을 다양한 예술 스타일로 변환할 수 있게 하며, 이는 사용자 경험을 크게 향상시킵니다.
  • 이 AI 도구는 특히 예술적 표현을 원하는 사용자들에게 유용하며, 다양한 스타일 옵션을 제공합니다.

15. 🆓 기터브 코파일럿 무료 플랜

  • 크레아 AI를 사용하여 제품 사진을 자연스럽게 변경 가능
  • 안경을 칠한 후 비전 프로 이미지와 결합하여 자연스러운 결과물 생성
  • 발렌시아가 옷 사진을 인페인팅하여 반영 가능
  • 텍스트가 깨질 경우 재시도하여 수정 가능
  • 자사 제품을 모델에게 입힐 때 활용 가능

16. 🔄 실시간 번역과 물리 시뮬레이션

  • GitHub Copilot 무료 플랜이 추가되어 누구나 무료로 사용할 수 있음.
  • 월 2,000개의 콘텍스트에 코드 추천 제공.
  • 월 40개의 Copilot 채팅 메시지를 통해 리팩토링, 디버깅, 코드 설명이 무료로 가능.
  • OpenAI GPT-4.5나 Claude 3.5 Sonnet도 사용 가능.
  • AI 코딩 도구의 증가로 인해 다양한 활용 가능.
  • 이전에는 유료로만 제공되던 기능들이 무료로 제공됨으로써 개발자들의 접근성이 크게 향상됨.
  • AI 통합을 통해 개발 생산성이 증가하고, 코드 품질이 향상될 수 있음.

17. 🔊 인터랙티브 오디오 생성

  • 코파일럿 PC는 44개 이상의 언어를 영어로 실시간 번역할 수 있는 기능을 제공합니다. 이 기능은 글로벌 커뮤니케이션을 원활하게 하고, 다양한 언어 사용자 간의 상호작용을 촉진합니다.

18. 🎭 표정 조작과 AI 영상 생성

  • AI를 활용한 시뮬레이션 생성이 가능해졌으며, 물리적 현상을 리얼 피직스 기반으로 생성할 수 있다.
  • 카메라 뷰에 맞춰 영상을 생성하며, 속도와 물리적 힘의 적용을 시뮬레이션할 수 있다.
  • 물리적 법칙을 입력하면 실제 구현이 가능하며, 계산을 빠르게 생성할 수 있다.
  • 이 기술은 영화 및 게임 산업에서 현실감 있는 장면을 제작하는 데 활용될 수 있다.

19. 🚀 빠른 TTS와 애니메이션 생성

  • 인터랙티브 헤드 제너레이션 기술을 통해 소리로 말하는 영상을 생성할 수 있는 새로운 기능이 도입되었습니다.
  • 소리를 듣고 반응하는 기능까지 포함되어 있어, 자연스러운 대화가 가능합니다.
  • AI를 활용하여 팟캐스트와 같은 오디오 콘텐츠를 이미지로 변환할 수 있는 가능성이 제시되었습니다.
  • 기존에 많이 사용되던 기술이지만, 끄덕끄덕하는 장면과 같은 세부적인 표현도 구현 가능합니다.

20. 🤖 젠슨 왕의 새로운 AI 칩

  • AI 칩을 활용하여 영상에서 표정을 세세하게 조작할 수 있는 기능이 개발됨
  • 자연스러운 눈과 입의 움직임을 통해 감정 표현이 가능해짐
  • 이 기술은 감정이 필요한 영상 제작에 활용 가능하며, 표정 컨트롤을 통해 재미있는 영상 제작 및 바이럴 가능성을 증가시킴
  • 예를 들어, 영화나 광고에서 배우의 표정을 디지털로 수정하여 더 강력한 감정 전달이 가능해짐

21. 🤖 휴머노이드 로봇과 AI 결합

  • 잘하는 랩스에서 개발한 플래시 TTS는 75ms의 매우 빠른 속도를 자랑합니다.
  • 입력하자마자 즉시 반응하여 거의 실시간 소통이 가능합니다.
  • API를 통해 빠른 응답 속도를 체험할 수 있습니다.
  • 이 기술은 휴머노이드 로봇과의 통합을 통해 자연스러운 대화 경험을 제공합니다.
  • 플래시 TTS는 다양한 산업에서 고객 서비스 및 교육 분야에 활용될 수 있습니다.

22. 🏀 토요타의 농구 로봇

22.1. 애니메이션 색칠 기술

22.2. 토요타의 농구 로봇

23. 🚕 웨이모의 자율주행 택시

  • 웨이모는 오리온 나노 개발자 키트를 출시하며, 새로운 칩을 공개했습니다.
  • 이 디바이스는 온디바이스 AI 용으로 설계되었으며, 가격은 249달러입니다.
  • 램은 8기가로, AI 성능은 나쁘지 않으며, 라마 돌리는 성능 비교에서 좋은 결과를 보입니다.
  • 작은 로봇에 가볍게 탑재할 수 있는 온디바이스 솔루션으로 적합합니다.

24. 🐭 로봇 쥐와 AI의 상호작용

  • 마인드가 트로닉과 제휴하여 AI 첨단 하드웨어를 결합한 인간형 로봇을 개발 중이다.
  • 딥마인드의 제미나이 AI와 결합하여 로봇의 기능을 강화하고 있다.
  • 강화 학습을 통해 로봇이 축구를 잘하게 되었으며, 수비 능력도 향상되었다.
  • 완전한 휴머노이드 형태의 로봇 개발을 목표로 하고 있다.

25. 🪳 사이보그 바퀴벌레

  • 사이보그 바퀴벌레는 24.5m의 장거리 성능을 달성한 로봇으로 개발되었습니다.
  • 이 프로젝트는 장거리 성능으로 기네스 세계 기록을 세웠습니다.
  • 이 프로젝트의 성공은 로봇 공학에서의 중요한 성과로 평가됩니다.

26. 🧠 AI의 정렬 위장 현상

  • 웨이모 택시가 도쿄에서 테스트를 시작하며 시장 점유율이 증가하고 있습니다.
  • 웨이모는 현재 12%의 시장 점유율을 차지하고 있으며, 이는 3위 회사인 리프트를 거의 뛰어넘는 수준입니다.
  • 자율주행 택시의 전체 시장 점유율은 22%에 달합니다.
  • 웨이모의 시장 점유율 증가는 도쿄에서의 성공적인 테스트와 기술적 우위 덕분입니다.
  • 웨이모의 성장은 자율주행 기술의 발전과 시장의 수용성 증가를 반영합니다.
  • 웨이모의 시장 점유율 증가는 경쟁사들에게도 기술 혁신의 필요성을 강조하고 있습니다.

27. 🩺 AI의 의료 진단 능력

  • AI 기반 진단 도구는 질병을 조기에 발견하여 치료 성공률을 높임
  • AI 알고리즘은 방대한 의료 데이터를 분석하여 정확한 진단을 제공함
  • AI를 활용한 진단은 의료 비용을 절감하고 환자 대기 시간을 단축시킴
  • AI 시스템은 지속적인 학습을 통해 진단 정확도를 향상시킴
  • AI 기술은 의료진의 진단 보조 역할을 하며, 의료 서비스의 질을 향상시킴

28. 💰 비트코인 자동 매매와 투자 팁

  • 비트코인 자동 매매를 통해 수익을 극대화할 수 있는 전략 소개
  • 자동 매매 알고리즘을 활용하여 시장 변동성에 빠르게 대응
  • 백테스팅을 통해 전략의 유효성을 검증하고 최적화
  • 리스크 관리 기법을 통해 손실을 최소화하고 수익을 보호
  • 다양한 거래소의 API를 활용하여 거래 효율성 향상

29. 📸 AI 사진 서비스와 홍보

29.1. AI의 정렬 위장 및 진단 능력

29.2. AI와 금융 서비스의 통합

29.3. AI 사진 서비스

View Full Content
Upgrade to Plus to unlock complete episodes, key insights, and in-depth analysis
Starting at $5/month. Cancel anytime.