Digestly

Apr 24, 2025

Why Every Agent needs Open Source Cloud Sandboxes

Latent Space: The AI Engineer Podcast - Why Every Agent needs Open Source Cloud Sandboxes

Why Every Agent needs Open Source Cloud Sandboxes
E2B는 개발자들이 코드 작성 및 테스트를 보다 쉽게 할 수 있도록 상호작용형 문서와 샌드박스 환경을 제공합니다. 초기에는 DevBook이라는 이름으로 시작하여 개발자들이 도구의 문서를 읽고 코드를 작성하는 대신, 브라우저에서 직접 상호작용할 수 있는 환경을 제공했습니다. 이를 통해 개발자들은 코드 작성과 테스트를 보다 직관적으로 수행할 수 있으며, 도구 제공자는 사용자가 어디에서 막히는지를 파악할 수 있는 귀중한 온보딩 분석을 얻을 수 있습니다. E2B는 이러한 상호작용형 문서와 샌드박스 환경을 통해 개발자 경험을 혁신하고자 하며, 이를 통해 개발자들이 보다 효율적으로 작업할 수 있도록 지원합니다.

Key Points:

  • E2B는 상호작용형 문서와 샌드박스 환경을 제공하여 개발자 경험을 개선합니다.
  • 개발자들은 브라우저에서 직접 코드를 테스트하고 상호작용할 수 있습니다.
  • 도구 제공자는 사용자의 행동을 분석하여 온보딩 과정을 최적화할 수 있습니다.
  • E2B는 초기 DevBook에서 시작하여 다양한 피벗을 거쳐 현재의 형태로 발전했습니다.
  • 상호작용형 문서와 샌드박스는 개발자들이 보다 직관적으로 작업할 수 있도록 지원합니다.

Details:

1. 🎙️ Latentspace 팟캐스트에 오신 것을 환영합니다

  • Decibel의 파트너이자 CTO인 Alessio와 SmallAI의 창립자인 Swix가 공동 진행을 맡음
  • 팟캐스트는 기술 혁신과 AI의 최신 동향을 탐구하는 것을 목표로 함
  • 청중에게 기술 세계의 복잡성을 이해하기 쉽게 설명하고자 함

2. 👤 게스트 소개: Vacek와의 만남

  • Vacek는 B2B 업계에서 활동하며, DevBook 프로젝트에서 개발자 경험 개선에 중점을 두었습니다.
  • 그는 DevBook에서의 경험을 바탕으로 E2B로 방향을 전환하여 더 나은 개발자 경험을 제공하고자 합니다.
  • Vacek는 본명을 'Vatslav'로 사용하지만, 'Vacek'라는 이름을 선호합니다.
  • DevBook은 개발자들이 더 효율적으로 작업할 수 있도록 돕는 플랫폼으로, E2B는 이러한 경험을 더욱 확장하여 적용하는 것을 목표로 하는 프로젝트입니다.

3. 🚀 DevBook에서 E2B로의 여정

  • DevTools에 대한 관심이 오래전부터 있었고, 다양한 반복과 피벗을 거쳐 DevBook이 탄생하였다.
  • 개발자를 위한 인터랙티브 문서를 제공하여, 개발자가 도구 문서 웹사이트에 방문할 때 브라우저 내에서 대화형 경험을 제공하고자 하였다.
  • 사전 제작된 인터랙티브 가이드와 플레이그라운드를 통해 개발자가 즉시 시도해볼 수 있는 환경을 제공하였다.
  • 문서의 소유자는 이러한 대화형 경험을 준비하여 개발자에게 제공하였다.
  • DevBook에서 E2B로의 전환 과정에서, 초기 피드백을 통해 개발자들이 인터랙티브 문서의 효과성을 높이 평가하였으며, 이를 통해 개발자 경험이 크게 향상되었다.
  • 개발자 커뮤니티의 참여가 증가하여, DevBook은 개발자들이 더욱 참여적이고 몰입할 수 있는 플랫폼으로 진화하였다.
  • E2B로의 전환은 DevBook의 기능을 확장하고, 개발자들이 보다 쉽게 협업하고 학습할 수 있는 환경을 조성하였다.

4. 🔄 E2B의 초기 발전과 전환

  • 초기 E2B 개발 단계에서는 브라우저 내에서 모든 것을 시도할 수 있는 기능을 제공하여 사용자가 어디에서 막히는지를 실시간으로 파악할 수 있었습니다. 이를 통해 매우 가치 있는 온보딩 분석을 확보할 수 있었습니다.
  • Prisma를 위한 인터랙티브 플레이그라운드를 구축하였으며, 이는 사용자가 Prisma를 수동으로 설정할 필요 없이 데이터베이스와 모든 것을 자동으로 설정하여 바로 시도할 수 있도록 하였습니다. 이는 현재도 사용 중입니다.
  • 이것은 현재 우리가 제공하는 인프라의 최초 버전이었으며, 기본적으로 샌드박스와 같은 환경을 제공하였습니다.
  • 당시 기술은 샌드박스 형태였으나 확장성이 부족했습니다. 이로 인해 2024년 경에 기술이 E2B로 전환되었습니다.

5. 📈 AI 에이전트와 오픈 소스 전환

  • 2023년 3월 23일, 프로젝트가 소진 상태였음. 이후 GPT 3.5 모델의 출시로 AI 실험의 미래 가능성을 인식하게 됨.
  • DevBook에서 10일에서 2주간 휴식을 취하며 AI 실험 시작. 이 기간 동안 AI DevIn 프로젝트가 구상됨.
  • AI DevIn 프로젝트는 백엔드 통합을 자동화하고, 에이전트가 GitHub 저장소를 가져와 코드를 작성하고 서버를 시작하여 모든 것을 테스트함.
  • Railway 플랫폼을 사용하여 에이전트를 손쉽게 배포함으로써 배포의 용이성을 높임.
  • OpenAI 및 공동 설립자들의 리트윗을 통해 큰 관심을 끌었으며, 이는 몇 일 만에 트윗 조회수가 50만을 기록하게 함.
  • 이러한 반응을 통해 더 많은 조치가 필요하다고 판단하여 추가적인 전략적 움직임을 고려하게 됨.

6. 💡 인프라와 기술적 혁신

  • E2B라는 이름의 오픈 소스 프로젝트를 시작했으며, 이는 영어를 비트로 변환하는 과정에서 착안한 이름이다.
  • E2B는 AI 에이전트 클라우드로 시작했으며, 에이전트가 코드를 실행할 환경을 제공하는 데 중점을 두었다.
  • 첫 번째 테스트 프로젝트는 작은 에이전트 프로젝트를 E2B 샌드박스에 배포하여 GitHub 저장소를 처리하고 PR을 생성하는 것이었다.
  • 이 프로젝트는 매우 인기를 끌었다.

7. 🌐 시장 전략과 성장 통계

  • Chrome 확장 프로그램을 목표로 했지만, 예상치 못한 청중을 끌어들였음.
  • 에이전트가 마크다운 파일에 작업 계획 및 사양을 기록하도록 하여 심층 연구 에이전트가 계획을 세울 수 있게 함.
  • 더 구조화된 출력이 필요함에도 불구하고, 초기 구현 방식의 흥미로운 점 지적.
  • 다양한 사용자들이 Lovable과 같은 도구를 사용해 프로젝트를 구축하려 했으나 복잡한 프로젝트에는 어려움 발생.
  • Cloud3의 100K 컨텍스트를 활용하려 했으나, 모델의 성능 저하로 인해 초기 데모를 반복할 수 없었음.
  • 사용자들은 원하는 바를 실현하기 위해 노력했으나, 모델의 준비 미흡으로 인해 실현 불가.
  • 피드백으로 소규모 에이전트가 당사로부터 비롯된 것이라 오해받은 경우가 있었음.

8. 🔍 사용자 요구와 기능 확장

  • 초기에는 몇백 줄의 코드로 시작하여 에이전트에 유용한 샌드박스가 가능한지 테스트했습니다.
  • 올바른 시장 진입 전략을 찾는 데 6개월이 소요되었으며, 코드 해석을 전략으로 선택했습니다.
  • AI 데이터 분석 및 시각화를 헤드리스 Jupyter 유형의 노트북 내에서 실행했습니다.
  • 모델은 프로그램의 상태 유지 없이 작동할 수 있음을 확인했습니다.
  • 초기 모델은 코드 조각을 생성하고 이전 변수와 함수 정의를 참조하려 했습니다.
  • 일반 코드 실행으로는 작동하지 않으며 REPL 환경이 필요했습니다.
  • 초기에는 Python이 모델에 가장 적합한 언어로 데이터 시각화에 강점을 보였습니다.
  • Jupyter 환경과 잘 어우러져 즉시 차트를 생성할 수 있었습니다.
  • 하지만 대규모 실행 시 기술적 문제로 인해 Jupyter는 적합하지 않았습니다.
  • 자체 런타임을 지원하는 내부 솔루션으로 전환하는 과정을 설명했습니다.

9. 🛠️ 기술적 세부사항 및 보안

  • 2024년 말에서 2025년 초 사이, 코드 인터프리터 사용에서 강화 학습 및 컴퓨터 사용으로 전환이 시작됨. 이는 기술 발전의 중요한 전환점으로, 더 복잡한 작업을 수행할 수 있는 능력을 제공함.
  • 2025년에는 에이전트가 실제 업무에 도입되면서 다양한 새로운 사용 사례가 발견되었고, 이는 기술의 급성장으로 이어짐. 에이전트의 도입은 업무 효율성을 크게 향상시킴.
  • Anthropic의 컴퓨터 사용 출시와 함께, 샌드박스 환경을 활용한 강화 학습 및 컴퓨터 사용 사례가 급격히 증가함. 이로 인해 더욱 복잡한 시뮬레이션과 학습이 가능해짐.
  • GitHub에 6개월간 데스크톱 버전의 샌드박스가 존재했으며, Anthropic 발표 이후 활용 가능성이 대폭 증가함. 이는 사용자들에게 새로운 개발 환경을 제공함.
  • Manus와 같은 회사들은 E2B를 통해 심층 리서치를 수행하며, 샌드박스를 코드 인터프리터로 활용하는 등 실질적인 연구 사례가 있음. 이는 연구 개발의 효율성을 증가시킴.
  • 샌드박스의 사용 사례는 코드 인터프리팅을 넘어 LLM이나 에이전트의 런타임 환경으로 확장되고 있으며, 이는 다양한 분야에 걸쳐 응용 가능성을 넓힘.
  • 샌드박스는 파일 생성, 할 일 목록 작성, 데이터 변환, 데이터 분석, 앱 작성 등 다양한 작업을 지원함으로써 사용자들에게 유연하고 강력한 도구를 제공함.

10. 📊 E2B의 시장 포지셔닝과 경쟁력

  • E2B는 2024년 3월 4만 개의 샌드박스를 운영했으나, 2025년 3월에는 1,500만 개로 증가하며 1년 만에 급격한 성장을 이루었다. 이는 E2B의 시장 확장 능력을 잘 보여준다.
  • Sunnet 3.7 릴리즈 이후 인프라와 모델 간의 차이점을 통해 경사면의 변화가 두드러졌다. 이는 E2B가 기술적 차별화를 통해 경쟁력을 확보하고 있음을 시사한다.
  • 많은 인프라가 애플리케이션의 발전 속도를 따라잡지 못하고 있으며, 이는 시장에서 새로운 투자 전략의 필요성을 강조한다.
  • LLMOS 회사들이 자체적으로 대규모 언어 모델을 직접 사용하기보다 인프라를 통해 다른 회사들이 이를 증강할 수 있도록 지원하고 있다. 이는 E2B가 협력적 생태계를 구축하고 있음을 보여준다.
  • GPT 래퍼로서, E2B는 새로운 모델로부터 모든 장점을 얻으며, 모델을 전환함으로써 새로운 시장 기회를 창출하고 있다. 이는 E2B의 혁신적 접근 방식을 강조한다.

11. 🌍 글로벌 확장과 지역 전략

  • 모델 전환의 용이성 증가: 사용자들이 다양한 모델을 많이 전환하고 있어, 특정 모델에 종속되지 않고 모델을 선택할 수 있는 유연성이 중요하다.
  • 클라우드 및 온-프레미스 배포: 사용자가 클라우드나 온-프레미스에서 솔루션을 배포하고자 하는 요구가 증가하고 있다.
  • 기술적 유연성: 쿠버네티스와 같은 유연한 기술 플랫폼을 제공하면서도 개발자 경험(DX)을 개선할 필요가 있다.
  • 명확한 사용 사례 제시: 초기 사용자 확보를 위해 명확하고 구체적인 사용 사례를 제시해야 하며, 이는 시장과 개발자 교육에 중요하다. 예를 들어, 코드 해석 기능을 제공하여 초기 사용자를 확보했다.
  • 개발자 교육의 중요성: AI 시장에서는 개발자에게 필요한 기능을 제시하고, 그들이 무엇을 구축할 수 있는지를 보여주는 것이 중요하다.
  • 유연성과 구체적 사용 사례의 균형: 플랫폼을 유연하게 유지하면서도 사용자가 쉽게 이해할 수 있는 구체적인 사용 사례를 제시해야 한다.
  • 일반적인 사용 사례로의 온보딩 어려움: 일반적인 사용 사례로 사용자들을 온보딩하는 것은 어렵다는 것을 경험을 통해 배웠다.

12. 💻 컴퓨팅 환경과 고객 사례

  • AI 엔지니어를 위한 플랫폼은 웹 개발자와 자바스크립트, 타입스크립트 환경에 맞춰져야 하며, 파이썬 사용자에게도 많은 사용이 있지만, 웹 개발자 수가 많아 LLM 사용을 쉽게 해야 합니다.
  • SDK 월간 다운로드 수는 자바스크립트 250,000회, 파이썬 500,000회로 파이썬이 두 배 정도 더 많습니다.
  • 코드 해석과 차트 생성에는 파이썬이 우세하지만, 앱 개발에는 자바스크립트가 우세하며, Svelte, Next.js, Vue.js 같은 프레임워크를 활용합니다.
  • AI 데이터 분석은 주로 파이썬 개발자가 담당하고, 초기 단계의 웹 및 제품 개발은 웹 개발자가 담당하는 경향이 있습니다.
  • 웹 컨테이너를 사용하면 브라우저에서 실행이 가능하고, 무료로 빠르게 사용할 수 있는 이점이 존재합니다.

13. 🔒 보안 모델과 클라우드 관리

  • AI 환경에서는 기존 도구가 아닌 AI에 특화된 가상 머신, 샌드박스, 또는 실행 환경이 필요합니다. 이는 클라우드 상에서 실행될 코드가 사전에 명확하지 않기 때문입니다.
  • AI 작업에서는 사전 빌드 및 배포가 아닌 즉석 실행이 이루어지며, 다양한 작업 부하(5초에서 5시간까지)에 빠르게 대응할 수 있어야 합니다.
  • 이로 인해 가격 모델도 변화하고 있으며, 사용자와 제공자 모두에게 적합한 가격 책정이 중요합니다.
  • 샌드박스는 클러스터 내에서 배치되며, 각 샌드박스는 완전히 격리되어야 하며, 이는 보안 모델에 큰 영향을 미칩니다.
  • 예상치 못한 코드 실행이 발생할 수 있어 기본적으로 신뢰할 수 없는 코드로 간주되어야 하며, 샌드박스 내에서 무슨 일이 일어나는지 알고 있어야 합니다.

14. ⚙️ 유연한 컴퓨팅과 사용자 경험

  • Hugging Face는 Open R1 모델에서 클러스터에 대한 접근 권한을 잃었을 때, 샌드박스를 종료하고 새로운 것을 얻는 데 150밀리초가 걸린다고 언급했습니다. 이는 시스템의 빠른 복구 능력을 강조합니다.
  • 현재 클라우드 제공업체와 다른 보안 및 컴퓨팅 모델이 필요하며, 초기 단계에서부터 이를 다르게 생각해야 한다고 제안합니다. 이는 클라우드 환경의 변화에 대한 적응을 요구합니다.
  • Python SDK로 코드를 생성할 수 있지만, Lua 또는 R 코드를 실행할 수 있으며, 이는 SDK의 런타임과 항상 일치하지 않음을 강조합니다. 이는 다양한 프로그래밍 언어의 지원을 통해 개발자의 편의성을 증가시킵니다.
  • 사용자들은 Python, C++, Fortran 등을 샌드박스 내에서 실행할 수 있으며, 이는 매우 범용적인 머신으로 리눅스에서 실행 가능한 모든 것을 지원합니다. 이는 개발자에게 다양한 환경을 제공합니다.
  • 샌드박스 내에서 서버를 시작하고 인터넷에서 접근 가능하게 만들 수 있으며, 모든 것을 빠르고 안전하게 만드는 것이 과제입니다. 이는 보안과 접근성의 균형을 맞추는 것을 목표로 합니다.
  • 인간 개발자와 LLM(대형 언어 모델)을 위한 두 가지 페르소나를 위해 설계하고 있으며, 이는 유연성과 관찰 가능성을 동시에 요구합니다. 이는 사용자 맞춤형 경험을 제공하려는 전략입니다.
  • 샌드박스 런타임 전환 없이 여러 언어로 작업을 진행할 수 있으며, 이는 클라우드 환경에서 더 많은 RAM이나 CPU를 제공하여 사용자가 필요한 것만 지불하도록 합니다. 이는 비용 효율성을 높이는 전략입니다.
  • LLM이 더 많은 작업을 수행함에 따라 매우 탄력적인 샌드박스를 유지하고 기능을 추가할 수 있으며, 최종적으로 LLM이 필요한 것을 스스로 결정할 수 있게 됩니다. 이는 자율적인 시스템 개발을 위한 기반을 마련합니다.

15. 🧮 가격 책정 전략과 인프라 비용

15.1. 가격 책정 전략

15.2. 인프라 비용

16. 🧾 청구 및 결제 시스템

  • 컴퓨팅, 스토리지, 네트워킹의 조합으로 모든 것을 분해할 수 있으며, 이 중 하나라도 가격 책정에 실패하면 무료로 제공하게 되어 남용당할 수 있습니다.
  • 네 번째 요소로 보안과 관련된 제어 영역이 있으며, 이는 독립적인 항목으로 비용이 부과됩니다.
  • HashiCorp의 사례를 통해 클라우드 인프라 사업에서의 모범 사례를 배우는 것이 중요합니다.
  • 수백 개의 기업이 동일한 문제를 겪었으며, 최선의 실무를 배우고 반복하지 않는 것이 중요합니다.
  • 청구 모델은 이미 여러 번 확립되었으며, 문제는 도입 속도입니다. 인프라 변경을 통해 데이터를 정확히 파악하는 것이 필요합니다.
  • Orb, Open Meter, Metronome과 같은 사용량 기반 청구 제공업체와 협력 중이며, Stripe의 사용량 기반 시스템은 다소 불완전했습니다.
  • 비핵심 제품에 대한 엔지니어링 리소스를 줄이고 외주를 고려하는 것이 좋습니다.
  • 청구 및 결제 시스템의 정확성을 보장하는 것은 중요하며, 실수는 되도록 피해야 합니다.

17. 💡 AI 시대의 경제적 가치

  • AI 도입에 따른 인프라 비용 구조는 여전히 과제이며, 특히 수익의 일정 부분을 가져가는 모델은 Stripe와 유사하지만, 그 비율이 높아 문제로 지적됨.
  • Netlify는 기존의 고정 요금제에서 사용 기반 요금제로 전환하며 인프라 자원을 많이 사용하는 고객과 적게 사용하는 고객에게 동일한 요금을 부과하지 않도록 함.
  • 사용 기반 과금 구조는 AI 시대에 맞춰 토큰 기반 가격 책정으로 발전할 가능성이 있으며, 이는 인프라 기업들이 결국 택해야 할 방향성으로 제안됨.
  • 수익이 기업의 평가와 직접적으로 연결되지만, 엔지니어들이 이를 개선하는 데 관심이 부족하여 문제로 지적됨.

18. 🤖 AI 에이전트의 시장 가치

  • 한 프로젝트의 가격 계획을 변경하는 작업은 매우 어려운 일로, 모든 것을 측정해야 하기 때문에 많은 엔지니어링 리소스가 필요함.
  • 가격 모델의 통합과 구현은 사업 모델을 정하는 것보다 많은 엔지니어링이 필요함.
  • 소프트 제한과 하드 제한에 대한 결정을 내리는 것이 어려움. 고객을 제한하거나 제한하지 않을 경우 모두 불만을 가질 수 있음.
  • 초기 스타트업의 경우 에이전트를 장시간 실행하면 비용이 증가할 수 있음. 이는 제품-시장 적합성과 반드시 상관관계가 있는 것은 아님.
  • 일부 AI 빌더는 토큰을 높은 마진으로, 일부는 낮은 마진으로 재판매함. 이로 인해 벤처 캐피탈 자금으로 고객을 지원하는 경우도 있음.

19. 🔀 분기와 병합 기술

  • 많은 사람들이 자신만의 키를 제공하는 솔루션을 요구하지만, 이는 실제로 그리 인기가 없다. OpenRouter의 Alex만이 이를 구현했고, 이는 개별 사용 사례에 적합하다.
  • 가격 측면에서 토큰의 긍정적 마진과 부정적 마진에 대한 논의가 있다. 비용 대비 제공 가치로 비교하는 것이 더 높은 가치로 평가된다.
  • 임무 작업의 가치를 인간 노동과 비교하는 경향이 있다. 오늘날 에이전트는 예측 불가능하고 신뢰성이 낮아 사전 가격 설정이 어렵다.
  • Replit의 시장 크레딧 시스템에 대한 기대가 있었으나, 실제로 구현은 어려운 것으로 보인다.

20. 🗂️ 체크포인트와 스냅샷 관리

  • 곧 출시될 포크 및 체크포인트 기능은 문제 해결을 병렬화합니다. 이를 통해 여러 에이전트가 동시에 다양한 경로를 시도할 수 있어 효율성이 증가합니다.
  • 메모리 지속성을 통해 전체 샌드박스를 일시 중지하고 나중에 재개할 수 있으며, 이는 최대 24시간 동안 실행 가능한 세션을 최대 한 달까지 유지할 수 있게 합니다.
  • 포크 및 체크포인트는 로컬 상태 문제를 해결하여 전체 세션을 재생할 필요 없이 특정 상태로 쉽게 돌아갈 수 있도록 지원합니다.

21. 🧰 프레임워크 개발과 통합

21.1. E2B 기반 툴킷 개발

21.2. AI 분야의 프레임워크 개발 도전

21.3. Lanktree의 인기

21.4. Mastra의 TypeScript 접근법

21.5. Composio의 툴킷 제공 방식

22. 🔗 툴과의 통합 및 상호운용성

  • 브라우저 기반 스테이지핸드는 프레임워크가 아니며, 에이전트의 행동 방식을 규정하지 않고 웹사이트를 탐색하기 위한 도구를 제공함. 이는 사용자 맞춤화가 가능하고 다양한 웹 애플리케이션에 적용할 수 있음.
  • 세 가지 API 방법: '행동', '관찰', 그리고 '무언가'가 추가됨. 각 방법은 특정한 웹 탐색 시나리오에 맞춰져 있어 다양한 개발 요구를 충족시킬 수 있음.
  • 2023년에는 많은 변화가 있어 안정적인 환경에서의 프레임워크 구축이 어려웠음. 이는 개발자가 안정적인 개발 환경을 찾기 어렵게 했으며, 툴의 호환성과 유연성을 강조하게 됨.
  • 채팅 기반의 상호작용은 줄어들고 있으며, 실시간 및 멀티모달 네이티브 기능을 포함하지 않은 프레임워크는 오래가지 못할 가능성이 높음. 이는 사용자 경험 향상을 위해 실시간 상호작용과 고급 기능 통합이 필요함을 시사함.
  • 에이전트 프레임워크는 스트리밍 상호작용과 추론을 포함하도록 조정이 필요함. 이는 더 복잡한 사용자 요구를 충족하기 위해 필수적임.
  • 개발 도구는 언어 모델이 더 스마트해질수록 더 적은 프롬프트 관리가 필요함. 이는 효율적인 개발 프로세스를 지원함.
  • RAMP의 뉴욕 컨퍼런스에서는 모델의 10,000배 개선에서 어떻게 이익을 얻을 수 있을지에 대한 논의가 있었음. 이는 혁신을 통해 큰 성과를 기대할 수 있음을 나타냄.

23. 🌎 글로벌 시장과 기술 혁신

  • MCP(Multi-Cloud Platform)에 대한 논의가 부족하여 더 많은 프롬프트와 리소스 사용이 필요합니다. 이는 MCP의 활용도를 높일 수 있는 기회로 작용할 수 있습니다.
  • E2B를 통해 원격 MCP를 호스팅하는 방법이 존재하지만 최적화되지 않았습니다. 더 효율적인 방법을 모색해야 합니다.
  • MCP는 서버 지향적이지만 프로토콜로 보는 것은 과장된 평가입니다. 이는 이메일 프로토콜과의 비교가 시기상조임을 시사합니다.
  • 현재 MCP 사용자는 명확하지 않으나, E2B의 MCP 서버를 레지스트리에 추가하는 사용자가 늘고 있어 사용자 기반이 확장되고 있음을 보여줍니다.
  • 고차원 MCP는 더 많은 유용성을 제공할 수 있으며, MCP에 대한 관심이 점차 증가하고 있습니다.

24. 🔍 AI 에이전트 연구와 사용 사례

  • MCP 환경에서 샌드박스를 생성하는 것은 개발자에게 유용할 수 있으며, 이는 안전하고 통제된 테스트 환경을 제공합니다.
  • 최종 사용자는 고급 기능을 필요로 할 수 있어서, MCP가 이러한 요구를 충족할 수 있는지를 검토해야 합니다.
  • 공동 생성 에이전트를 구축하거나 실행할 방법으로 MCP를 사용할 수 있으며, 이는 사용자 협업을 촉진합니다.
  • 현재 대부분의 MCP는 로컬에서 실행되며, 이는 데이터 보안과 성능에서 이점을 제공합니다. 그러나 원격 MCP 서버의 발전은 필요합니다.
  • 모든 개발 도구 회사는 MCP 전략을 수립해야 하며, 이는 미래의 기술 발전에 대응하는 데 필수적입니다.
  • API 중심 접근 방식이 바람직하며, 이는 시스템 통합과 유연성을 높이는 데 기여합니다. 이에 따라 MCP 클라이언트와 서버에 대한 명확한 전략적 구분이 필요합니다.
  • E2B와 같은 플랫폼은 백그라운드에서 에이전트가 인스턴스를 실행할 수 있도록 지원해야 하며, 이는 운영 효율성을 높입니다.
  • MCP 서버에는 강력한 인증 메커니즘이 필요하며, 이는 보안성을 강화하는 데 핵심적입니다.

25. 🖥️ 인간과 에이전트를 위한 웹 환경

  • API 중심의 접근 방식은 LLMs에 필수적이며, 이를 통해 대시보드 및 인프라 구축이 용이합니다. 이는 웹 개발자들에게 더 나은 사용자 경험을 제공할 수 있는 기회를 제공합니다.
  • OAuth 2.1 업데이트는 사용자와 에이전트 간의 명확한 구분을 가능하게 하며, 보안 및 인증 프로세스를 개선합니다. 이는 웹 서비스의 신뢰성과 안전성을 높이는 데 기여합니다.
  • 웹 크롤링 비율의 변화는 검색 엔진과 LLMs의 웹 페이지 접근 방식에 영향을 미칩니다. 예를 들어, Google은 2:1 비율로 페이지 크롤링 후 방문자를 보내지만, OpenAI는 250:1, Anthropic은 6000:1 비율을 보여, 각 기업의 데이터 수집 전략을 명확히 합니다.
  • Jeremy Howard의 llms.txt는 웹사이트를 LLM에 맞게 최적화하려는 시도를 나타내며, 이는 웹 개발자들이 LLM과의 상호작용을 고려하여 사이트를 설계할 필요가 있음을 시사합니다.
  • 인간과 에이전트 환경의 구분이 없다면 인터넷의 작동 방식이 비정상적으로 변할 수 있습니다. 따라서 두 환경을 명확히 구분하여 각각의 특성에 맞는 전략을 구현해야 합니다.

26. 📈 SF로의 이전과 현지화 전략

  • 에이전트는 인간적인 측면을 담당해야 한다는 점에서, 기술적 도구와의 차별화가 필요하다. 이는 고객 경험을 향상시키는 데 필수적이다.
  • 특별한 조치를 취할 필요가 없다는 것은 현지화 전략이 이미 효과적으로 시행되고 있음을 나타낸다.
  • 수익화가 유일한 목표라는 점은 비즈니스 전략에서 명확한 방향성을 제시한다.
  • 너무 많은 웹사이트가 광고 중심으로 운영된다는 점은 비즈니스 모델의 다변화 필요성을 시사한다.
  • 비트코인이 이를 해결할 수 있다는 의견은 새로운 기술의 도입이 기존 문제를 해결할 수 있음을 보여준다.
  • 새로운 것이 등장하면 기존의 것을 새로운 것으로 재구성하려는 경향이 있다는 것은 변화 관리의 중요성을 강조한다.
  • 개발자들은 명확한 구분을 선호하지만 실제 세계가 복잡하고 혼란스럽다는 점은 기술과 현실의 괴리를 인식하게 한다.
  • 모바일 시대에 m.yourdomain.com과 www.yourdomain.com이 있었고, 이제는 lm.yourdomain.com 같은 것이 생길 것이라는 점은 디지털 시대의 도메인 전략 변화에 대한 이해를 돕는다.

27. 🎯 E2B의 미래와 시장 전략

  • E2B의 주요 사용 사례로 AI 데이터 분석, 데이터 시각화, 코딩 에이전트, 생성 UI, 코드 생성 평가, 컴퓨터 사용이 있습니다.
  • 데이터 분석은 가장 인기 있는 사용 사례로, E2B의 시장에서 중요한 역할을 하고 있습니다.
  • 컴퓨터 사용은 아직 실험적이며, 더 많은 플랫폼 지원이 필요하지만, 많은 관심을 받고 있는 분야입니다.
  • Open R1 프로젝트에서 E2B는 코드 생성 강화 학습 단계에서 사용되며, 이로 인해 코드 생성의 효율성을 크게 높일 수 있습니다.
  • E2B는 다양한 AI 기반 도구와 통합하여 고객에게 맞춤형 솔루션을 제공하고, 시장에서의 경쟁력을 강화하고 있습니다.
  • 미래 전략으로는 플랫폼 확장과 더불어 다양한 산업 분야에 맞춤형 솔루션을 제공하는 것이 포함됩니다.
  • 특히, 실험적인 컴퓨터 사용 분야는 향후 기술 발전과 함께 시장 확대의 중요한 요소로 작용할 것입니다.

28. 💼 투자와 파트너십의 중요성

  • 훈련 단계에서 코드 문제를 제공하고 모델이 코드를 생성하고 실행해야 하며, 보상 함수는 솔루션의 좋고 나쁨을 평가합니다.
  • E2B 샌드박스를 사용하여 많은 샌드박스를 병렬로 실행할 수 있어, GPU 클러스터 사용 없이 비용 효율적으로 훈련할 수 있습니다.
  • 모델 훈련 초기 단계부터 AI 에이전트의 수명 주기에 적합한 사용 사례입니다.
  • HuggingFace와의 사례 연구가 웹사이트에 게시되어 있으며, 여러 기업이 이를 사용하여 모델을 구축하고 평가하고 있습니다.
  • E2B는 다양한 곳에서 모델 평가를 위해 사용되고 있으며, E2B 상에서 SweepBench 실행이 용이합니다.
  • 스타트업 및 연구 프로그램이 곧 출시될 예정이며, 이는 대학 및 연구자들이 활용할 수 있습니다.
  • 버클리의 LM Arena와 협력하여 AI 앱 생성 모델 비교를 수행하고 있습니다.
  • 투자자가 직접 코드 베이스의 버그를 수정하는 등의 부가 가치를 제공하고 있습니다.

29. 🏢 팀 확장과 글로벌 네트워크

  • GPU 활용은 데이터 분석 속도를 두 배로 증가시켜 대규모 AI 데이터 분석에 필수적입니다. 이는 특히 LLM의 소규모 기계 학습 모델 훈련에 유용하며, 개발자가 후방에서 관찰할 수 있는 환경을 제공합니다.
  • GPU 시장은 경쟁이 치열하며 가격 경쟁이 심하지만, 이를 통해 새로운 사용 사례를 창출할 수 있는 기회가 있습니다.
  • 향후 GPU를 활용한 클라우드 컴퓨팅 서비스 제공 계획이 있으며, 이는 AI가 앱을 구축하고 관리하는 방향으로 발전하고 있습니다.
  • 현재 많은 VC들이 초기에는 투자하지 않았으나, GPU 기반 데이터 분석의 필요성을 인식하면서 관심을 기울이고 있습니다.

30. 🌐 SF에서의 첨단 기술 허브로서의 역할

30.1. 이전에 대한 이유

30.2. 대면 상호작용의 가치

30.3. 문제 해결 접근 방식

31. 🔚 마무리 및 감사 인사

  • 프라하에 새로운 오피스를 설립하고 유럽 내 인재 채용을 시작함. 이는 현지에 있는 뛰어난 인재를 활용하기 위함.
  • 회사의 로드맵과 제품에 대한 명확한 이해가 생긴 후, 원격으로도 효과적인 인재 채용이 가능해짐.
  • 현재 채용 중인 직무는 분산 시스템 엔지니어, 플랫폼 엔지니어, AI 엔지니어, 어카운트 매니저, 고객 성공 엔지니어 등 다양한 직무가 포함됨.
  • 시장의 수요와 모멘텀이 증가하고 있어, 이를 바탕으로 회사의 성장을 가속화할 계획.
View Full Content
Upgrade to Plus to unlock complete episodes, key insights, and in-depth analysis
Starting at $5/month. Cancel anytime.