AI 추론(inference) 클라우드 플랫폼 딥인프라(DeepInfra)가 시리즈 B 라운드에서 1억 700만 달러를 유치했다. 조르주 하릭(Georges Harik)과 500 글로벌(500 Global)이 공동 리드했으며 엔비디아(Nvidia)와 삼성넥스트(Samsung Next) 그리고 슈퍼마이크로(Supermicro) 등이 참여했다. 딥인프라는 앤트로픽(Anthropic)과 OpenAI 그리고 오픈소스 모델을 포함한 다양한 AI 모델에 대한 고처리량 저지연 추론 서비스를 제공하며 직접 운영 대비 더 낮은 비용으로 AI를 프로덕션 환경에 배포할 수 있게 한다.
추론은 이미 훈련된 모델을 실제로 실행하여 결과를 생성하는 과정으로 AI 산업이 모델 개발 단계에서 대규모 배포 단계로 전환됨에 따라 핵심 인프라로 부상하고 있다. 딥인프라는 시리즈 A 이후 처리 토큰 양이 25배 증가하여 현재 주당 약 5조 개의 토큰을 처리하고 있으며 2026년 초 이후 매출이 3배로 성장했다. 이번 자금은 글로벌 컴퓨팅 용량 확장과 개발자 도구 고도화 그리고 차세대 오픈소스 및 에이전틱(agentic) 모델 지원에 투입될 예정이다.
에이전틱 AI 분야에 2분기에만 426억 달러가 투입되고 NIST가 딥시크(DeepSeek) V4 프로를 평가하며 저비용 AI 모델의 경쟁력을 확인한 상황에서 추론 인프라의 중요성은 더욱 커지고 있다. AI 모델이 다양해지고 에이전트 기반 워크플로가 확산될수록 특정 하드웨어와 네트워킹 그리고 추론 최적화 소프트웨어를 통합한 전문 인프라에 대한 수요는 계속 증가할 전망이다. 추론이 AI 밸류체인에서 차지하는 비중이 갈수록 커지는 만큼 이 영역의 투자 경쟁도 본격화되고 있다.