알리바바가 출시한 멀티모달 AI 모델로, 3D 공간 추론과 2시간 분량의 동영상 분석이 가능합니다. 256K 토큰 기본 지원과 32개 언어 OCR 정확도를 달성했으며, Gemini 2.5 Pro 및 GPT-5 대비 시각적 인식 성능에서 우수성을 입증했습니다.
Suggested: