Gemini 2.5 Deep Think 모델이 34.8% 성능을 기록한 평가 기준으로, 복잡한 추론 능력을 측정하는 벤치마크입니다.
Services that support this use case
Suggested: