Kimi가 개발한 대규모 언어 모델로, 1조 파라미터 중 특정 작업에만 320억을 활성화하는 효율적인 아키텍처를 특징으로 합니다. SWE 벤치마크에서 65.8% 점수를 기록하며 GPT-4.1을 능가하는 성능을 보였습니다.
Suggested: