AI 모델의 코드 생성 및 테스트 자동화 능력을 평가하는 벤치마크로, Claude Opus 4.5가 1위를 기록하며 우수성을 입증했습니다.
Services that solve this problem
Suggested: