SWE-bench Verified는 소프트웨어 엔지니어링 작업을 평가하는 벤치마크입니다. Claude Haiku 4.5는 이 벤치마크에서 Sonnet 4 대비 2배 빠른 처리 속도를 달성했습니다.
Services that support this use case
Suggested: