Qwen3-Next가 MTP(Multi-Token Prediction) 기술로 80B 모델 성능을 3B 수준으로 최적화하며 추론 속도와 메모리 효율성을 혁신했습니다.
Entities referenced in this topic (8)
Suggested: