
Cursor Composer 2: Frontier-Level Coding zum halben Preis
Cursor hat Composer 2 veröffentlicht – ein KI-Coding-Modell, das auf Terminal-Bench 2.0 und SWE-bench die bisher besten Ergebnisse liefert. Wir werfen einen Blick auf die Benchmarks, Preise und was das für Entwickler bedeutet.
Inhaltsverzeichnis
Cursor hat Composer 2 veröffentlicht – und die Benchmarks sprechen eine klare Sprache: Das neue Modell performt auf fast allen Metriken deutlich besser als sein Vorgänger und erreicht tatsächlich Frontier-Niveau beim Coding.
Die Zahlen
| Modell | CursorBench | Terminal-Bench 2.0 | SWE-bench Multilingual |
|---|---|---|---|
| Composer 2 | 61,3 | 61,7 | 73,7 |
| Composer 1.5 | 44,2 | 47,9 | 65,9 |
| Composer 1 | 38,0 | 40,0 | 56,9 |
Besonders beeindruckend: Terminal-Bench 2.0 (ein Agent-Evaluations-Benchmark für Terminal-Nutzung) und SWE-bench Multilingual (die Fähigkeit, Bugs in Codebasen zu finden und zu fixen).
Preise, die Sinn ergeben
| Variante | Input | Output |
|---|---|---|
| Standard | $0.50/M Tokens | $2.50/M Tokens |
| Fast (default) | $1.50/M Tokens | $7.50/M Tokens |
Zum Vergleich: Andere Fast-Modelle kosten mehr. Composer 2 Fast ist als Standard-Option gesetzt.
Was macht Composer 2 besser?
- Erste Continued Pretraining Run – eine deutlich stärkere Basis für das Reinforcement Learning
- Trainiert auf Long-Horizon Tasks – kann Herausforderungen mit hunderten von Actions lösen
- Agentic Workflows – ab jetzt auch mit Cloud Sandboxes, Automations und MCP-Integrationen
Neue Integrationen
- JetBrains IDEs via ACP (Agent Client Protocol) – Cursor funktioniert jetzt in IntelliJ, PyCharm, WebStorm
- 30+ neue Plugins: Atlassian, Datadog, GitLab, Glean, Hugging Face, monday.com, PlanetScale
- Automations: Cloud Agents, die auf Schedules oder Events (Slack, Linear, GitHub, PagerDuty) reagieren
Für wen ist Composer 2 interessant?
Wenn du bereits Cursor nutzt, ist Composer 2 ein no-brainer. Die Verbesserungen gegenüber Composer 1.5 sind substantial, und die Preise bleiben fair. Besonders spannend für Teams, die mit komplexen Codebasen arbeiten und einen Agenten brauchen, der langfristige Tasks durchziehen kann.
Quellen: Cursor Changelog, Cursor Composer 2 Blog, CursorBench
Vorheriger Artikel
Claude Sonnet 4.6 im Test: Anthropics neue Frontier-KI für Entwickler



