Claude Opus 4.5: Anthropic setzt neue Maßstäbe für Code- und Agentenmodelle

Simon Willison – Blog Original ≈2 Min. Lesezeit
Anzeige

Anthropic hat heute das neue Modell Claude Opus 4.5 vorgestellt und bezeichnet es als „bestes Modell der Welt für Coding, Agenten und Computeranwendungen“. Damit will das Unternehmen die Führung im Bereich der Programmier-KI zurückgewinnen, nachdem OpenAI mit GPT‑5.1‑Codex‑Max und Google mit Gemini 3 in den letzten Tagen ebenfalls neue Modelle veröffentlicht haben.

Opus 4.5 bietet einen 200.000‑Token‑Kontext und eine Ausgabegrenze von 64.000 Tokens – dieselben Werte wie bei Sonnet. Das Modell verfügt über einen „zuverlässigen Wissensstopp“ im März 2025, während Sonnet 4.5 im Januar und Haiku 4.5 im Februar endet. Diese längere Aktualität macht Opus besonders attraktiv für Entwickler, die auf aktuelle Informationen angewiesen sind.

Die Preisgestaltung ist ein entscheidender Vorteil: Für Eingaben kostet das Modell nur 5 USD pro Million Tokens, für Ausgaben 25 USD pro Million Tokens. Das ist deutlich günstiger als die vorherige Opus‑Version (15 USD/75 USD) und bleibt im Vergleich zu GPT‑5.1‑Familie (1,25 USD/10 USD) sowie Gemini 3 Pro (2 USD/12 USD bzw. 4 USD/18 USD bei >200.000 Tokens) wettbewerbsfähig. Sonnet 4.5 liegt bei 3 USD/15 USD und Haiku 4.5 bei 4 USD/20 USD.

Während des Wochenendes hatte ich die Möglichkeit, Opus 4.5 in der Claude‑Code‑Umgebung zu testen. Das Modell half mir, die neue Alpha‑Version von sqlite‑utils zu entwickeln, wobei es 20 Commits, 39 geänderte Dateien, 2.022 Zeilen hinzugefügt und 1.173 Zeilen gelöscht hat – alles innerhalb von zwei Tagen. Die Leistungsfähigkeit des Modells war beeindruckend und zeigte deutlich, wie viel Arbeit es in kurzer Zeit bewältigen kann.

Leider endete mein Preview-Zugang am Sonntagabend, sodass ich noch offene Aufgaben nicht abschließen konnte. Ich wechselte daraufhin zurück zu Claude Sonnet 4.5 und konnte dort die gleiche Produktivität beibehalten. Das lässt darauf schließen, dass Opus 4.5 zwar ein großer Fortschritt ist, aber eine vollständige Bewertung erst möglich ist, wenn die Testphase länger andauert.

Ähnliche Artikel