Google präsentiert Gemini 3 Flash: Schnell, günstig und leistungsstark
Google hat heute Gemini 3 Flash vorgestellt, das neueste Modell der „Flash“-Reihe. Es kombiniert die starken multimodalen, Programmier- und Agentenfunktionen von Gemini 3 Pro mit einer Leistung, die die Vorgängerversion Gemini 2.5 Pro in vielen Benchmarks übertrifft – und das zu weniger als einem Viertel der Kosten.
Gemini 3 Flash akzeptiert dieselben Eingabeformate wie die Pro‑Version: Text, Bild, Video, Audio und PDF. Es liefert ausschließlich Textausgaben, kann bis zu 1 048 576 Eingabetoken und 65 536 Ausgabetoken verarbeiten und hat denselben Wissens‑Cutoff vom Januar 2025 wie die gesamte Gemini‑2.5‑Serie.
Die Preisstruktur ist besonders attraktiv: Für Tokenlängen bis zu 200 000 kostet das Modell nur ein Viertel des Preises von Gemini 3 Pro, bei mehr als 200 000 Token sogar ein Achtel. Im Vergleich zu den vorherigen Flash‑Modellen liegt der Preis bei $0,50 pro Million Eingabetoken und $3,00 pro Million Ausgabetoken – etwas höher als bei Gemini 2.5 Flash, aber immer noch deutlich günstiger als die Pro‑Version.
Google hebt zudem die höheren Rate‑Limits hervor, die Gemini 3 Flash schneller und skalierbarer machen. Für Entwickler steht das Modell bereits über die llm‑gemini‑Bibliothek zur Verfügung. Mit dem Befehl llm install -U llm-gemini und anschließendem Setzen des API‑Schlüssels kann man das Modell sofort testen, z. B. mit llm -m gemini-3-flash-preview "Generate an SVG of a pelican".
Der Autor hat die neue Version der Bibliothek (llm‑gemini 0.28) veröffentlicht und bietet auf seiner Website llm-prices.com einen detaillierten Preisvergleich an. Damit ist Gemini 3 Flash eine leistungsstarke, kostengünstige Option für alle, die auf schnelle und vielseitige KI‑Modelle angewiesen sind.