Nano Banana Pro: Das neue Bildgenerierungsmodell mit KI-gestützter Recherche

Simon Willison – Blog Original ≈1 Min. Lesezeit
Anzeige

Nach dem Release von Gemini 3 Pro am Dienstag folgt heute Nano Banana Pro, auch bekannt als Gemini 3 Pro Image. In den wenigen Tagen, in denen ich Vorabzugang hatte, hat sich das Modell als ausgesprochen leistungsfähig erwiesen.

Das System ist darauf ausgelegt, die komplexesten Arbeitsabläufe zu bewältigen. Durch fortgeschrittenes logisches Denken unterstützt es mehrstufige Erstellungs- und Bearbeitungsszenarien und liefert dabei hochauflösende Ergebnisse in 1 K, 2 K und sogar 4 K.

Besonders hervorzuheben sind die Fähigkeiten zur Textdarstellung: Das Modell erzeugt leserliche, stilisierte Texte für Infografiken, Menüs, Diagramme und Marketingmaterialien. Zusätzlich kann es Google‑Search nutzen, um Fakten zu verifizieren und Bilder auf Basis aktueller Daten zu generieren – etwa Wetterkarten, Börsenkurse oder aktuelle Ereignisse.

Ein innovatives „Thinking‑Mode“ lässt das Modell Zwischenschritte in Form von „Thought Images“ erstellen, die im Backend sichtbar, aber nicht kostenpflichtig sind. Diese helfen, die Komposition zu verfeinern, bevor das finale Bild ausgegeben wird.

Mit bis zu 14 Referenzbildern lässt sich die Bildkomposition weiter anpassen: bis zu sechs hochpräzise Objekt‑Bilder, fünf Personenbilder zur Charakterkonsistenz und zusätzliche Anweisungen für detaillierte Bildaufforderungen. Kurz nach der Veröffentlichung hat Max Woolf einen umfassenden Leitfaden zum Prompting von Nano Banana veröffentlicht, den ich bereits gegen das neue Modell getestet habe.

Ähnliche Artikel