NNGPT: KI-gestützte AutoML-Revolution für Computer Vision
Mit dem Open‑Source‑Framework NNGPT wird ein großes Sprachmodell (LLM) zu einem selbstverbessernden AutoML‑Motor für neuronale Netze, vor allem im Bereich der Computer Vision. Durch die kontinuierliche Generierung neuer Modelle erweitert NNGPT sein eigenes Datenset und ermöglicht ein geschlosseneres Feedback‑System aus Erzeugung, Bewertung und Selbstverbesserung.
Der Ansatz integriert fünf LLM‑basierte Pipelines in einem einheitlichen Workflow: Zero‑Shot‑Architektur‑Synthese, Hyperparameter‑Optimierung (HPO), Code‑bewusste Genauigkeits‑ und Early‑Stop‑Vorhersage, retrieval‑augmentierte Synthese von scope‑closed PyTorch‑Blöcken (NN‑RAG) sowie Reinforcement Learning. Auf dem LEMUR‑Datensatz, einem geprüften Korpus mit reproduzierbaren Metriken, erzeugt NNGPT aus einem einzigen Prompt die Netzwerkarchitektur, das Pre‑Processing‑Code und die Hyperparameter, führt sie end‑to‑end aus und lernt aus den Ergebnissen.
Dank eines PyTorch‑Adapters bleibt das System framework‑agnostisch. NN‑RAG erreicht 73 % Ausführbarkeit bei 1 289 Ziel‑Netzwerken, 3‑Shot‑Prompting steigert die Genauigkeit auf gängigen Datensätzen, und hash‑basierte Duplikaterkennung spart hunderte Ausführungen. Eine One‑Shot‑Vorhersage deckt die Leistung von suchbasiertem AutoML ab und reduziert die Notwendigkeit zahlreicher Versuche. Auf LEMUR erzielt die HPO 0,60 RMSE, besser als Optuna (0,64), während der code‑bewusste Predictor 0,14 RMSE und Pearson‑r = 0,78 liefert. Bereits über 5 000 validierte Modelle wurden generiert, was NNGPT als leistungsfähiges AutoML‑Werkzeug etabliert.