Neuro-Symbolische Ontologie verbessert Multi-Intent-Verständnis bei mobilen Agenten
Ein neues neuro-symbolisches Framework verspricht, mobile KI-Agenten bei der Erkennung mehrerer Intentionen deutlich zu verbessern. Durch die Kombination einer strukturierten Intent-Ontologie mit kompakten Sprachmodellen wird die Symbolik sowohl in den Eingaben als auch in den Ausgaben eingebettet. Das System nutzt Retrieval-augmented Prompting, Logit-Biasing und optionale Klassifikationsköpfe, um die semantische Struktur der Intentionen zu verstärken.
Zur Bewertung wurde ein neues Metrikmodell namens Semantic Intent Similarity (SIS) entwickelt. SIS berücksichtigt die hierarchische Tiefe der Ontologie und misst die semantische Nähe zwischen Intentionen, selbst wenn die Wortwahl unterschiedlich ist. Diese Herangehensweise liefert ein genaueres Bild der tatsächlichen Verständniseffizienz als herkömmliche Genauigkeitsmaße.
In Experimenten mit einer Auswahl ambigerer Dialoge aus MultiWOZ 2.3, ergänzt durch GPT‑o3‑Oracle‑Labels, zeigte ein 3‑Billionen‑Parameter‑Llama-Modell mit Ontologie‑Augmentation eine Genauigkeit von 85 % – nahezu gleichwertig zu GPT‑4 (90 %) – bei einem Bruchteil des Energie- und Speicherverbrauchs. Qualitative Analysen bestätigten, dass die Ontologie‑unterstützten Modelle klarere, eindeutigere Multi‑Intent‑Interpretationen liefern.
Die Ergebnisse unterstreichen, dass symbolische Ausrichtung ein wirkungsvolles Mittel ist, um präzises und effizientes Natural‑Language‑Understanding auf mobilen Geräten zu ermöglichen.