Menta: Kleinmodell für mentale Gesundheitsvorhersage direkt auf dem Gerät
Ein neues, leichtgewichtiges Sprachmodell namens Menta wurde entwickelt, um psychische Gesundheitszustände direkt auf mobilen Geräten vorherzusagen. Durch die Kombination von moderner Machine‑Learning‑Technik und einer gezielten Feinabstimmung kann Menta komplexe Aufgaben wie Depression, Stress und Suizidalität aus Social‑Media‑Texten erkennen.
Psychische Erkrankungen betreffen weltweit Hundert Millionen Menschen, doch die frühzeitige Erkennung bleibt oft schwierig. Große Sprachmodelle (LLMs) haben zwar vielversprechende Ergebnisse gezeigt, sind jedoch zu ressourcenintensiv, um sie praktisch auf Smartphones einzusetzen. Kleine Sprachmodelle (SLMs) bieten hier einen vielversprechenden Kompromiss, sind aber bisher kaum für die Analyse von Social‑Media‑Daten genutzt worden.
Menta wurde speziell für diese Herausforderung konzipiert. Das Modell wird gleichzeitig für sechs Klassifikationsaufgaben trainiert und nutzt dabei ein LoRA‑basiertes Framework, eine Cross‑Dataset‑Strategie sowie einen auf balancierte Genauigkeit ausgerichteten Verlust. Diese Kombination ermöglicht eine effiziente Nutzung begrenzter Rechenressourcen, ohne die Genauigkeit zu opfern.
In umfangreichen Benchmarks übertrifft Menta neun führende SLM‑Baselines um durchschnittlich 15,2 % in allen Aufgaben. Darüber hinaus erzielt es höhere Genauigkeiten bei Depression‑ und Stress‑Erkennung als 13‑Billionen‑Parameter‑LLMs, obwohl es rund 3,25‑mal kleiner ist. Diese Leistungssteigerung zeigt, dass ein schlankes Modell nicht zwangsläufig an Genauigkeit verlieren muss.
Ein weiterer Meilenstein ist die Echtzeit‑Bereitstellung von Menta auf einem iPhone 15 Pro Max. Das Modell benötigt lediglich etwa 3 GB RAM und kann sofort auf dem Gerät laufen, was die Privatsphäre der Nutzer schützt und eine sofortige Analyse ermöglicht. Der komplette Code ist öffentlich zugänglich unter https://xxue752-nz.github.io/menta-project/.