Neue Methode schützt vor Rückschlüsse auf versteckte Prompts in Sprachmodellen
Die neueste Forschung auf arXiv beleuchtet ein ernstzunehmendes Risiko: Sprachmodell-Inversion (LMI). Dabei können aus den Ausgaben eines Modells die ursprünglichen Eingabeaufforderungen rekonstruiert werden, was sowohl…