KI-Modelle entschlüsseln verschlüsselte Logik – Logit Lens zeigt Durchbruch
Mit der wachsenden Leistungsfähigkeit großer Sprachmodelle steigt die Sorge, dass diese Systeme eigene Denkprozesse entwickeln könnten, die für Menschen nicht nachvollziehbar sind. Um zu prüfen, ob aktuelle Interpretati…