Fara-7B: Effizienter Computer-Agent mit selbstgenerierten Daten
Die Entwicklung von Computer‑Use‑Agents (CUAs) war lange Zeit durch das Fehlen großer, qualitativ hochwertiger Datensätze eingeschränkt, die zeigen, wie Menschen mit einem Computer interagieren. Um dieses Hindernis zu überwinden, hat ein Forschungsteam ein neues System namens FaraGen vorgestellt, das synthetische Daten für mehrstufige Web‑Aufgaben erzeugt.
FaraGen kann aus häufig genutzten Websites vielfältige Aufgaben vorschlagen, mehrere Lösungsversuche generieren und nur die erfolgreichen Pfade mithilfe mehrerer Prüfer filtern. Das Ergebnis ist ein hohes Durchsatz‑ und Diversitätsniveau: Überprüfte Trajektorien werden zu einem Preis von etwa einem Dollar pro Beispiel produziert.
Mit diesen Daten wurde das kompakte Modell Fara-7B trainiert, das Computerbildschirme ausschließlich über Screenshots wahrnimmt und Aktionen über vorhergesagte Koordinaten ausführt. Trotz seiner geringen Größe übertrifft Fara-7B andere Modelle gleicher Größe auf Benchmarks wie WebVoyager, Online‑Mind2Web und dem neu eingeführten WebTailBench, das bislang unterrepräsentierte Web‑Aufgaben besser abbildet. Darüber hinaus steht Fara-7B in der Leistungsfähigkeit nahe an viel größeren Spitzenmodellen, was die Bedeutung skalierbarer Datengenerierungssysteme für effiziente Agenten unterstreicht.
Die Entwickler machen Fara-7B als Open‑Weight‑Modell auf Microsoft Foundry und HuggingFace frei zugänglich und veröffentlichen gleichzeitig den WebTailBench‑Benchmark, um die Forschung in diesem Bereich weiter voranzutreiben.