Google präsentiert TUMIX: Mehragenten-Testzeit mit Tool-Mischung
Google Cloud AI Research hat gemeinsam mit Forschern aus MIT, Harvard und Google DeepMind ein neues Testzeit-Framework namens TUMIX (Tool‑Use Mixture) vorgestellt. Durch die Kombination von 12 bis 15 Agenten, die jeweils unterschiedliche Werkzeuge einsetzen – von reinem Text, über Code‑Generierung bis hin zu Such- und geführten Varianten – kann das System die Leistung von Gemini‑2.5 Pro auf dem Hard‑Learning‑Evaluation‑Benchmark (HLE) um beeindruckende 34,1 % steigern.