Microsoft präsentiert Maia 200: KI-Accelerator für Azure‑Datencenter
Microsoft hat den Maia 200 vorgestellt, einen eigenen KI‑Accelerator, der speziell für die Inferenz in Azure‑Datencentern entwickelt wurde. Durch die Kombination von FP4/FP8‑Berechnungen, einer dichten On‑Chip‑Speicherhierarchie und einem Ethernet‑basierten Skalierungs‑Fabric soll die Kosten für die Token‑Generierung bei großen Sprachmodellen und anderen Rechenaufgaben deutlich gesenkt werden.