Forschung arXiv – cs.AI

SAM 3: Das neue Segmentierungsmodell erkennt Objekte per Konzept-Prompt

Das Segment Anything Model 3 (SAM 3) ist ein einheitliches System, das Objekte in Bildern und Videos erkennt, segmentiert und verfolgt – alles anhand von Konzept-Prompts. Diese Prompts können kurze Nomenphrasen wie „gel…

≈1 Min. Lesezeit Originalquelle
Kernaussagen
Das nimmst du aus dem Beitrag mit
  • Das Segment Anything Model 3 (SAM 3) ist ein einheitliches System, das Objekte in Bildern und Videos erkennt, segmentiert und verfolgt – alles anhand von Konzept-Prompts.
  • Diese Prompts können kurze Nomenphrasen wie „gelber Schulbus“, Bildbeispiele oder eine Kombination aus beidem sein.
  • Mit Promptable Concept Segmentation (PCS) liefert SAM 3 für jedes passende Konzept eine Segmentierungsmaske und eine eindeutige Identität aller Instanzen.

Das Segment Anything Model 3 (SAM 3) ist ein einheitliches System, das Objekte in Bildern und Videos erkennt, segmentiert und verfolgt – alles anhand von Konzept-Prompts. Diese Prompts können kurze Nomenphrasen wie „gelber Schulbus“, Bildbeispiele oder eine Kombination aus beidem sein.

Mit Promptable Concept Segmentation (PCS) liefert SAM 3 für jedes passende Konzept eine Segmentierungsmaske und eine eindeutige Identität aller Instanzen. Zur Unterstützung von PCS hat das Team einen skalierbaren Daten‑Engine aufgebaut, der ein hochwertiges Datenset mit 4 Millionen einzigartigen Konzept‑Labels erzeugt, inklusive schwieriger negativer Beispiele.

Die Architektur von SAM 3 kombiniert einen bildbasierten Detektor und einen speicherbasierten Video‑Tracker, die beide dieselbe Backbone‑Netzwerk‑Architektur nutzen. Durch die Trennung von Erkennung und Lokalisierung mittels eines Presence‑Heads wird die Detektionsgenauigkeit deutlich erhöht.

In Tests übertrifft SAM 3 bestehende Systeme in der Promptable Concept Segmentation sowohl bei Bildern als auch bei Videos um das Doppelte. Außerdem verbessert es die bisherigen SAM‑Fähigkeiten bei visuellen Segmentierungsaufgaben. Das Modell sowie das neue Segment Anything with Concepts (SA‑Co) Benchmark‑Set werden als Open‑Source veröffentlicht.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Was veraendert sich praktisch?
Ist das eher Signal, Produkt oder nur kurzfristiger Hype?
Begriffe zum Einordnen

Kontext ohne Glossar-Suche

Segment Anything Model 3
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Promptable Concept Segmentation
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Backbone-Netzwerk
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
arXiv – cs.AI
Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.
Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen