DeepSeek AI präsentiert DeepSeek‑OCR 2: Neuer OCR‑Ansatz mit kausaler Bildfluss‑Encoder
DeepSeek AI hat die neue Version DeepSeek‑OCR 2 veröffentlicht, ein Open‑Source-System für optische Zeichenerkennung und Dokumentverständnis. Das Tool nutzt einen neu strukturierten Vision‑Encoder, der Seiten in einer kausalen Reihenfolge verarbeitet – ähnlich wie Menschen komplexe Dokumente ablesen.
Im Mittelpunkt steht DeepEncoder V2, ein transformerbasiertes Sprachmodell, das eine 2‑D‑Seite in eine 1‑D‑Sequenz umwandelt. Durch diese Transformation kann das System die Layout‑Informationen besser erfassen und die Inhalte kontextuell verknüpfen.
DeepSeek‑OCR 2 bietet damit eine leistungsstarke, frei verfügbare Lösung für die Analyse von Dokumenten, die sowohl die Genauigkeit als auch die Effizienz von OCR‑Workflows deutlich steigert.