JustHTML: KI-gestützte Python-Bibliothek überzeugt mit 100 % Testabdeckung

Simon Willison – Blog Original ≈1 Min. Lesezeit
Anzeige

Bei einem Blick auf die neueste Python-Bibliothek zum HTML‑Parsing, JustHTML, hat der Entwickler Emil Stenström ein Werk vorgestellt, das sowohl praktisch als auch ein Lehrstück für KI‑unterstützte Programmierung ist. Die Bibliothek ist komplett in Python geschrieben, ohne C‑Erweiterungen, was sie besonders leicht in ungewöhnliche Python‑Umgebungen wie Pyodide einbindet.

Ein Highlight ist die vollständige Übereinstimmung mit der offiziellen html5lib-tests-Suite: JustHTML besteht alle über 9 200 Tests, die von Browserherstellern verwendet werden. Damit erreicht die Bibliothek eine 100 % Testabdeckung – ein Meilenstein, den man in der Web‑Parsing‑Branche selten sieht.

Darüber hinaus bietet JustHTML CSS‑Selektor‑Abfragen, ein Feature, das der Entwickler seit Jahren in eigenen Projekten nutzt. Die Implementierung umfasst nur rund 3 000 Zeilen Code, während die Tests etwa 11 000 Zeilen umfassen. Diese kompakte Größe macht die Bibliothek leicht verständlich und wartbar.

Um die Funktionsweise zu prüfen, setzte der Entwickler auf Claude Code for Web auf seinem Handy und ließ die KI ein Pyodide‑basiertes Tool erstellen. Das Ergebnis zeigte, dass die Kernfunktionen wie angekündigt arbeiten – und dass ein Großteil des Codes von Sprachmodellen generiert wurde.

JustHTML demonstriert eindrucksvoll, wie KI die Entwicklung von Software beschleunigen kann, ohne dabei die Qualität oder die Testabdeckung zu vernachlässigen. Es bleibt ein spannendes Beispiel für die Zukunft der KI‑unterstützten Programmierung.

Ähnliche Artikel