Neues selbstüberwachtes Lernmodell steigert Bodenanalysen mit Infrarotspektroskopie
Ein neu entwickeltes selbstüberwachtes Machine‑Learning‑Framework (SSML) kombiniert Multi‑Fidelity‑Learning mit latenten Raum‑Embeddings, um Bodenanalysen mittels Infrarotspektroskopie zu verbessern.
Das Modell wurde zunächst mit einer großen MIR‑Spektrenbibliothek vortrainiert. Durch einen Variational Autoencoder (VAE) wurden die unbeschrifteten Spektren in einen komprimierten latenten Raum überführt, wobei Scan‑Wiederholungen zur Datenaugmentation genutzt wurden.
Um die Vorteile der umfangreichen MIR‑Bibliothek mit einem kostengünstigen, tragbaren NIR‑Scanner zu verbinden, wurde der bereits trainierte MIR‑Decoder eingefroren und in einen NIR‑Encoder integriert. Auf Basis eines kleineren Datensatzes mit gepaarten NIR‑ und MIR‑Spektren lernte das System die Abbildung zwischen beiden Wellenlängenbereichen.
Anschließend wurden weitere ML‑Modelle trainiert, die die Original‑Spektren, die aus dem NIR‑zu‑MIR‑Mapping generierten Spektren und die latenten Embeddings nutzen, um neun Bodenparameter vorherzusagen.
Die Leistung wurde unabhängig von den Trainingsdaten des KSSL‑Datensatzes anhand eines Gold‑Standard‑Testsets und gängiger Regressionsmetriken bewertet. Im Vergleich zu Basismodellen erzielte das SSML‑Framework gleichwertige oder bessere Genauigkeiten bei allen Bodenparametern. Die Vorhersagen aus dem NIR‑zu‑MIR‑Mapping unterschieden sich zwar von den Original‑MIR‑Spektren, lagen jedoch nahe oder über den Leistungen der Basismodelle.
Diese Ergebnisse zeigen, dass selbstüberwachtes Lernen in Kombination mit Multi‑Fidelity‑Embeddings eine vielversprechende Methode darstellt, um präzise Bodenanalysen mit erschwinglichen, tragbaren Infrarot‑Scannern durchzuführen.