Biodiversität erkennen
Die Biodiversitätsforschung leidet an einem Dilemma: Immer weniger Menschen sind überhaupt in der Lage, Diversität zu erkennen. Das zeigt sich schon im Kleinen: Schulkinder können heutzutage kaum noch verschiedene Baumsorten von einander unterscheiden. Ahorn, Buche, Hain(!)buche? Fehlanzeige. Und bei den Großen? Fördermittel flossen in den vergangenen Jahrzehnten nur in Projekte, die wirtschaftlichen Nutzen versprachen. Projekte, die sich mit Artenvielfalt, oder gar mit der Ausbildung von Artenkennern befassten, fristeten ein Nischendasein. Die Naturschutzakademie des Landes NRW konstatiert: "In den vergangenen Jahren konnte nicht nur im Allgemeinwissen der Bevölkerung, sondern auch im Bereich der beruflichen Qualifizierung ein starker Rückgang der Artenkenntnis beobachtet werden." Um das zu ändern, wurde ein bundesweites Programm mit Trainings- und Prüfungslehrgängen entwickelt, das schlussendlich in die Zertifizierung mit Bronze- Silber- oder Goldstatus für einzelne Organismengruppen führt.
Ein Programm für Kieselalgenkenntnis sucht man jedoch vergeblich. Im Gegensatz zu hunderten von Heilpflanzen- oder Vogelbüchern gibt es kaum zeitgenössische Literatur über diese Algengruppe. Die wichtigsten Bestimmungsbücher stammen aus dem Ende - teilweise sogar aus Anfang bis Mitte des vorigen Jahrhunderts. Zu bekommen sind diese Bücher ausschließlich antiquarisch, und das teilweise zu astronomischen Preisen. Die 4 Bände des "Krammer", die man für die Bestimmung der Süßwasserkieselalgen braucht, sind unter 100€ nicht zu bekommen - pro Buch! Die zwei Bände von Hustedt in Rabenhorsts Kryptogamenflora von 1930 kosten zusammen in der Regel mehr als 700€. (Allerdings gibt es die in schlechter Qualität zum Download, wenn man genug im Netz sucht. Copyright ist ja schon lange erloschen.)
Dementsprechend gibt es eine kleine Gruppe von Wissenschaftler:innen, die über Artenkenntnis verfügen, die sie zur Gewässerklassifizierung benötigen, aber der breite Fundus an halbwissenden Amateurinnen und Amateuren, auf den sich die Forschung an dieser wunderschönen Algengruppe in vergangenen Jahrhunderten stützen konnte, aus dem sie ihre Talente rekrutieren konnte, ist verschwunden.
Ist KI eine Lösung?
Die Lösung für fehlende Artenkenntnis sind heutzutage zahlreiche Apps wie flora incognita oder obs identify, die mit Hilfe von künstlicher Intelligenz fotografierte Organismen identifizieren können. Und dabei leisten diese Apps in der Regel einen sehr guten Job. Natürlich funktionieren solche Apps nur bei Organismen, die man fotografieren kann. Bei allem was schnell wegläuft, kriecht oder fliegt, sind dem natürliche Grenzen gesetzt. Und nur eine verschwindende Minderheit fotografiert Lebewesen unter dem Mikroskop, so dass sich für diesen Bereich meines Wissens noch keine KI-lösung etabliert hat.
Aber was nicht ist, kann ja noch werden, und so habe ich mit tatkräftiger Hilfe von Claude auf meinem PC eine lokale KI auf der Basis von TensorFlow/Keras installiert und ca 450 durchbestimmte Kieselalgenbilder von rund 70 Arten an sie verfüttert. Für ein richtiges KI-Training ist das viel zu wenig, aber es sollte schon einmal eine grobe Richtung zeigen.
Wenn man dieser Kieselalgen-KI (zukünftig KI-selalge genannt) weitere Bilder gelernter Arten vorlegt, sollte sie ja wohl in der Lage sein, zumindest tendenziell in die richtige Richtung zu weisen. Für einen Proof-of-Concept hätte das gereicht.
Das Ergebnis war ernüchternd: Ganz egal, welches Foto man der KI vorlegte, für sie war alles Navicula cuspidata, und zwar mit einer Wahrscheinlichkeit um 3,4%. Kein Wunder, in den Trainingsdaten waren viele Bilder von Navicula cuspidata gewesen, und zwar 13 von 400 Bildern = 3,4%.
Claude war der Meinung, das liege an der zu geringen Zahl von Trainingsbildern. Also habe ich Claude zu "Klau.de" umfunktioniert (Mein Sohn würde das einen "Dadjoke" nennen und mit den Augen rollen) und mir 600 weitere Trainingsbilder der bereits in der DB vorhandenen Arten aus dem Internet geborgt. Da meine KI noch nicht am Start war, musste ich die dann noch einmal von Hand durchbestimmen, denn nur bei ca 20% der Fotos war die Artangabe korrekt. Bei den anderen Fotos stand der Artname nur zufällig auf der gleichen Internetseite, bezog sich aber nicht auf das Foto.
Auch danach war das Ergebnis niederschmetternd. KI-selalge bestimmte nun jedes Fotos wie folgt:
📷 Bild: Cymbella affinis Fokus 1_20251009_HYa100AHf(1p-0,0185).jpg
──────────────────────────────────────────────────────────────────────
🔴 1. Cymbella aspera 3.26%
🔴 2. Gyrosigma acuminatum 3.14%
🔴 3. Meridion circulare 3.02%
🔴 4. Rhoicosphenia abbreviata 2.83%
🔴 5. Epithemia adnata 2.81%
⚠️ Unsichere Vorhersage - bitte manuell überprüfen!
Das entsprach immer noch der Häufigkeit der verschiedenen Arten in den Trainingsdaten, nur dass Navicula cuspidata von Cymbella aspera überholt worden war.
Anscheinend waren die spezifischen Unterschiede zwischen den Bildern zu gering, um die vortrainierte Google-KI noch zum Nachdenken stimulieren zu können. Claude hat daraufhin die Fixierung der vortreinierten KI-Neuronen gelockert, so dass mehrere Neuronen
Daraufhin zeigte sich eine leichte Verbesserung. Die KI riet immer noch immer das gleiche, aber die Prozentzahlen verschoben sich von Art zu Art geringfügig. Einmal war Cymbella apera bei 5,64%, das andere Mal bei 5,28%. Falsch war es in beiden Fällen.
Claude ließ sich daraufhin meine Trainingsdaten vorlegen und stellt daraufhin fest, dass Mikroskopbilder von Kieselalgen relativ flau sind und einen geringen Kontrast zum Hintergrund haben. Wer schon einmal in ein Mikroskop geschaut hat, der kann das nur bestätigen. Wenn's einfach wäre, dann könnte es ja jede/r.
Claudes Lösungsansatz: Alle Trainingsbilder wurden einem standardisierten Preprocessing unterworfen, das:
- Entfernt Maßstäbe - Schwarze Balken und Text werden erkannt und entfernt
- Normalisiert Beleuchtung - CLAHE für gleichmäßige Helligkeit
- Segmentiert - Trennt Kieselalge vom Hintergrund
- Zentriert & Croppt - Fokus auf die Kieselalge
- Rotiert - Richtet horizontal aus
- Standardisiert - Alle Bilder → 224x224 mit Padding
In der Theorie klang das gut. Die Ergebnisse waren es jedoch nicht.
Statt nur Maßstabsbalken zu entfernen, hat die Normalisierung auch die Kieselalgen beschnitten, und durch die Verkleinerung auf 224 x 224 Pixeln wurden die meisten bestimmungsrelevanten Bildinformationen entfernt. Es sieht so aus, als ob eine Kieselalgen-KI noch etwas auf sich warten lassen wird.


Kommentare powered by CComment