
News
Kann KI helfen, Sequenzdatenbanken besser zu erschließen?
Am 25. und 26. Juni 2026 findet am IOW der erste Workshop einer NFDI4Biodiversity-Netzwerkaktivität zum Thema „KI-Tools zur Metadatenextraktion in Sequenzdatenbanken“ statt. Rund 30 Fachleute aus Forschungsdatenmanagement, Wissenschaft und Wirtschaft aus 17 Institutionen in Deutschland und darüber hinaus kommen zusammen, um gemeinsam zu diskutieren, wie Metadaten in Sequenzdatenarchiven mittels Künstlicher Intelligenz (KI) künftig besser auffindbar, vergleichbar und für spezifische Forschungsfragen nutzbar gemacht werden können.
Sequenzdaten – digitale Informationen zu genetischem Material – sind heute eine zentrale Ressource für die Biodiversitätsforschung. Weltweit werden sie in großem Umfang erzeugt und in öffentlichen Archiven bereitgestellt. Ihre wissenschaftliche Verwertbarkeit durch nachnutzende Forschende hängt jedoch entscheidend davon ab, ob sie mit aussagekräftigen, standardisierten und maschinenlesbaren Metadaten, also beschreibenden Zusatzinformationen, verknüpft sind. Häufig liegen solche Angaben – etwa zu Probenherkunft, Umweltbedingungen, Untersuchungsmethoden oder Forschungskontext – nur unvollständig oder in schwer auswertbaren Freitexten vor. KI-gestützte Verfahren sollen nun neue Möglichkeiten eröffnen, solche Informationen systematisch zu erschließen, zu strukturieren und bestehende Datensätze nachhaltig aufzuwerten.
Der heute am IOW gestartete Workshop bringt alle Stakeholder aus dem Bereich Sequenzdatenforschung an einen Tisch: Forschende, die diese Daten produzieren und solche, die sie nachnutzen wollen, Fachleute aus dem Forschungsdatenmanagement sowie KI-Expertinnen und -Experten, die auf Datenextraktion spezialisiert sind. Im Mittelpunkt stehen die Fragen, welche Werkzeuge und Ansätze bereits existieren, welche Entwicklungen künftig benötigt werden und wie Herausforderungen wie Qualitätssicherung, Kompatibilität und langfristige Implementierung gemeinsam adressiert werden können. Geladene Vortragende aus Wismar, Leipzig und Hinxton, UK, geben zusätzliche Impulse für die Diskussion.
Organisiert und ausgerichtet wird der Workshop von der IOW-Forscherin und Bioinformatik-Expertin Christiane Hassenrück. „Wir wollen mit diesem Workshop nicht nur über einzelne KI-Werkzeuge sprechen, sondern den Startpunkt für eine koordinierte Entwicklung setzen“, sagt Hassenrück. „Wenn es gelingt, Expertise aus Datenmanagement, KI-Entwicklung und Forschungspraxis zusammenzubringen, können wir Sequenzdatenarchive langfristig deutlich besser nutzbar machen – und damit auch die Biodiversitätsforschung stärken.“
Der Workshop ist Auftakt einer Reihe von Aktivitäten im Rahmen der NFDI4Biodiversity-Netzwerkaktivität zur Metadatenextraktion in Sequenzdatenbanken. Über das kommende Jahr sollen die Ergebnisse dieses Treffens sowie zweier weiterer Workshops in einem White Paper zusammengeführt werden. Ziel ist es, gemeinsame Standards, strategische Entwicklungsbedarfe und konkrete Wege für eine nachhaltige Metadatenanreicherung in Sequenzdatenbanken zu formulieren.
NFDI4Biodiversity ein Konsortium, das sich unter dem Dach gemeinnützigen Vereins der Nationalen Forschungsdateninfrastruktur NFDI (www.nfdi.de) formiert hat und sich der gemeinschaftlichen Nutzung von Biodiversitäts- und Umweltdaten widmet. Das Netzwerk bündelt fachliche und technische Kompetenzen von rund 60 Partnerinstitutionen, um Daten für Forschung, Naturschutz und Politik besser zugänglich, verlässlich und nachnutzbar zu machen.
Leitung / Ansprechpartnerinnen der NFDI4Biodiversity-Netzwerkaktivität „KI-Tools zur Metadatenextraktion in Sequenzdatenbanken“:
Prof. Dr. Birgit Gemeinholzer, Universität Kassel: Birgit.Gemeinholzer@uni-kassel.de
Dr. Christiane Hassenrück, Leibniz-Institut für Ostseeforschung Warnemünde: christiane.hassenrueck@iow.de
Dr. Stephanie Jurburg, Helmholtz-Zentrum für Umweltforschung: stephanie.jurburg@ufz.de