Artikel

  • Andrea Hildebrandt und Daniel Berg vor einem Bücherregal.

    Andrea Hildebrandt und Daniel Berg sind überzeugt davon, dass von der Veröffentlichung von Forschungsrohdaten viele profitieren.

„Mit gutem Beispiel voran”

Der Exzellenzcluster Hearing4all hat Studiendaten von fast 600 Probandinnen und Probanden öffentlich zugänglich gemacht. Andrea Hildebrandt und Daniel Berg sprechen über die Bedeutung von Open Science – auch für Patienten.

Der Exzellenzcluster Hearing4all hat mit dem Oldenburg Hearing Health Repository Studiendaten von fast 600 Probandinnen und Probanden öffentlich zugänglich gemacht. Im Interview sprechen die psychologische Methodikerin Prof. Dr. Andrea Hildebrandt und der Forschungsdatenmanager Dr. Daniel Berg über die Bedeutung von Open Science – nicht nur für die Wissenschaft, sondern perspektivisch auch für einzelne Patientinnen und Patienten.

 

Die Daten, die Sie veröffentlicht haben, haben Forschende in den Jahren 2013 bis 2015 im Rahmen einer Studie des Exzellenzclusters am Hörzentrum erfasst. Worüber geben sie Auskunft?

Andrea Hildebrandt: Die Datensätze beinhalten Ergebnisse verschiedener audiologischer Tests, die vom einfachen Hörtest bis zum komplexen Sprachverständlichkeitstest unter dem Einfluss von Störgeräuschen reichen. Dass Daten zu so vielen verschiedenen Tests vorliegen, ist schon ein Alleinstellungsmerkmal. Das gilt insbesondere auch, weil neben den Testergebnissen zahlreiche subjektive Informationen zu den Probandinnen und Probanden zur Verfügung stehen. Nicht nur sozioökonomische Daten etwa zu ihrer Bildung und ihrem Einkommen, sondern auch Daten zu ihrer jeweiligen Hörgesundheit, Gesundheit allgemein, Kognition und Selbsteinschätzungsdaten zu ihrem Hörvermögen. Letztere sind gerade bei der Anpassung für Hörgeräte wichtig.

Es gibt also zahlreiche Informationen zu einzelnen Personen, trotzdem sind die Daten anonym. Wie funktioniert das?

Daniel Berg: Es gibt verschiedene statistische Methoden, mit denen man sicherstellen kann, dass niemand anhand der Daten sozusagen rückwärts herausfinden kann, auf welche konkrete Person sie sich beziehen. Wir haben bei diesem Datensatz für eine sogenannte k-Anonymität von 5 gesorgt. Das bedeutet, dass egal, wie man die Informationen des Datensatzes in Beziehung zueinander bringt, sie immer auf mindestens fünf Personen zutreffen. Gibt es in der Studie zum Beispiel einen einzigen 100-Jährigen würde man nicht das genaue Alter der Studienteilnehmenden angeben, sondern sie in Gruppen wie etwa „über 85 Jahre“ zusammenfassen, so dass immer mindestens fünf Personen in dieser Gruppe sind.

Wer kann jetzt wie von den veröffentlichten Daten profitieren?

Hildebrandt: Die Daten sind natürlich zuallererst für Hörforschende auf der ganzen Welt interessant. Beim Clustersymposium in Hannover hat kürzlich zum Beispiel eine Gruppe aus Italien, die an einem Hörtestverfahren arbeitet, Interesse bekundet. Die italienischen Kolleginnen und Kollegen brauchen möglichst viele Daten für Kreuzvalidierungen, eine Methode, mit der sich die Genauigkeit von Vorhersagemodellen testen lässt.

Berg: Aber auch für die Versorgungsforschung, die die Kranken- und Gesundheitsversorgung in den Blick nimmt, sind die Daten hochrelevant, schließlich lassen sich hier verschiedenste Zusammenhänge nachvollziehen: Wann haben Menschen mit welchem Bildungsstand und welchem Einkommen ein Hörgerät bekommen? Es sind unzählige Verknüpfungsvarianten denkbar.

Hildebrandt: Immer relevanter wird die Bedeutung von Big Data-Analysen für die Präzisionsmedizin. Um Fortschritte zu erzielen, sind frei nutzbare Bestände mit vielen Patientendaten dafür von großem Wert.

Inwiefern?

Hildebrandt: Sie werden benötigt, um sogenannte Entscheidungsunterstützungssysteme zu trainieren. Studien haben gezeigt, dass in vielen Bereichen die besten Diagnosen zustande kommen, wenn Expertinnen und Experten mit all ihrer ärztlichen Erfahrung zusammenarbeiten mit sogenannten „decision support systems“. Das sind auf Künstlicher Intelligenz basierende Systeme, die allein auf objektiver Datenbasis Entscheidungshilfen leisten und menschlichen Bias „intuitiver Statistik“ reduzieren. Damit solche Systeme tatsächlich bei der Diagnostik helfen können, müssen sie mit einer Vielzahl von Daten trainiert werden. Dann kann davon auch der einzelne Patient oder die einzelne Patientin profitieren – besonders dann, wenn sie gesundheitliche Probleme haben, die vielleicht ungewöhnlicher sind und seltener auftreten.

Berg: Wer an einer weitverbreiteten Form von Schwerhörigkeit leidet, wird schon heute mit großer Wahrscheinlichkeit vom Hals-Nasen-Ohren-Arzt und Akustiker sehr gut versorgt. Seltene Krankheiten können hingegen „durchs Raster fallen“, da sie eventuell weniger präsent sind und so gegebenenfalls erst spät diagnostiziert werden.. Wenn es aber Systeme gibt, die in Patientendaten bestimmte Muster erkennen, weil sie anhand von Daten unzähliger anderer Personen trainiert wurden, können sie auch Hinweise zu möglichen Ursachen geben, an die die Ärztin oder der Arzt zu diesem Zeitpunkt noch gar nicht denken.

Ist es aktuell noch eher außergewöhnlich oder schon die Regel, dass wissenschaftliche Rohdaten der Öffentlichkeit zur Verfügung gestellt werden?

Hildebrandt: Man kann schon sagen, dass das noch etwas Besonderes ist. Es gibt aber immer mehr Forschende, die Open Science vorantreiben – schon allein, um in ihrer Arbeit nicht ständig Daten neu erheben zu müssen, die an anderer Stelle vielleicht schon einmal erarbeitet wurden. Open Science macht Wissenschaft also effektiver und liefert gleichzeitig das Datenmaterial, das wie beschrieben im Bereich Big Data benötigt wird. Man könnte also sagen, wir gehen mit gutem Beispiel voran – natürlich auch weil wir auf viele Nachahmer hoffen, von deren Daten wir wiederum profitieren können.

Berg: Deshalb arbeiten wir auch führend in einer europaweiten Gruppe mit, deren Ziel es ist, Formate von audiologischen Daten zu standardisieren, damit sie überhaupt für andere nutzbar und auch mit anderen Datenbasen verknüpfbar sind. Das heißt ganz konkret, dass wir anderen Forschenden nicht nur unsere Daten zur Verfügung stellen wollen, sondern auch die Tools, um sie zu benutzen.