Aktuelle
Meldungen

Neues Forschungsprojekt von ATHENE: Disinformation and Corona (DisCo)

21.05.2021

Fake News zur Pandemie besser erkennen

Über die Corona-Pandemie sind weltweit Desinformationen und Fake News im Umlauf. Vor allem auf Social-Media-Plattformen wie Facebook, Twitter und YouTube teilen Menschen ungeprüft Nachrichten, sodass diese sich rasant verbreiten. "Wir bekämpfen nicht nur eine Pandemie, sondern auch eine Info-Demie", sagte Tedros Adhanom Ghebreyesus, Generaldirektor der WHO. Forschende des Fraunhofer SIT wollen im Projekt DisCo aus dem ATHENE-Forschungsbereich Secure Digital Transformation in Health Care (SeDiTraH) dieser Herausforderung begegnen.

Dabei gehen sie auf Aspekte der "Textforensik" und der "Multimedia-Forensik" ein.

Untersuchungen zu Textforensik

Fake News rund um das neuartige Coronavirus verbreiten sich derzeit noch schneller als das Virus selbst. Eine händische Überprüfung auf den Wahrheitsgehalt aller Nachrichten ist schier nicht mehr möglich. Um maschinelle Lernverfahren zu trainieren, welche automatisch Fake News erkennen sollen, werden große Datenmengen benötigt. Textforensik-Expert*innen des Projektteams erstellen daher einen Datensatz mit Nachrichtentexten, welcher sowohl Falsch- als auch legitime Nachrichten enthält. Der Korpus soll sowohl für eigene Forschungszwecke als auch für die Forschungs­gemeinschaft für wissenschaftliche Zwecke im Kampf gegen Falschmeldungen eingesetzt werden.

Darüber hinaus entwickelt das Projektteam einen Demonstrator, der aufzeigt, wie die Technik beispielsweise Journalist*innen helfen kann, prüfwürdige Textstellen automatisch zu erkennen und im Text hervorzuheben. Oft ist es wichtig, sich zunächst einen Überblick über das Thema des Artikels zu verschaffen. Aus diesem Grund soll das Tool den Nachrichtentext zunächst zusammenfassen. Hierfür wird ein „Text Summarization“-Algorithmus verwendet, der die wichtigsten oder relevantesten Informationen innerhalb des ursprünglichen Inhalts extrahiert und dann zu einer kürzeren Version verdichtet. Zusätzlich wird der Bereich „Check-Worthiness“-Detection erforscht, das heißt maschinelle Lerntechniken aus dem Bereich Natural Language Processing (NLP), die vorhersagen, welche Sätze für die Faktenprüfung priorisiert werden sollten. Der Demonstrator soll folglich nicht nur in der Lage sein, Nachrichtentexte zusammenzufassen, sondern auch relevante Aussagen im Text hervorzuheben. Damit soll erforscht werden, wie Tech­no­logien dazu beitragen können, den Prozess der Erkennung von gefälschten Aussagen in Nachrichtentexten zu erleichtern. 

Untersuchungen zu Multimedia-Forensik

Auch die Verwendung von Bild- und Videomaterial spielt bei Fake News in vielen Beispielen eine Rolle: Oft wird älteres Bildmaterial aus seinem Zusammenhang gerissen und (unverändert) im Kontext der Corona-Pandemie neu verwendet, z. B. durch eine falsche Information in der Bildbeschriftung oder im Begleitartikel. Gelegentlich wird auch Bildmaterial durch gezielte Retusche innerhalb des Bildes verändert, um eine Falschnachricht scheinbar zu belegen bzw. um Leser*innen zu beeinflussen.

Eine nützliche Methode, beide Arten der Beeinflussung zu erkennen, ist die sogenannte inverse Bildersuche: einige der bekannten Suchmaschinen (etwa Google, Bing, Yandex, Baidu) und spezialisierte Anbieter (z. B. Tineye) ermöglichen es nämlich, nicht nur durch Stichwörter als Input, sondern auch durch Input-Bilder im Internet nach weiteren Quellen mit den gleichen Bildern zu suchen. Die Echtheit eines fraglichen Bildes in einer Nachricht kann hiermit durch Vergleich mit gegebenenfalls verfügbaren alternativen ver­trauens­würdigen Quellen des gleichen Bildes überprüft werden. Retuschierte oder aus dem ursprünglichen Kontext gerissene Bilder können somit erkannt werden.

Ein Ziel von DisCo ist es, die (Wieder-) Erkennungsraten dieser Bildsuchmaschinen zu beurteilen und mit­ei­nan­der zu vergleichen. Hierzu entsteht zuerst ein Korpus mit typischen Beispielbildern aus Corona-Fake News. Eine Herausforderung für die Bildersuche ist, dass in Fake News wiederverwendete Bilder zusätzlich verändert werden, z. B. durch Skalierung, Ausschnittbildung, Montage mit anderen Bildern oder Hinzufügen von Beschriftungen, Emojis usw.. Ihr Einfluss auf die (Wieder-) Erkennungsraten der Vergleichsalgorithmen wird untersucht. Außerdem werden ggf. nützliche Vorverarbeitungsschritte abgeleitet, die die Erkennungsrate erhöhen können, wenn Benutzer*innen verdächtiges Bildmaterial untersuchen.

Ansprechpartner:
Prof. Martin Steinebach
Tel.: +49 6151 869-349
E-Mail

Zur News-Übersicht