Neuartiges Verfahren: Informatiker erweitert das Wissen von Computern

Computer beantworten Fragen, führen Konversation oder beraten Kunden bei Problemen. Immer mehr IT-Anwendungen greifen auf strukturiertes Wissen zurück. Das Wissen muss dazu in einer Weise aufbereitet sein, die ein Computer verarbeiten kann – in sogenannten Wissensdatenbanken. Die sind das Fachgebiet des Informatikers Simon Razniewski. Am Saarbrücker Max-Planck-Institut für Informatik hat er als erster ein Verfahren entwickelt, mit dem die Wissensvorräte um einen entscheidenden, bisher vernachlässigten Aspekt erweitert werden können. Dazu wird er von der Deutschen Forschungsgemeinschaft (DFG) mit 312.000 Euro gefördert.

Viele alltägliche Anwendungen nutzen Wissensdatenbanken: Suchmaschinen beantworten Fragen direkt, anstatt auf andere Webseiten zu verweisen. Internetshops listen die Eigenschaften von Produkten auf. Reiseportale zeigen, welche Leistungen in einer Buchung enthalten sind. Egal in welchem Kontext Wissensdatenbanken eingesetzt werden, eines haben sie gemeinsam: Die darin enthaltenen Informationen werden vornehmlich in sogenannten positiven Statements strukturiert, also in Aussagen die beschreiben, dass etwas zutrifft. Zum Beispiel: ‚Saarbrücken ist die Hauptstadt des Saarlandes‘, ‚Das Handy unterstützt 5G‘, ‚Jedes Zimmer im Hotel hat ein Bad‘.

Ihr Gegenteil, die sogenannten negativen Statements, werden von aktuellen Wissensdatenbanken ausgeblendet. Sie enthalten zwar ebenfalls wertvolle Informationen, sind jedoch aufgrund ihrer schieren Anzahl schwierig zu erfassen: „Nahezu unendlich viele Aussagen treffen nicht auf etwas zu. Die Herausforderung besteht darin zu ermitteln, welche dieser nicht-zutreffenden Informationen in eine Wissensdatenbank aufgenommen werden sollten“, sagt Simon Razniewski, promovierter Informatiker und Leiter des Forschungsbereiches ‚Knowledge Base Construction and Quality‘ in der Abteilung ‚Databases and Information Systems‘ am Saarbrücker Max-Planck-Institut für Informatik. Mit seiner Forschungsgruppe am Saarland Informatics Campus hat er nun als erster ein Verfahren entwickelt, das automatisiert negatives Wissen für Wissensdatenbanken in verschiedenen Einsatzgebieten erzeugen kann.

Dargestellt am Beispiel Steven Hawking, läuft das Verfahren folgendermaßen ab: Zuerst werden Vergleichsfälle ermittelt, die eine prominente Eigenschaft mit dem Suchobjekt teilen. Im Beispiel: Physiker.Diese Vergleichsfälle nennen die Forscher ‚Peers‘. Nun wird anhand der ‚Peers‘ eine Auswahl an positiven Annahmen über die Ausgangs-Entität erzeugt. Da die Physiker AlbertEinstein und Richard Feynman den Nobelpreis gewonnen haben, könnte die Annahme StevenHawkinghat den Nobelpreis gewonnen, getroffen werden. Im Anschluss werden die neuen Annahmen mit den bereits vorhandenen Informationen über das Ausgangsobjekt in der Wissensdatenbank abgeglichen. Trifft eine Aussage auf einen ‚Peer‘, jedoch nicht auf das Suchobjekt zu, schließen die Forscher, dass es sich dabei um ein negatives Statement für das Suchobjekt handelt – also Steven Hawking hat nie den Nobelpreis gewonnen. Um die Aussagekraft der erzeugten negativen Statements zu bewerten, werden sie anhand verschiedener Parameter sortiert, zum Beispiel, wie oft sie in der Peer-Gruppe vorgekommen sind.

Als ein mögliches Anwendungsgebiet ihrer neuen Methode sehen die Forscher Empfehlungs-Systeme, wie sie in Internetshops oder auf Reiseportalen eingesetzt werden. „Bucht man online ein Hotel oder kauft ein Handy, könnte unser Ansatz verwandte Produkte miteinander vergleichen und zeigen, wie sie sich unterschieden. Also, dass es in Hotel A beispielsweise keinen Aufzug gibt, oder dass an Handy B der Kopfhöreranschluss fehlt“, sagt Simon Razniewski. „Das ist ein viel komfortabler und informativer, als wenn man diese Informationen selbst aus einer langen Liste von positiven Aussagen ableiten muss", ergänzt Raznieswki. In Zukunft möchte seine Forschungsgruppe den Ansatz verfeinern, um nuanciertere negative Aussagen erzeugen und implizite negative Aussagen erkennen zu können.

Förderung:
Die Deutsche Forschungsgemeinschaft (DFG) fördert das Projekt unter dem Titel „Webskalierendes negatives Wissen“ über die nächsten drei Jahre mit 312.000 Euro. Details unter https://gepris.dfg.de/gepris/projekt/453095897

Mehr Informationen:
https://www.akbc.ws/2020/assets/pdfs/pSLmyZKaS.pdf
http://people.mpi-inf.mpg.de/~srazniew/
https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/#c13511

Redaktion:
Philipp Zapf-Schramm
Kompetenzzentrum Informatik Saarland
Saarland Informatics Campus
Telefon: +49 681 302-70741
E-Mail: pzapf@mmci.uni-saarland.de

Die Öffentlichkeitsarbeit am Saarland Informatics Campus wird unterstützt durch das Kompetenzzentrum Informatik Saarland, gefördert aus Mitteln des Europäischen Fonds für regionale Entwicklung (EFRE) und Mitteln der Staatskanzlei Saarland.