Das Open Knowledge Interface (OKI) unterstützt als virtueller Assistent bei Recherchetätigkeiten sowie bei der Strukturierung und Organisation wissenschaftlicher Arbeiten. Dabei berücksichtigt OKI folgende Faktoren:

Es wird zunehmend mobil und verteilt gearbeitet, z. B. an mehreren Projekten gleichzeitig.

Die Benutzerfreundlichkeit spielt eine sehr hohe Rolle und ein spürbarer Nutzen muss relativ kurzfristig eintreten.

Einsteiger verfügen meist noch nicht über viel Erfahrung mit dem wissenschaftlichen Arbeiten und benötigen eine dementsprechende Unterstützung.

Das Projekt OKI ist an der Hochschule für Wirtschaft und Recht in Berlin angesiedelt und wird durch das Bundesministerium für Bildung und Forschung gefördert.

Open Access

Open Access Publikationen (OA) ermöglichen einen freien Zugang zu Wissen. Die Menge an OA wächst stetig und somit nimmt auch das Informationsangebot immer weiter zu. Dies ist begrüßenswert, stellt die Nutzer von OA aber auch zunehmend vor ein Auswahlproblem. War die Auswahl noch vor einigen Jahren durch die Zeitschriften begrenzt, die man abonniert hatte oder die man zumindest kannte und zu beschaffen in der Lage war, so ist aktuell von einem sehr viel größeren Angebot an (niedergeschriebenem) Wissen auszugehen. Häufig  können aufgrund zeitlicher und sonstiger Restriktionen gar nicht mehr alle relevanten Quellen gesichtet werden. Es ist daher anzunehmen, dass es zu einer zufälligen und somit suboptimalen Auswahl von Publikationen kommt und dass das Potenzial von OA für eine bessere Wissensversorgung nicht voll wirksam werden kann. Allerdings kann dieser Potenzialvergeudung durch eine Unterstützung bei der Auswahl und Nutzung relevanter Publikationen entgegengewirkt werden.

Wissenschaftliche Open Access Publikationen stellen aktuell den Schwerpunkt von OKI dar. Perspektivisch existiert aber noch wesentlich mehr offenes, interessantes und maschinell nutzbares Wissen, wie beispielsweise Open Data und Open Maps.

OKI als Anwendung

Die hier vorgestellte Lösung basiert auf einem virtuellen Assistenten, der die Recherche in OA nahtlos in die Wissensnutzung integriert. Ein Beispiel wäre das Schreiben einer Masterthesis, bei der die Sichtung und Auswertung von Literatur ein integraler Bestandteil ist. Die Literaturarbeit ist jedoch kein Selbstzweck, sondern dient dem Zweck, eine fundierte Arbeit zu verfassen.

Der Name Open Knowledge Interface (OKI) bringt die Schnittstellenfunktion des Werkzeuges zu einer offenen und damit prinzipiell grenzenlosen Wissensbasis zum Ausdruck. OKI besteht aus einem Chat als Client und einem Server mit verschiedenen Komponenten. Der Server enthält insbesondere Schnittstellen zu relevanten Wissensquellen, z. B. dem Digital Open Access Journals Verzeichnis, eine KI-basierte Zugriffslogik und vorgefertigte Projektkontexte, z. B. zum Bearbeiten einer Bachelorthesis sowie eine Komponente zur Definition eigener Kontexte, in denen die Wissensnutzung erfolgen soll. Die Client-Komponente ist als Chat konzipiert und kann von einer Vielzahl von Endgeräten: Smartphone, Tablet, Desktop genutzt werden. Die natürlich-sprachliche Interaktion ermöglicht eine einfache Nutzung, die auch mobiles und verteiltes Arbeiten unterstützt. OKI unterscheidet zwischen reaktiven Chats und aktiven Chats.

Reaktive Chats

Der Nutzer startet OKI über sein jeweiliges Chat-Programm. Da er sich zuvor angemeldet hat, kennt der Server (Komponente 1) seinen Namen und seinen aktuellen Status, z. B. ob er gerade an seiner Masterthesis arbeitet. OKI eröffnet dann einen reaktiven Dialog (Komponente 3) und wartet, was der Nutzer möchte.

Der Nutzer schreibt freitextlich seine Anfrage. Diese wird durch OKI einer Absicht (intent) zugeordnet (Komponente 2). Die Natural Language Processing (NLP) Komponente basiert auf Verfahren des maschinellen Lernens und erlaubt mit zunehmender Nutzung eine immer bessere Intent-Ableitung, würde aber ggf. nachfragen, um die Absichten des Nutzers in Erfahrung zu bringen.

Die reaktive Dialogsteuerung führt den Dialog fort und fragt die notwendigen Parameter ab. Der Nutzer antwortet und OKI erkennt mithilfe einer intelligenten Funktion (Komponente 8), dass die Antwort auf mehrere Arten ausgelegt werden kann. Dazu nutzt OKI insbesondere Wissen, das in Open Access Quellen gespeichert ist (Komponente 12).

Bei der Dialoggestaltung wird der Nutzer so weit wie möglich durch vorgefertigte Antwortalternativen geführt. Prinzipiell kann der Nutzer aber auch freien Text eingeben, der dann allerdings mithilfe der NLP Komponente ausgewertet werden muss.

Sämtliche reaktive Dialoge basieren auf Dialogtemplates, die nicht fest programmiert sind, sondern mithilfe einer Administrationsoberfläche angelegt und verändert werden können (Komponente 11).

Das Nutzerverhalten wird auf zwei Arten ausgewertet (Komponente 7). Zum einen werden die Präferenzen des einzelnen Nutzers gespeichert, z. B. ob dieser lieber längere Zeit am Stück arbeitet oder lieber zeitlich verteilt. Diese Informationen können dabei helfen, zukünftige Dialoge mit diesem Nutzer zu verbessern. Zum anderen werden die Nutzungsdaten auch zusammenhängend mit den Nutzungsdaten anderer Nutzer analysiert. So können Dialoge generell verbessert werden, auch wenn noch keine Informationen über den konkreten Nutzer vorliegen (siehe auch Datenschutz und Datensicherheit). Im Anschluss an den hier gezeigten Ausschnitt könnte OKI z. B. ein Projekt anlegen, das die Recherche in OA unterstützt und strukturiert.

Aktive Chats

OKI weiß durch regelmäßige Überprüfung mithilfe eines Cronjobs (Komponente 9), dass dem Nutzer ein noch offenes Projekt zugeordnet ist (Komponente 6). Also sucht OKI regelmäßig, z. B. täglich mithilfe des Cronjobs und den angebundenen OA-Quellen nach neuer Literatur zu dem Projektthema und kann dann aktiv einen Dialog starten (Komponente 5). Dem Nutzer wird in diesem Beispiel angeboten, ihm den Abstract anzuzeigen oder vorzulesen. Das Vorlesen geschieht mithilfe der Stimmausgabe (Komponente 4), was insbesondere bei einer mobilen Nutzung sinnvoll ist.

Je nach Verlauf des Dialoges könnte die neue Literaturquelle nun weiter bearbeitet, z. B. als interessant markiert oder verworfen werden. Auf jeden Fall merkt sich OKI den Verlauf (Komponente 7) und kann den Nutzer so bestmöglich unterstützen, z. B. durch eine Wiedervorlage.

Weitere aktive Dialoge könnten die Erinnerung an Aufgaben, die Bewertung von Quellen und die Abfrage von Erledigungsständen zum Inhalt haben. Auch aktive Dialoge basieren auf Templates (Komponente 11). Ebenso gibt es Templates für Projekte, z. B. Masterthesis, Bachelorthesis oder Semesterarbeit, die idealtypische Zeitansätze, Tätigkeiten und deren Reihenfolge vorgeben, aber natürlich für das konkrete Projekt angepasst werden können (Komponente 10).

OKI als Forschungsprojekt

Technische Umgebung

OKI ist als praktisches Projekt konzipiert, das mit einem sehr geringen Mitteleinsatz ein nutzbares Ergebnis erzielt. Dafür ist es notwendig, soweit wie möglich auf bestehende Lösungen zurückzugreifen und das Rad nicht neu zu erfinden. Für die Programmierung kommen Node.js und Python zum Einsatz. Diese Zweiteilung ist notwendig, da die gängigen Klassenbibliotheken für die Kommunikation mit Chatclients für Node.js und die gängigen Klassenbibliotheken für das Machine-Learning für Python zur Verfügung stehen. Beide Sprachen lassen sich gut miteinander verknüpfen. Die Datenspeicherung erfolgt mithilfe von MongoDB und die Verarbeitung natürlicher Sprache mithilfe von rasa NLU, spacy und scikit-Learn. Als Umgebung für den Chatclient wird zunächst Telegram eingesetzt, da hier sowohl die Datensicherheit als auch die Unterstützung von Fremdanwendungen führend sind. OKI kann aber relativ problemlos auf andere Umgebungen, z. B. Actions on Google, Amazon Alexa oder Slack erweitert werden.

Datenschutz und Datensicherheit

OKI benötigt sehr viele Daten, die den Nutzer und das Nutzerverhalten beschreiben. Diese Daten sind zwar nicht hochsensibel, aber dennoch persönlich. Beispielsweise können aus den Daten die wissenschaftlichen Interessen und die Arbeitsweise konkreter Nutzer abgeleitet werden. Somit müssen diese Daten in einem besonderen Maße geschützt werden. Dies geschieht durch: Die ausschließliche Nutzung der Daten für die Zwecke der  Anwendung ohne vorsorgliche Speicherung und ohne Weitergabe an Dritte. Die Kontrolle der Daten durch die Nutzer, die sämtliche individuelle Daten löschen können. Und den Verzicht auf einen Klarnamenszwang.

Der letzte Punkt zeigt eine weitere Stärke der Nutzung von OA. Da OA-Verzeichnisse keine persönliche Authentifizierung für den Literaturbezug erfordern, kann auch OKI darauf verzichten und benötigt lediglich einen Usernamen für die persönliche Ansprache. Die zusammengefasste Auswertung der Nutzerdaten mithilfe von maschinellem Lernen abstrahiert von den Daten einzelner Nutzer.

Hinsichtlich der Datensicherheit werden die gängigen Anforderungen beispielsweise an die Verschlüsselung durch den OKI-Server erfüllt. Für die erste Ausbaustufe ist die Verwendung von Telegram als Clientumgebung vorgesehen. Telegram ist hinsichtlich der Datensicherheit führend. Sofern weitere Clientumgebungen hinzugefügt werden, müssen diese ebenfalls hohe Anforderungen an die Datensicherheit erfüllen.

Vorgehensweise

Das Vorgehen zur Realisierung von OKI ist agil und nutzerzentriert ausgelegt.  Ein zentraler Aspekt ist die konsequente Involvierung der Nutzer von einem frühen Zeitpunkt an. Deshalb muss auch schon sehr früh ein inhaltlich weitgehend kompletter Prototyp erstellt werden, der in enger Zusammenarbeit mit den Nutzern über mehrere Iterationen zu einer fertigen Lösung weiterentwickelt wird.

Erwartete Auswirkungen

Das Projekt verfolgt das praktische Ziel, mit OKI eine Lösung bereitzustellen, die als Schnittstelle zu jeder Form von OA verwendet werden kann.

Aus der Sichtweise der Nutzer soll so die Nutzung von OA erleichtert werden.

Aus der Sichtweise des wissenschaftlichen Arbeitens soll die Nutzung von OA verstetigt und strukturiert werden.

Aus der Sichtweise von OA ist das Ziel, eine bessere Verbreitung in der Zielgruppe der Studierenden zu erreichen.

Als formales Ergebnis soll am Ende des Projektes eine laufende Anwendung öffentlich zugänglich sein.

Für das aktuelle Vorhaben wird ein klar begrenzter Funktionsumfang umgesetzt. Der Betrieb der Anwendung nach Projektende wird durch die Hochschule für Wirtschaft und Recht sichergestellt. Eine entsprechende Serverumgebung steht bereits für andere laufende Projekte zur Verfügung und kann durch OKI mit genutzt werden. Für eine langfristige Weiterentwicklung von OKI kommt sowohl eine nichtkommerzielle Alternative als Hochschulprojekt als auch eine kommerzielle Ausgliederung in Form eines Startups in Betracht. Inhaltlich existiert ein erhebliches Potenzial für Erweiterungen.

Aktuelles

Im Überblick: 16 innovative Open Access Projekte starten

Im Überblick: 16 innovative Open Access Projekte starten Mit innovativen Projekten Open Access in der Wissenschaft verankern. Das BMBF hat in seiner Open Access-Strategie das Ziel formuliert, Open Access zu einem Standard wissenschaftlichen Publizierens zu machen. Jetzt beginnen 16 Vorhaben mit der Arbeit. Mehr Informationen findet Ihr hier.