Die Dritte Welle von Künstlicher Intelligenz – Interview mit Dr. Sven Körner (thingsTHINKING)

von Nico Kuhlmann

Ein Gespenst geht um in der Rechtsbranche – das Gespenst der Künstlichen Intelligenz. Wunderwaffe, Jobkiller oder Katalysator der digitalen Transformation, unabhängig von der Grundeinstellung zu dieser Technologie sind sich die meisten Akteure über die grundlegende Bedeutung von Künstlicher Intelligenz für unsere Zukunft einig. Trotzdem ist die Kenntnistiefe in Bezug auf die Grundlagen, die Möglichkeiten und die Grenzen von Künstlicher Intelligenz regelmäßig überschaubar. Deshalb wird es Zeit für einen weiteren Beitrag zur Demystifizierung.

Dr. Sven Körner hat am Karlsruher Institut für Technologie (KIT) Computerwissenschaften studiert und in diesem Fachbereich auch promoviert. Anschließend hat er im Jahr 2017 zusammen mit drei weiteren Gründern das Unternehmen thingsTHINKING ins Leben gerufen, um Computern die eigentliche Bedeutung von Texten beizubringen und den Maschinen damit sowas wie einen gesunden Menschenverstand einzuhauchen. Insgesamt hat Dr. Körner über 13 Jahre Erfahrung mit den verschiedenen Facetten von Künstlicher Intelligenz (Natural Language Processing, Machine Learning, Deep Learning) und hat sich somit mit diesem Thema bereits lange beschäftigt bevor es cool wurde.

Nico Kuhlmann: Lieber Sven, vielen Dank, dass Du Dir die Zeit nimmst. Was waren Deine ersten Berührungspunkte mit Künstlicher Intelligenz und was hat Dich daran besonders fasziniert?

Sven Körner: Erst einmal Danke für’s Mitmachen dürfen, Nico! Uns ist es immer wieder ein Anliegen, den Leuten ein saloppes “KI ist gar nicht so schlimm, nur verpennen dürfen wir es nicht!” entgegnen zu können.

Die ersten Berührungspunkte mit diesem Thema hatte ich – wie sicherlich viele – mit SciFi Serien und Filmen, die mich schon als Junge faszinierten. Der Gedanke daran, dass Maschinen uns in manchen Bereichen der geistigen Leistung überlegen sein würden, war beängstigend und befreiend zugleich. In meiner Jugend war es klar, dass Menschen nicht mit Motoren mithalten können, und es war auch klar, dass wir beim Rechnen nicht die Geschwindigkeit von Maschinen erreichen. Das war es dann aber auch schon. Und ehrlicherweise haben die Menschen in jedem Film auch immer gegen die Maschinen gewonnen. Meist mit einem cleveren, menschlichen Trick – also gesundem Menschenverstand. Und das ist es ja, um das wir uns jetzt kümmern.

Nico Kuhlmann: Der Begriff der Künstlichen Intelligenz geht auf John McCarthy zurück, der diese Bezeichnung im Jahr 1956 im Zusammenhang mit einem Forschungsprojekt als Erster verwendet haben soll. Was verstehst Du unter Künstlicher Intelligenz?

Sven Körner: KI ist zuallererst ein Werkzeug. Wichtig ist, dass die Menschen verstehen, wie es grob funktioniert, um dann für das Werkzeug passende Anwendungen zu entwickeln. Das ist das größte Problem das wir haben. Ich war letztens auf einem großen Treffen von kleinen und mittleren Unternehmen (KMUs) und nur rund 1% derer – viele davon Weltmarktführer in Ihren Bereichen – beschäftigen sich überhaupt mit dem Thema KI und nur 0,2% wussten was KI kann und wie es funktioniert. Stell’ Dir mal vor, unsere Handwerker wüssten alle nicht, dass es Bohrmaschinen, Hammer und Schraubenzieher gibt.

Technisch betrachtet: KI ist natürlich zum Teil das, was seit drei Jahren durch alle Gazetten geistert, sprich: Machine Learning und Deep Learning als ein spezielles Derivat davon. Das ist aber nur ein Teil. Wissensbasen, Ontologien, Knowledge-Graphen – oder wie auch immer Du es nennen willst – gehören mindestens genauso dazu. Dafür brauchen wir eine Basis an Wissen, die vorab strukturiert ist, aber neue Rückschlüsse – das sogenannte Reasoning – zulässt. Ein einfaches Beispiel ist der Freunde-Graph von Facebook, der errechnet, wen Du wie sehen kannst. Das machen wir mit allgemeinem Weltwissen und speziellem Wissen für konkrete Domänen wie Legal, Tax oder Auditing.

Nico Kuhlmann: Wie wurde das Thema Künstliche Intelligenz am KIT unterrichtet? Welche Vorlesungen waren besonders prägend und welche Lerninhalte haben rückblickend eventuell gefehlt?

Sven Körner: Am KIT ist das Thema – wie an anderen Hochschulen auch – leider nicht zentral aufgestellt. Hier wäre es gut und gerne möglich einen Lehrstuhl zur Bündelung aller Themen aufzustellen. Vermutlich wäre das sogar eine gute Idee – und eine spannende Maßnahme, das Thema den Studenten noch schmackhafter zu machen.

Was im Endeffekt fehlt ist eine Art “Grundkurs in KI”, wie man das heute auf Coursera, OpenUniversity oder Udacity bekommt. Der Fokus bei uns im Lehrstuhl liegt auf Sprachverarbeitung in der Softwaretechnik; hierauf basieren auch unsere Schwerpunktgebiete und die Ausgründung mit thingsTHINKING.

Nico Kuhlmann: Du bist Gründer und CEO von thingsTHINKING. Mit Deinem Team versuchst Du Computern beizubringen durch einen semantischen Prozess die eigentliche Bedeutung von Texten zu erfassen. Wie genau kann ich mir das vorstellen?

Sven Körner: Unsere Plattform beruht grundsätzlich auf drei Säulen: Semantic Similarity, Semantic Extraction und Semantic Reasoning. Im Endeffekt machen wir den ersten Schritt ähnlich wie wir Menschen. Das heißt wir versuchen die Bedeutung der Sätze unabhängig von ihrer Formulierung und Sprache zu verstehen und ein semantisches Modell zu extrahieren. Danach könnte man die Worte an sich verwerfen, wie wir Menschen das in einer Diskussion auch tun. Keiner von uns erinnert sich an die genaue Wortwahl des Gegenübers und die Reihenfolge der Ausführungen. Das ist aber genau das, was ein datengetriebener Ansatz tut. Deshalb scheitern rein statistisch- und datengetriebene Methoden, da diese im Endeffekt nur eine bessere Mustererkennung sind. Und Sprache ist aber nunmal inhärent nicht statistisch.

In der Semantik, also in Bezug auf die Bedeutung der Sprache, ist es egal, welche Sprache ich verwende und welche Worte ich nutze, um eine Thematik zu beschreiben. Zum Beispiel betrachtet die Maschine die Sätze “Nico runs away from Sven” und “Sven verfolgt Nico” im jeweiligen Kontext als relativ ähnlich. Warum? – weil die Bedeutung der Sätze sich überschneidet, ganz unabhängig von Grammatik, Wortwahl, Formulierung, Form der Darreichung und Format.

Ein weiterer Aspekt – und das wäre dann der zweite und dritte Schritt – von Semantik ist dann, dass man gepaart mit Weltwissen feststellen kann, ob gewisse Aspekte fehlen, oder zuviel sind. Ein Beispiel ist hier das Prüfen von Verträgen auf Konformität mit der Datenschutzgrundverordnung. Zuerst muss die Maschine hier die Bereiche im Dokument finden, die sich mit Thematiken aus dem EU-Gesetzestext beschäftigen (Semantic Similarity). Nehmen wir das Thema “Verschlüsselung”. Danach gilt es konkret die Details aus dem Text zu extrahieren (Semantic Extraction) und zu verarbeiten, da im Gesetz natürlich nur allgemeine Hinweise stehen. Durch die Extraction kommen dann konkrete Daten wie “SSL bei Übertragung” und “AES-256” am REST-Endpunkt heraus. Das, was Anwälte machen, wenn Sie ein Gesetz interpretieren, kommt bei uns dann im nächsten Schritt (Semantic Reasoning). Teile dieser Schritte beherrscht die Maschine per se und out-of-the-box, andere Dinge müssen ihr natürlich gezeigt werden, vor allem wenn es um Spezialdisziplinen geht.

Nico Kuhlmann: Habt Ihr bereits erfolgreiche Projekte mit zahlenden Kunden durchgeführt? Welche Einsatzgebiete haben sich bisher als sinnvoll herausgestellt?

Sven Körner: Wir haben im ersten Jahr der Ausgründung versucht, mit Kunden aus vielen verschiedenen Domänen zusammen zu arbeiten, um ein Gefühl dafür zu bekommen, wo unsere semantische Plattform schnell am meisten Mehrwert liefern kann. Hättest Du mich nach der Promotion gefragt, wo ich das vermute und wenn ich Dir jetzt gleich sage, was wir so tun – naja – dann sind das zwei paar Schuhe. Aber so ist das halt, wenn der akademische Elfenbeinturm auf die Realität trifft.

Prinzipiell hilft unsere Plattform immer dann, wenn umfangreiche Dokumente oder sonstige Inhalte verarbeitet werden müssen, wo Menschen lange brauchen oder schnell den Überblick verlieren. Und da unserer Plattform die Formulierung der Punkte – und je nachdem sogar die Sprache – egal ist, sondern sie lediglich auf die Bedeutung der jeweiligen Angaben reagiert, ist sie natürlich vielfältig einsetzbar. So sind wir tätig:

  • Bei den großen Wirtschaftsprüfer und deren Kunden, die mit unserer Plattform das Thema Steuerverarbeitung und Auditing optimieren.
  • Bei Manufacturern, die das Thema Requirements Engineering, Requests for Proposal und Requests for Quotation mit unserer Plattform verarbeiten und somit schnell Ähnlichkeiten mit alten Ausschreibungen und Problemen finden.
  • Bei Inhouse Legal Abteilungen, die konstant Druck im Bereich der Vertragsverarbeitung/-Verwaltung haben und denen ein “Legal Side-Kick” extrem hilft; übrigens genau so ein Sidekick, der auch die internen Regeln und Ansätze beachtet.
  • Bei Versicherungen im Bereich des Output- und Inbound-Managements von Schriftstücken jeglicher Couleur. Rückversicherer versuchen mit unserer Plattform ihr Risiko besser zu verwalten. Normale Versicherer versuchen hier schnelle Schadenseinschätzungen und nebenläufige Hinweise zu Fällen in Echtzeit zu bekommen.

Zusammengefasst sind dies aber alles Bereiche, wo noch sehr viel manuelle Prozesse vorherrschen. Ich persönlich hätte das – genauso wie im Bereich Legal – nicht erwartet, dass noch so stark mit “der Hand am Arm” in diesen Bereichen gearbeitet wird.

Nico Kuhlmann: Ihr habt mit Eurem Programm auch den aktuellen Koalitionsvertrag untersucht und damit ein ziemliches Medienecho ausgelöst (FAZ, Süddeutsche). Wie seid Ihr auf die Idee gekommen und was waren die Ergebnisse Eurer Untersuchung?

Sven Körner: Die Idee kam morgens im Gespräch mit einem Partnerunternehmen, die unsere Software im Bereich von Versicherungen einsetzen. Da meinte unser Ansprechpartner, dass wir doch mal den neuen GroKo-Vertrag prüfen könnten und schauen, ob die Experten recht haben mit Ihrer Einschätzung, wer da gut vertreten wäre und wer nicht. Gesagt getan – und das haben wir dann in der Mittagspause durchgespielt. In der Analyse stellte unsere Maschine dann ein grobes Verhältnis von 2:1 für das Parteiprogramm der SPD gegenüber dem der Union fest.

Die Ergebnisse sind keine politische Studie – auch wenn es mancher Politiker dann natürlich so für sich nutzen wollte – und zeigen lediglich, dass sich auf quantitativer Ebene mehr Punkte aus dem SPD-Wahlprogramm im Koalitionsvertrag finden lassen, als von der Union. Wir treffen insbesondere keine Aussage zur Qualität der Verhandlungen zur Großen Koalition. Hintergrund unserer Arbeit war zu verdeutlichen, dass durch unsere Verfahren mit Künstlicher Intelligenz eine erste Analyse in wenigen Sekunden möglich ist – während man als Mensch bei der vorliegenden Menge an Text ein ähnliches Ergebnis erzielen kann, wenn man mehrere Tage investiert. Die Ergebnisse wurden inzwischen von Politikwissenschaftlern aus Freiburg und Mannheim bestätigt.

Nico Kuhlmann: Wie verhält sich Eurer Ansatz zu anderen Herangehensweisen, die bisher als Künstliche Intelligenz bezeichnet wurden?

Sven Körner: Wir spielen hier gerne auf die sogenannte Dritte Welle der KI an, auf der wir selbst reiten. Die erste Welle waren ab 1980 die heute allbekannten Expertensysteme. Dazu zählen beispielsweise Trading-Dienste oder Schachweltmeister-Besieger. Die zweite Welle ist das statistische Lernen, also das, was seit zirka 2012 prominent unter Machine Learning oder Deep Learning bekannt ist.

Der Begriff der Dritten Welle wurde von der DARPA geprägt und beschreibt den Teil, wo die KI sich über ihr Umfeld und bestimmte Rahmenbedingungen “bewusst” wird und diese zu nutzen weiß. Das erste, was hier Nahe liegt ist Sprache. Es ist zwar immer noch unendlich schwer, das Thema Sprache für Maschinen sinnvoll nutzbar zu machen, aber viele versuchen es. Und das ist wohl auch der nächste Heilige Gral.

Zudem gehören wir ganz und gar nicht den religiösen Lagern der KI an, die sich klassisch in das “symbolic” und “subsymbolic” Lager teilen. Die einen sagen, man bräuchte für alles nur mehr Trainingsdaten, und schon hätte man die Lösung. Die anderen sagen, dass dies so nie funktionieren wird. Wir sind hier Pragmatiker und kombinieren seit jeher verschiedene Technologien nach dem Motto “Whatever works”. Wie gesagt – wir machen das schon lange genug, um den Hype nicht zu überschätzen, aber die langfristige Wirkung auch nicht zu unterschätzen. Sprich, wir nutzen nicht nur Hämmer und nicht nur Schraubenzieher, sondern einen Hammer für Nägel und Schraubenzieher für Schrauben.

Nico Kuhlmann: Wo siehst du die Grenzen von Künstlicher Intelligenz? Was wird auch in naher Zukunft voraussichtlich nicht funktionieren?

Sven Körner: Die größten Hürden sind sicherlich im Bereich der kombinatorischen Explosion bei diversen Problemstellungen verborgen, also genau da, wo die Vielfältigkeit und Vielschichtigkeit von Informationen nicht so einfach zu fassen sind. Bei so Dingen wie “Go” spielen sind die Regeln klar und es gibt nur zwei Spieler, also einen Gegner. Das ist klar aufgeteilt und ändert sich auch nicht. Das vereinfacht das mathematische Modell und somit auch das KI-Modell. In vielen anderen Bereichen des Lebens, des Rechts und der Wirtschaft sind die Regeln beileibe nicht so klar und vor allem gibt es viele verschiedene Parteien, die hier miteinander interagieren und verknüpft – ja sogar abhängig – sind. Das erschwert die Modellierung imens.

Nico Kuhlmann: Es wird viel über den Nutzen, aber auch die Risiken von Künstlicher Intelligenz diskutiert. Elon Musk und der kürzlich verstorbene Stephen Hawking haben beispielsweise eingehend vor den Gefahren gewarnt. Müssen wir uns Deiner Meinung nach Sorgen machen, dass Künstliche Intelligenz zum Problem wird?

Sven Körner: Meiner Meinung nach nicht. Oder zumindest noch nicht. Das Thema “narrow AI” wird in den nächsten zwei Jahrzehnten prägend sein. Die “Artificial General Intelligence” wird noch auf sich warten lassen. Mit aktueller Technologie könnte eine “Artificial General Intelligence” schon alleine nicht wegen des Stromverbrauchs “leben”. Wenn man die Energieeffizienz von Machine Learning-Algorithmen mit dem menschlichen Hirn vergleich – das ist wahnsinn. Sprich: eine “Artificial General Intelligence”, die so clever wie ein Mensch wäre, hätte vermutlich einfach zu wenig Strom für die notwendigen Ressourcen zur Verfügung. Dann wiederum muss man sagen, dass Ray Kurzweil mit seinen “alles wächst exponentiell”-Ansätzen schon öfter richtig lag – also wer weiß.

Den Ansatz von Elon Musk finde ich hierbei aber bemerkenswert: Er hat Angst vor AI und deswegen forscht er mit Nachdruck daran. Ist das nicht clever und eine äußerst sinnvolle Maßnahme? Da wünschte ich mir, dass die deutsche Gesellschaft ihre Angst und Zurückhaltung doch ähnlich kanalisieren könnte – das würde uns einen schönen Boost in dem Bereich geben. Rückstand haben wir ja schon genug.

Nico Kuhlmann: Lieber Sven, vielen herzlichen Dank für das Interview. Weiterhin viel Erfolg für Deine Projekte.