26.04.2021
Gothaer: Bedingungswerke digital vergleichen mit KI semantha® – ID#17
Wie lassen sich wiederkehrende, manuelle Aufwände beim Vergleich von Maklerbedingungswerken so gering wie möglich halten? Ein Team der Gothaer um Christoph Spix nutzt dafür seit einigen Monaten Künstliche Intelligenz.
Über Motivation, konkrete Lösung und praktische Aspekte im täglichen Einsatz spricht er mit Ansgar Knipschild und Toni Klein.
Länge: 42 Minuten.
Transkript
Ansgar Knipschild: Hallo und herzlich willkommen zu einer neuen Ausgabe von Industrieversicherung Digital. Heute mit meiner Kollegin Toni Klein. Hallo Toni!
Toni Klein: Hallo Ansgar! Danke, dass ich heute dabei sein darf.
Ansgar Knipschild: Sehr gerne. Im heutigen Podcast geht es um einen Erfahrungsbericht aus der digitalen Industrieversicherung. Thema: KI-gestützter Bedingungswerkvergleich mit semantha®. Wir haben sogar künstliche Intelligenz oder AI mit dabei. Unser Gast ist Christoph Spix, seit mehr als acht Jahren bei der Gothaer. Gestartet im Bereich Technische Versicherungen als Schadenregulierer, dann als Produktmanager und seit 2018 digitaler Referent für Komposit und Industrie. Seit 2021 ist Christoph Spix Underwriter für technische Versicherungen und neue Energie. Ein Mann aus der Praxis, so wie wir ihn hier gern im Podcast haben. Der Industrieversicherungen von der Pike an gelernt hat. Herzlich willkommen, Christoph Spix.
Christoph Spix: Vielen Dank für die Einladung. Hallo in die Runde. Ist für mich heute der erste Podcast. Bin ganz gespannt, was mich hier die nächsten Minuten erwartet.
Toni Klein: Herr Spix, wir werden total konkret werden. Wichtig ist für uns heute, wenn wir über den digitalen Bedingungswerkvergleich sprechen und das Thema künstliche Intelligenz, dass wir praxisnah sprechen. Dafür sind Sie ein toller Gast. Vielen Dank, dass Sie heute dabei sind. Wir werden nachher über die Lösungsansätze sprechen, wahrscheinlich auf den Projektablauf eingehen, auf den Betrieb und die Operation. Los geht es wie immer mit der Frage: Was war die Aufgabenstellung? Welches Problem haben Sie mit semantha® bei der Gothaer gelöst? #00:01:38-2#
Christoph Spix: Ja, was ist eigentlich das Problem? Bei uns im Industriekundenbereich ist es so, dass wir viele unserer Risiken auf Basis von Maklerbedigungswerken zeichnen. Die Prüfung dieser Bedingungswerke ist immer sehr zeitaufwendig und zeitintensiv. Dennoch ist es so, dass sich diese Bedingungswerke inhaltlich stark überschneiden, dass sie doch sehr ähnlich sind, dass es doch einen gewissen Standard gibt. Natürlich will sich jeder vom Markt abheben. Aber ein Großteil dieser Klauseln, die in diesen Bedingungswerken stehen, sind doch sehr ähnlich. Da hatten wir den Impuls irgendwann zu sagen: Gibt es da nicht ein Tool oder eine Methode diesen Prozess zu beschleunigen? Dass man diese relativ einfache Arbeit beschleunigt, automatisiert und sich vielleicht auf diese spannenden Textstellen – die den Unterschied machen, die einer intensiveren Prüfung bedürfen und die mit dem Makler im Anschluss zu diskutieren und zu besprechen sind – beschränkt.
Toni Klein: Ist das spartenbezogen bei Ihnen? Gilt das für bestimmte Bereiche?
Christoph Spix: Grundsätzlich ist dieses Tool semantha® ein Tool, das alle Texte miteinander vergleichen kann. Das ist gar nichts Versicherungsspezifisches. Wir haben das in erster Linie wie gesagt auf den Industriekundenbereich beschränkt und hatten in dem Projektteam aber Vertreter aus verschiedensten Sparten – aus dem (Sub)-Bereich, aus Transport, aus Multiline und aus dem Bereich technische Versicherungen, sodass wir da relativ breit aufgestellt waren.
Toni Klein: Haben Sie mit einer bestimmten Sparte begonnen?
Christoph Spix: Nein, wir haben nicht mit einer bestimmten Sparte begonnen, sondern haben das parallel mit den Kollegen getestet – ich für den TV-Part, die anderen Kollegen jeweils für ihre Sparte haben sich immer über Auffälligkeiten ausgetauscht, über Erkenntnisse und Anpassungsmöglichkeiten, die wir sehen, wo wir sagen, da könnten wir semantha® noch in die oder die Richtung verbessern und an unsere Bedürfnisse entsprechend anpassen.
Ansgar Knipschild: Sehr interessant. Um noch ein Bild zu bekommen, wie das Ganze in der Praxis funktioniert. Können Sie das beschreiben, was als Ergebnis in dem Tooleinsatz hinten rausgekommen ist? Wie sieht der Arbeitsablauf aus Anwendersicht aus? Gehen wir davon aus, der Anwender ist ein Underwriter. Wie sieht der aus? Mit welchen Systemen arbeitet er? Wie bekommt er überhaupt die Bedingungswerke, die er vergleichen will, in sein System rein? Wie sind danach die Arbeitsschritte?
Christoph Spix: Es ist im Wesentlichen so, dass wir vom Makler ein neu zu prüfendes Dokument erhalten. Dann haben wir diese Plattform semantha®, die eine Webanwendung ist. Da laden wir uns zunächst das neu zu prüfende Dokument hoch und Referenzdokumente hoch. Das kann entweder eine frühere Version von diesem Bedingungswerk sein, was dann relativ einfach ist, wo wir bei der Prüfung eine massive Beschleunigung haben. Aber das ist noch nicht das, was semantha® ausmacht. Das können wir heute vielleicht auch in so was wie Word machen. Da können wir einen einfachen Versionsvergleich machen. Das geht relativ zügig und auch relativ komfortabel in Word. Auch da bietet semantha® bestimmt noch Features, die Word an der Stelle nicht hat. Die Krux ist hier zu sagen: Ich habe ein ganz neu zu prüfendes Bedingungswerk, vielleicht von einem Makler, den ich bislang noch nicht betreut habe und führe dieses Bedingungswerk an den verschiedenen Referenzdokumenten entlang. Da ist es ganz wichtig, dass wir möglichst viele Referenzdokumente haben, um die semantische Trefferquote zu erhöhen. Wie sieht der eigentliche Ablauf aus? Es ist so, dass zuerst dieses neu zu prüfende Dokument hochgeladen wird, dann die verschiedenen Referenzdokumente. Das geht über ein paar Mausklicks. Und dann stelle ich noch so etwas wie einen semantischen Stellenwert ein. Da geht es darum, festzulegen, was mir als semantischer Treffer angezeigt wird. Das heißt, ich kann einen Score zwischen null und hundert Prozent wählen. Je höher ich diesen Score wähle, desto granularer sind die Treffer, desto genauer sind die Treffer. Das heißt, wenn ich einen Score habe zwischen 93 und 100 Prozent, dann ist da eine sehr gute Trefferquote. Da darf man sich aber nicht von diesen Prozentzahlen leiten lassen. Das bedeutet nicht, dass 93 Prozent der Wörter identisch sind, sondern das ist ein semantischer Score. Da liegt ein Algorithmus hinter. Das spielt an der Stelle vielleicht nicht so eine große Rolle. Dann habe ich diese Dokuemnte hochgeladen, den Score eingestellt und dann kann ich den Vergleich starten. Habe auf der linken Seite das durchgeschriebene neu zu prüfende Dokument und auf der rechten Seite wird mit der beste Treffer aus allen Referenzdokumenten angezeigt. Dazwischen wird mir noch die semantische Übereinstimmung angezeigt. Da ist ein kleiner Button. Da steht eine Prozentzahl. Oder wenn die Textstellen komplett identisch sind bis auf Punkt und Komma, dann steht da „identical“. Auf diesen Button kann ich draufklicken und der zeigt mir die Unterschiede zwischen den Dokumenten an. Da habe ich so eine richtige (Diff)-Funktion, sehe schnell, ob sich eine Nummerierung geändert hat, ob ein anderes Wort verwendet wurde oder ob die Textstellen von der Wortwahl sehr unterschiedlich sind und ich genauer hinschauen muss. Dadurch haben wir diese Verbesserung des Workflows, gerade bei den identischen Textstellen oder da, wo nur eine Nummerierung geändert wurde oder sich wenige Worte geändert haben. Dadurch haben wir die Beschleunigung.
Ansgar Knipschild: Ich spiele das zurück, wie ich es verstanden habe, Herr Spix. Wir haben leider kein Video an Board, sondern sind aufs Audioformat beschränkt in einem Podcast. Ich sehe diese beiden Texte, links und rechts. Links das Wording vom Makler, rechts Ihre Referenzdokumente. Wenn die Reihenfolgen unterschiedlich sind? Ist nicht klassisch, dass in der Referenz oder sogar mehreren Referenzen und dem Wording. Wie muss ich mir das vorstellen? Sortiert dann das System so um, dass ich sie auf eine gleiche Reihenfolge bringe oder hüpfe ich dann so hin und her?
Christoph Spix: Auf der linken Seite – das neu zu prüfende Dokument – ist ganz normal chronologisch angeordnet, wie es auch im Ursprungsdokument ist. Auf der rechten Seite werden mir die semantisch bestmöglichen Treffer angezeigt. Das heißt, da variiert die Quelle auf der rechten Seite. Kann durchgehend variieren, weil der Treffer immer aus einem anderen Referenzdokument kommt. Dann wird nur dieser Passus angezeigt. Der kann in dem einen Dokument am Ende stehen, im neu zu prüfenden Dokument vielleicht am Anfang. Auf die Reihenfolge wird an der Stelle keine Rücksicht genommen, sondern es wird der allerbeste Treffer angezeigt, was das ist, was wir wollen an der Stelle.
Ansgar Knipschild: Jetzt haben wir die Gegenüberstellung vom Quelldokument, vom Maklerwording und dann von Ihren Referenzdokumenten und haben die Einzelanalyse. Gibt es auch einen Gesamtscore, eine Gesamtbewertung, wie ähnlich diese beiden Wordings sind?
Christoph Spix: Die Möglichkeit gibt es auch, nicht nur bezogen auf zwei Wordings, sondern auf mehrere Referenzdokumente. Da kann man sich so was wie ein Matrix anzeigen lassen. Diese Matrix zeigt an, welche Dokumente sich am ähnlichsten sind.
Ansgar Knipschild: Das heißt, vom Use Case her würde ich das Ganze so verstanden haben, Underwriter bekommt diese Information rein, vergleicht sie im System und hat dann einen sehr schnellen Überblick darüber, wie stark das angefragte Wording mit dem Bestehenden übereinstimmt und wird danach in den Angebotsprozess einsteigen. Wenn es eine hohe Übereinkunft gibt, wird er schnell und einfach anbieten können. Wenn es größere Abweichungen gibt, muss er ins Detail reingehen, muss er in die angefragten Bausteine reingehen und prüfen, ob das in den angebotenen Schutz von Ihrer Seite reinpasst oder nicht.
Christoph Spix: Richtig.
Ansgar Knipschild: Es hört sich nach einer Stand-alone-Lösung an, also eine eigene Plattform, wo der Mitarbeiter die Sachen reinkopiert. Ist das richtig verstanden oder gibt es da eine tiefere Integration in Ihre aktuellen Systeme?
Christoph Spix: Nein. Das ist aktuell eine Stand-alone-Lösung, also eine Webanwendung. Klar, wir arbeiten auch aktuell an so was wie einem IT-Zielbild und da macht man sich Gedanken, wie man so was zukünftig integrieren kann. Aber so weit sind wir an der Stelle noch nicht.
Ansgar Knipschild: Aber heißt im Umkehrschluss, dass wenn sich jemand für solche Lösungen interessiert, diese Integration nicht zwangsweise eine Voraussetzung ist, sondern man kann mit einem Stand-alone-System starten und seine Erfahrungen damit sammeln und Schritt für Schritt – genauso wie Sie es für die Gothaer beschreiben – später tiefer integrieren.
Christoph Spix: Absolut, ja.
Toni Klein: Dann wissen wir jetzt, warum ihr das gemacht habt. Wir haben jetzt ein bisschen in die Lösung reingeguckt. Jetzt ist die Frage, wie habt ihr diese Lösung entwickelt? Wie sind Sie auf semantha® gekommen beziehungsweise auf den Anbieter Things Thinking? Welche Systeme haben Sie sich noch angeschaut und wahrscheinlich vergleichen mit anderen Lösungen am Markt? Wie war dieser Entscheidungsprozess. Können Sie den kurz beschreiben?
Christoph Spix: Es war so, dass wir damals dieses Problem hatten und gesagt haben: Hey, es wäre cool, wenn wir das vereinfachen können. Wie eben gesagt, diese leichten oder einfach zu prüfenden Textstellen direkt identifizieren, schnell durchwinken und dann weitermachen. Das war der erste Schritt. Dass wir gesagt haben, dann gehen wir mit dieser Idee auf unsere konzernübergreifende Digitalisierungseinheit zu und fragen, ob die was haben, ob die jemanden kennen, ob die was bauen können. Dann haben wir angefangen, im ersten Schritt selber was zu bauen, haben aber nach zwei, drei Wochen gesagt, wir haben einen Start-up-Unternehmen kennengelernt, Things Thinking. Machen die nicht eigentlich genau das, was ihr sucht? So war das dann tatsächlich. Dann haben wir den Kontakt aufgenommen, haben mal einen eintägigen Workshop gemacht, haben semantha® kennengelernt und dann gemerkt: Okay, die machen im Wesentlich das, was wir suchen und sind dann in eine achtwöchige Evaluationsphase mit Things Thinking gegangen, wo wir uns das ein bisschen genauer angesehen haben. Haben schon ein paar Anforderungen an Things Thinking gestellt, die dann auch kurzfristig umgesetzt werden konnten. Wir wir gemerkt haben, die Zusammenarbeit funktioniert richtig gut und haben uns im Anschluss daran dafür entschieden in eine Einjahreslizenz zu gehen und längerfristig auf semantha® zu bauen.
Toni Klein: Guter Punkt, Lizenz. Kommen wir nachher noch mal drauf. Das ist superspannend. Aber wenn semantha® zu Gothaer kommt, was kommt da out of the box? Was direkt? Sie haben die Bedingungswerke, semantha® kommt ins Haus, wird installiert als Stand-alone-Lösung. Wie viel Intelligenz ist da schon drin und wie viel muss noch dazu gepackt werden, um in so einer Funktion wie bei der Gothaer betrieben werden zu können?
Christoph Spix: Das ist ein guter Punkt. Es ist so, dass semantha® out of the box schon sehr gut funktioniert. Bringt schon sehr viel Weltwissen mit, so sagen die Kollegen von Things Thinking das. Wenn zum Beispiel auf der einen Seite steht: „Hans fährt mit dem Zug zur Arbeit“ und auf der anderen Seite steht: „Um ins Büro zu kommen, nutzt Hans die Eisenbahn“, dann würde semantha® sagen: Okay, da ist eine Übereinstimmung, weil sie eben dieses Weltwissen mitbringt, dass eine Eisenbahn so was wie ein Zug ist und dass das Büro was mit Arbeit zu tun hat. Deshalb würde dieser reine Textvergleich an der Stelle schon out of the box funktionieren, dass ich dieses Eingabedokument mit diesem Referenzdokument vergleiche. Der Knackpunkt ist an der Stelle, dass wir auch Bedingungswerke haben, wo wir sagen: Okay, die sind grundsätzlich mit dem Makler abgestimmt, aber wir haben noch so was wie eine Segelanleitung dazu, so was wie einen Zeitletter, wo wir sagen: Okay, die und die Klausel steht zwar da drin, aber bei einem konkreten Risiko müssen wir uns die vielleicht genauer angucken, vielleicht mehr Beitrag dafür nehmen. Vielleicht würden wir die auch bei konkreten Risiken nicht zeichnen wollen. Das ist so der Knackpunkt. Das würden wir in der skizzierten Form gar nicht erkennen können, diese Textstellen. Da würden wir sagen: Okay, steht in einem Referenzdokument. Aber dass das vielleicht ein wichtiger Punkt ist, den es zu diskutieren gilt, haben wir an der Stelle nicht herausgestellt. Deshalb ist da initialer Aufwand nötig, dass man diese Segelanleitungen an semantha® übergibt. Dass man sagt: Pass auf, wenn du diese Textstelle findest, dann müssen wir die erkennen können und dann muss ich da auch entsprechende Metadaten hinterlegen, wo ich sage: Okay, dafür brauche ich einen Zuschlag, dafür muss ich mir das Risiko genauer angucken oder vielleicht akzeptiere ich die Klausel aus den und den Gründen gar nicht. Das ist dieser Aufwand, der noch zusätzlich dahintersteckt, wo man semantha® von unserem Wissen hinzugeben muss, was nicht out of the box funktioniert.
Toni Klein: Wie konkret erfährt der Underwriter in dem direkt Vergleich – ihr habt das vorhin durchgesprochen, links, rechts – gibt es dann eine Warnungsmeldung? Werden da automatisch Prozesse angestoßen oder denke ich da schon in die Zukunft?
Christoph Spix: Nein, da denkst du nicht in die Zukunft. Das funktioniert tatsächlich schon so. Es ist so, dass ich nicht nur mit den Referenzdokumenten vergleiche, sondern mit so etwas wie einer Library. Da stehen all diese Punkte drin, die wir in der Segelanleitung stehen haben. Da sagen wir: semantha®, vergleiche nicht nur mit den Referenzdokumenten, sondern auch mit dieser Library. Dann kann ich im Textdokument erkennen, was aus der Library stammt oder mache zuerst nur den Vergleich mit der Library, kann die Punkte direkt identifizieren und mir entsprechende Notizen machen. Das ist vielleicht noch wichtig zu ergänzen: Ich kann in dieser Webanwendung auch Häkchen setzen. Zu sagen: Der Passus ist okay. Ich kann aber auch jeden Passus in irgendeiner Weise kommentieren und mir das danach alles als Exceloutput geben lassen, sodass ich einen sehr schnellen Überblick habe, wa sich durchgewunken habe und was ich im Nachgang vielleicht noch mit dem Makler besprechen.
Ansgar Knipschild: Dieser – ich nenne es mal – Trainingsprozess. Das ist ein Begriff, der aus der KI- und AI-Welt kommt, dass ich Daten einem solchen System erst mal beibringen muss, damit es in seiner Erkennungs- oder in diesem Falle semantischen Vergleichsfunktion immer besser wird. Wie hat der bei Ihnen funktioniert? Haben Sie bei semantha® out of the box dieses Weltwissen, was sie schon mitbringt, inkrementell immer mehr Dokumente von Ihren Klauseln, Ihren Bedingungswerken mitdazugepackt und geschaut, bis es einen Wert erreicht hat, wo Sie mit der Qualität einverstanden waren? Oder haben Sie gesagt: Nein, wir brauchen eine kritische Untermenge von X Dokumenten, Bedingungswerken, die wir reinpacken müssen? Dass es ein numerisches Ziel gab, nach dem Motto: Hundert müssen drin sein. Vorher funktioniert es gar nicht?
Christoph Spix: Das kann man so allgemein nicht sagen. Wir trainieren die KI aktiv gar nicht. Das, was wirklich entscheidend ist, ist, was ich eben schon mal gesagt hatte. Dass wir viele Referenzdokumente haben. Wenn ich zehn Referenzdokumente darin habe, kann es schon eine gute Menge sein. Wenn es aber zehn Dokumente sind, die alle zum Beispiel sehr nah an den GDV-Bedingungen dran sind, dann habe ich, wenn ich ein weiteres Bedingungswerk prüfe, eine relativ geringe Wahrscheinlichkeit, dass ich sehr gute Treffer habe. Es sei denn, das ist auch wieder sehr GDV-nah. Wenn sich aber jemand die Mühe gemacht hat und ein eigenes Bedingungswerk entwickelt hat, dann können die Abweichungen vielleicht ein bisschen größer sein. Deshalb ist es total wichtig, dass wir eine hohe Zahl an Referenzdokumenten haben, weil ich dann entweder die Chance steigere, dass ich vielleicht ein Dokument erwische, wo der eine vom anderen ein Stück weit abgeschrieben hat oder wenn ich eine hohe Variation bei den Referenzdokumenten habe, dann steigere ich die Wahrscheinlichkeit, dass sich Klausel A in dem Dokument wiederfindet, Klausel B in dem Dokument und Klausel C in dem Dokument. Deshalb ist das total wichtig an der Stelle. Wir verbessern die KI gar nicht aktiv. Das macht Things Thinking vielleicht im Hintergrund noch. Sondern wir verbessern sie nur dadurch, dass wir einerseits viele Referenzdokumente nehmen und andererseits semantha® mit diesen Segelanleitungen füttern.
Ansgar Knipschild: Gut. Das ist für mich ein wichtiges Learning, denn klassischerweise kenne ich aus solchen AI-Projekten genau diese zwei Phasen, das reine Trainieren, indem man Beispieldokumente reingibt. Vor Kurzem habe ich zum Beispiel mit einem Kollegen aus dem Versicherungsbereich gesprochen, die im Bereich Beschwerdemanagement gerade eine AI trainieren. Die sind in einem recht lang laufenden Projekt. Unterm Strich Tausende von Beschwerdekorrespondenzen vom Kunden einzuscannen, zu kategorisieren, damit dann die KI darauf lernt und erst wenn das erfolgt ist in einer entsprechenden Zahl, kann ich mit dem System arbeiten. Hier ist es so, dass das Wissen über den semantischen Vergleich eigentlich schon drin ist und sie durch steigende Anzahl von Beispieldokumenten, die sie konkret vergleichen. Da hat es gerade bei mir Klick gemacht. Und darüber die Qualität hochschrauben. Dass sie sagen: Ich packe nicht nur ein Bedingungswerk zum Vergleich rein, sondern fünf aus dem ähnlichen Bereich, vom GDV, von Ihnen aus dem Haus, vielleicht von zwei, drei Tarifen und so weiter, um darüber die Varianz, die von Maklerseite reinkommt, besser abgleichen zu können.
Christoph Spix: Exakt. Richtig.
Ansgar Knipschild: Dann – aus Anwendersicht – muss ich zwischen diesen verschiedenen Beispieldokumenten umschalten, um zu sehen, wie die Unterschiede sind? Sie haben eben gesagt, dass das führende Dokument das des Maklers ist, was reinkommt. Linke Seite, stelle ich mir vor. Rechts daneben die gefundenen Abschnitte. Sehe ich die quasi untereinander, die er in den verschiedenen Referenzdokumenten gefunden hat oder muss ich mich einzeln durchklicken und gucken, das habe ich da und da gefunden?
Christoph Spix: Mir wird erst mal immer der allerbeste Treffer aus allen Referenzdokumenten angezeigt. Das ist wie eine Summary. Das steht auch oben drüber. Ich kann das aber auch ändern. Ich kann sagen: Vergleiche zum Beispiel nur mit dem Dokument A. Und ich habe, wie Sie gerade schon gesagt haben, die Möglichkeit zu sagen: Ich will aber auch wissen, wo diese Textstelle herkommt. Dann kann ich auch über einen Klick sehen, welches Dokument die Quelle dafür darstellt und sehe dann auch noch die weiteren Treffern. Das heißt, ich sehe erst mal nur den besten Treffer. Der wird mir direkt angezeigt. Und über so eine Dropdown-Liste sehe ich auch noch die nächstbesten Treffer, die vielleicht aus anderen Referenzdokumenten stammen oder ich sehe, dass ich mehrere hundert-Prozent-Treffer habe und nicht nur einen.
Ansgar Knipschild: Die Entscheidung, welcher Tarif passt, wenn es überhaupt Tarife gibt im kleineren oder mittleren Gewerbegeschäft oder individuell anbieten, das ist klassisches Entscheiden des Underwriters, der aufgrund des Ergebnisses für sich gucken muss, wie er auf den konkreten Anwendungsfall reagiert.
Christoph Spix: Genau. Bei den identischen Treffern können wir tatsächlich, da machen wir schon einen Haken dran. Aber alles andere ist immer noch Entscheidung des Underwriters. Die Arbeit geht natürlich nicht verloren – des Underwriters oder des Produktmanagers. Wer auch immer gerade das Bedingungswerk prüft.
Ansgar Knipschild: Ich habe mir gerade vorgestellt, wenn die hundert-Prozent-Treffer – wenn wir mal den Idealfall durchgehen – alle aus einem bestimmten Tarif kommen und würden und man da als Ergebnis hat: Ich habe zehn Abschnitte aus dem Bedingungswerk des Maklers und ein hundert-Prozent-Treffer bei Tarif A, dann wäre es trivial zu sagen: Tarif A passt logischerweise auch. Je mehr das durchmischt ist von verschiedenen Ergebnissen und inwieweit Geschäft wird, gerade im schweren Industriegeschäft, umso mehr bleibt es klassische Underwriting-Entscheidung des Underwriter-Kollegens hier.
Christoph Spix: Genau.
Ansgar Knipschild: Ein Stichwort noch zur Sprache. Ich unterstelle, dass wir primär im deutschsprachigen Raum unterwegs sind. Ist semantha® theoretisch auch in der Lage mehrsprachig zu arbeiten, wenn zum Beispiel ein englisches Bedingungswerk mit reinkommt? Vielleicht sogar gemischt. Wissen Sie das?
Christoph Spix: Deutsch ist definitiv möglich. Da nutzen wir das vorwiegend. Mit Englisch ist auch kein Problem. Das funktioniert auch hervorragend. Ich hatte auch dieses Thema schon angesprochen, Englisch mit Deutsch zum Beispiel. Das haben sie noch nicht ausgerollt, aber an sowas wird gearbeitet. Ob noch weitere Sprachen möglich sind, kann ich ehrlich gesagt gerade nicht sagen.
Ansgar Knipschild: Bei internationalem Geschäft natürlich nicht uninteressant, wenn man Master Police, lokale Policen hat, verschiedenste Bedingungswerke und da auch schauen muss, was man an lokale Gegebenenheiten anpassen muss.
Toni Klein: Herr Spix, ich muss an dieser Stelle schon mal sagen: Danke, dass Sie uns so tolle Auskunft geben. Ich kann es mir schon richtig vorstellen, links und rechts und die Ergebnisse purzeln raus. Wo wir gerade dabei sind, frage ich Sie konkreter nach dem Projektablauf. Sie haben angedeutet, dass es eine interne Recherchephase gab, dann sind Sie auf semantha® oder Things Thinking gestoßen, haben diese achtwöchige Evaluation gemacht und wie ging es dann weiter? Wie war der Ablauf von dieser Entscheidung mit semantha® zu starten bis hin, wo Sie jetzt im Grunde sind? Auch in Richtung Training von Underwritern. Man muss es ja auch den Benutzern an die Hand geben. Wie sind so die groben Abläufe gewesen? Können Sie darauf noch mal eingehen?
Christoph Spix: Wir haben Ende 2019 diese Evaluationsphase gemacht. Dann haben wir die konzerninternen Prozesse angestoßen, so was wie Einkauf, Rechtsabteilung – war natürlich bei der Prüfung involviert, die Mitbestimmungsgremien. Und sind dann im April in diese Jahreslizenz gestartet und haben dann noch ein paar Anpassungen vorgenommen und sind dann eingestiegen, dass wir Workshops gemacht haben, wo wir semantha® den verschiedenen Kollegen und Kolleginnen aus dem Produktmanagement vorgestellt haben. Auch in den Underwriting-Einheiten haben wir das zuletzt vorgestellt und haben da gesagt: Probiert euch erst mal damit aus. Wenn ihr konkrete Probleme, Fragestellungen habt, dann kommt gerne auf uns zu. Wir haben dafür noch eine Anleitung zusammengestellt, wo wir gesagt haben: Das sind erst mal die wichtigsten Schritte und wenn euch darüber hinaus an der einen oder anderen Stelle noch was fehlt oder ihr noch Verbesserungsvorschläge habt, dann kommt auf uns zu und dann passen wir semantha® gegebenenfalls an den notwendigen Stellen an.
Toni Klein: Wie würden Sie beschreiben, war grundsätzlich Bauchgefühl Akzeptanz?
Christoph Spix: Da wären wir vielleicht schon bei dem Thema Hemmnisse. Da fallen mir spontan zwei Punkte ein. Das ist einmal das Thema Erwartungshaltung der Mitarbeiter. Es ist so, dass zum Beispiel semantha® auch sagt: Wenn in einem Dokument steht, Krieg ist versichert und in dem anderen steht Krieg ist nicht versichert. Dann sagt semantha® erst mal, das ist semantisch ähnlich, wenn auch nicht zu hundert Prozent, aber da ist eine semantisch hohe Übereinstimmung, weil es sich mit derselben Thematik befasst. Viele Kollegen sagen, sie würden erwarten, dass da steht: Nein, das ist kein semantischer Treffer. Das ist der eine Punkt. Und der andere Punkt ist, dass viele zum Ausprobieren sagen: Ich habe jetzt ein neues Bedingungswerk bekommen und das vergleiche ich einfach mit unseren Standard-Bedingungswerk. Also ein 1:1-Vergleich. Der kann aber an vielen Stellen ernüchternd sein, weil wir da nicht diese hohe Zahl an Referenzdokumenten haben. Es kann sein, dass wir hier gegebenenfalls einen Glückstreffer haben, dass beides zum Beispiel GDV-nah ist. In vielen Fällen ist es aber so, dass da sehr viel Glück mit reinspielen muss – dass man zwei Dokumente hat, die semantisch sehr übereinstimmend sind, dass man relativ wenige Treffer hat und wo die Mitarbeiter dann sagen: Das bringt mir ja so nichts. Da kann man nur gebetsmühlenartig sagen: Da musst du viele Referenzdokumente nehmen und probiere es dann noch mal aus. Und der andere Punkt ist dieses Thema Initialaufwand zur Hinterlegung von sowas wie diesen Segelanleitungen. Tagesgeschäft ist nach wie vor herausfordernd, zeitintensiv und dadurch bleibt teilweise keine Zeit sich mit so neuen Themen initial zu beschäftigen, sich auf der Plattform zurechtzufinden und dann auch noch zusätzlich diese Segelanleitung, die man eigentlich schon mal gebastelt hat, noch mal in dieses System zu übertragen. Das sind vor allem diese kritischen Punkte, die wir aktuell haben. Wo wir gerade schauen, wie wir das bestmöglich anpassen können und die Mitarbeiter besser abholen können.
Toni Klein: Ich korrigiere mich ganz kurz, ich habe es Projektablauf genannt. Eigentlich ist es gar kein Projekt, sondern es hat angefangen, konkret im November 2019 und es wird immer weiter und weiter gehen. Sie sind jetzt in der ersten Phase der Annäherung, des Ausprobierens und dann gibt es, nehme ich an, weitere Stufen, die Sie angehen werden.
Christoph Spix: Genau. Diesen Projektstatus hatten wir vielleicht in dieser Evaluationsphase, wo wir sehr intensiv daran gearbeitet haben. Ansonsten haben wir noch so eine kleine Gruppe, die aus diesen Teilnehmern aus diesem Projekt besteht, die sich immer wieder intensiver damit befassen, die die Anlaufstellen für die übrigen Mitarbeiter sind, die die Anforderungen sammeln und die diese Anforderungen auch an Things Thinking übergeben.
Ansgar Knipschild: Ich fand eben den Aspekt beim Erwartungsmanagement interessant, dass die Mitarbeiter semantischen Vergleich und wahrscheinlich versicherungsfachlichen Vergleich – nicht durcheinander gebracht haben, das ist vielleicht zu negativ formuliert – aber dass die Erwartung da aneinander vorbeiging. Weil die Maschine nur auf textliche Ähnlichkeit gehen, aber nicht auf das, was letztendlich der Kern des Geschäfts ist, nämlich was es versicherungsfachlich bedeutet. Ihr Beispiel von Krieg war da. Ich kann es mir bei vielen anderen Sachen auch vorstellen. War das so, dass die Mitarbeiter eher von der Magix-Box-Wissen ausgegangen waren? Die sagten: Jetzt kriege ich hier eine schön saubere Analyse? Dass die Erwartungen da schon fast zu hoch waren? Gerade wenn man dann noch KI und AI hört?
Christoph Spix: Ja, ich glaube, dass das bei KI grundsätzlich ein großes Thema ist. Wir wollen die Mitarbeiter ja nicht abschaffen und das kann KI auch niemals. Das ist so ein bisschen der Punkt. Der eine oder andere erhofft sich: Okay, dann schmeiße ich nur noch die Dokumente da raus, dann habe ich das Ergebnis und dann kann ich direkt auf den Makler zugehen. Aber trotzdem ist nach wie vor der Mensch da sehr gefragt, diese Punkte zu bewerten. Es geht darum, die sehr einfachen Punkte schnell durchzuwinken, aber selbst die sieht der Anwender hier noch und muss sagen: Okay, ist identical. Aber gerade die anderen Punkte, da ist eben wichtig, dass man sich auf diese Themen fokussieren kann, die auch anspruchsvoller sind. Da wird der Mensch nach wie vor immer gefragt sein, diese Sachen zu bewerten und nicht schon ein fertiges Ergebnis von der KI direkt an den Makler zu schicken.
Ansgar Knipschild: Ich glaube, das wird auch ein fortwährender Prozess sein. Dass wenn man vom semantischen Vergleich zu einem mehr inhaltlichen Vergleich kommt, wofür man die Texte ganz anders trainieren müsste. Man müsste dann klassifizieren, ein solches Bedingungswerk ist an die und die Deckung gebunden, vielleicht sogar an die und die Prämienbausteine. Das könnte man noch weiter spinnen. Und dann aufgrund einer semantischen Ähnlichkeit versucht das miteinander zu verbinden. Aber das wird noch ein kleiner Weg sein und dann sind wir wieder bei dem Trainingsthema, was wir bei vielen AI-Projekten beobachten, wo ich eine kritische Menge brauche. Das kann ich eben nicht mit fünf oder zehn Dokumenten machen, sondern dafür brauche ich schon ein paar mehr, damit da signifikant was rausgeht. Und jetzt sind es „nur“ Werkzeuge, die den Mitarbeiter von der lästigen Routinearbeit abhalten. Ich glaube, das gut und geschickt zu kommunizieren ist, glaube ich, echt nicht einfach, weil die Erwartungshaltung wahrscheinlich viel höher ist als das, was im ersten Step zumindest rauskommt.
Christoph Spix: Genau und die Kollegen haben das jahrelang in der gewohnten Weise gemacht, diesen manuellen Prozess der Wording-Prüfung und da auch signifikante Teile ihrer Arbeitszeit reingesteckt. Das ist wirklich ein Change-Prozess, den wir dann noch gehen müssen.
Toni Klein: Dann würde ich noch einmal kurz den Fokus auf den anderen Aspekt, nämlich des Betriebes, der Operation richten wollen. Wie funktioniert der Betrieb? Ist semantha® eine On-premise-Lösung? Ist es Software-as-a-service?
Christoph Spix: Das ist an der Stelle bei uns eine Software-as-a-service-Lösung, wobei nach meinem Kenntnisstand Things Thinking auch On-premise-Lösungen liefert. Das ist abhängig von dem, was der Anwender oder der Kunde möchte. Da ist Things Thinking flexibel an der Stelle.
Toni Klein: Das bringt mich zur nächsten Frage. Sie hatten vorhin gesagt, Lizenzmodell, eine Jahreslizenz. Warum haben Sie sich für dieses Modell entschieden beziehungsweise welche Modelle gäbe es theoretisch auch noch?
Christoph Spix: Da mussten wir uns nicht entscheiden. Da gab es nur diese Möglichkeit. Es gibt nur die Möglichkeit einer Jahreslizenz, deshalb haben wir die auch am Ende gemacht. Und standen gar nicht vor der Wahl, was Stückzahlbezogenes oder Ähnliches zu machen.
Ansgar Knipschild: Ist das eine Pauschallizenz oder ist die von irgendwelchen Zahlen, Benutzern oder Anzahl der Vergleiche/? Gibt es da einen Treiber?
Christoph Spix: Nein. Das ist eine Jahreslizenz, die nicht noch an irgendwelche Stückzahlen oder Nutzerzahlen oder Ähnliches gebunden ist. Wir können da theoretisch auch was mit der Rechtsabteilung machen. Natürlich immer unter dem Vorwand, dass man mit Mitbestimmungsgremien noch was besprechen müsste. Aber grundsätzlich können wir das konzernweit verteilen.
Ansgar Knipschild: Nach diesen Erfahrungen, die Sie mit semantha® gemacht haben – muss man wiederholen, semantischer Vergleich; wir sind noch nicht so weit, dass wir in meiner Definition von echter künstlicher Intelligenz sprechen, auch wenn wir in deutlichen Schritten in die Richtung gegangen sind. Wie sehen Sie die Zukunft von dieser oder vielleicht auch ähnlichen Lösungen? Sehen Sie realistisch Potenzial in diesen doch individuellen Industriegeschäft mehr Intelligenz reinzubringen? Ich habe es eben ein bisschen anskizziert, was man vielleicht machen könnte. Glauben Sie, da kommt man irgendwann in den nächsten fünf Jahren hin? Oder sagen Sie: Nein, nach diesen Erfahrungen von einer vermeintlich einfachen Aufgabe ist da noch ein zu weiter Weg zu gehen. Wie schätzen Sie das ein?
Christoph Spix: Das ist eine gute Frage. Ich glaube, dass semantha® uns bei dem konkreten Problem wirklich gut weiterhilft und uns dieses semantische Textverständnis an vielen Stellen weiterhelfen kann. Wir stehen hier kurz vor einem weiteren POC mit Things Thinking, wo wir sagen: Wir haben im Sachindustriebereich diese sehr umfangreichen Risikoberichte, die wir vielleicht auch ein Stück weit automatisieren wollen. Wo wir sagen, wir wollen die wichtigsten Informationen gesammelt, strukturiert zusammenstellen, da vielleicht eine Priorisierung in die Anfragen reinbekommen und auch eine schnellere Bewertung hinbekommen und auch eine schnelle Überführung in unsere Systeme gewährleisten. Das heißt, da sehen wir durchaus noch Anknüpfungspunkte. Und ich glaube, dass wir tendenziell nicht nur im Versicherungsbereich grundsätzlich viele Anknüpfungspunkte, wo wir sagen: Wir befassen uns mit viel Text, vielen Textdokumenten, wo vielleicht auch wiederkehrende Sachen kommen. Ich weiß nicht, ob es vielleicht in Rechtsabteilungen, im Einkauf oder auch in anderen Branchen Anknüpfungspunkte gibt. Da sind wirklich viele Anknüpfungspunkte für das Thema.
Ansgar Knipschild: Das ging in Richtung Textanalyse, wenn ich es richtig verstanden habe. Bei den Berichten, vielleicht wenn Risikoingenieure ihr (Ton) schreiben, dass sie daraus die Key Essentials rausziehen und kondensieren. Habe ich das richtig verstanden?
Christoph Spix: Genau. Wenn zum Beispiel was zu Brandschutzmaßnahmen drinsteht, dass die extrahiert werden, dass Angaben extrahiert werden. Das sind immer Dokumente, die wir von Maklern oder anderen Versicherern aus dem Konsortium erhalten, die oftmals umfangreich sein können. Vielleicht sind es auch ganze Portfolios und wollen darüber auch zu einer schnelleren Entscheidung kommen.
Ansgar Knipschild: Ich persönlich bin sehr gespannt, wie es da weitergeht. Ich glaube, man verschätzt manchmal die Geschwindigkeiten, mit der es vorangeht, vielleicht gerade beim unstrukturierten Text. Dass man aus dem was rausziehen kann. Beim strukturierten Text habe ich vor Kurzem von einem Projekt im Detail gehört, wo versucht wurde mit entsprechenden intelligenten Maßnahmen aus Bilanzen und G-und-Ven und Financial Lines was rauszuziehen. Und das, was für den Menschen so einfach aussieht – ich habe das doch schon so hochstrukturiert in PDFs, aktiver, passiver, Barvermögen und so weiter – ist immer noch richtig schwer. Das ist genau diese Diskrepanz, die wir dahaben. Ich persönlich – so habe ich es von den Experten – dass wir im strukturierten Bereich vielleicht schnellere Fortschritte machen. Hier ist eine eingescannte G und V, packt mir die bitte in meine Maske. Da sind wir interessanterweise doch noch sehr weit weg von entfernt, wie man es sich gerne wünschen würde.
Christoph Spix: Das ist interessant, dass Sie das Thema ansprechen, weil wir da mit einem anderen Anbieter aktuell in einem POC sind und genau das machen, nämlich Bilanzen auslesen aus umfangreichen Jahresberichten.
Ansgar Knipschild: Und, gibt es schon erste Erkenntnisse? Klappt das bei Ihnen besser als von mir gerade geschildert?
Christoph Spix: Es klappt auf jeden Fall schon sehr gut. Zumindest, dass es auf jeden Fall eine Erleichterung ist. Wir haben nach wie vor aber immer noch Stellschrauben, wo wir sagen: Da kann man noch in die und die Richtung das Ganze ein bisschen verfeinern, dass wir sagen, dass es am Ende zuverlässig ist.
Ansgar Knipschild: Ich glaube, das ist überhaupt die Denke – Sie haben vom Change-Prozess gesprochen – anfreunden muss, dass man die Erwartung nicht sofort von null auf hundert schraubt. Sondern sagt: Okay, wenn ich bei der Übernahme von G-und-V-Zahlen die Daten schon mal in der Maske drin habe und nur noch visuell abprüfen muss, wo es stimmt, wo nicht, ist es für den Erfasser oder die Erfasserin deutlich einfacher das machen als alles abzutippen. Auch wenn man sich vermutlich immer wieder drüber ärgert, dass man diesen letzten Schritt noch machen muss. Ich kenne das auch aus dem Bereich der UCR, wenn zum Beispiel Banküberweisungen automatisch erfasst werden müssen, ist das gleiche Thema. Wo man doch immer wieder mal, zumindest stichprobenartig drüber gehen muss. Aber die berühmten achtzig Prozent schon mal automatisch ab gefrühstückt hat. Und vielleicht nur noch die Felder kennzeichnet, wo ein Fragezeichen dran ist und da den oder die Sachbearbeiterin hinlenkt und nachkorrigiert. So wächst dann die Maschine, die vermeintliche künstliche Intelligenz, Stück für Stück stärker rein und hüpft von dieser doch recht eintönigen Arbeit wegzukommen.
Christoph Spix: Wichtig ist an der Stelle, dass die Grundvoraussetzungen da sind. Things Thinking zum Beispiel waren auch nicht auf den Versicherungsbereich fokussiert. Wir waren, glaube ich, der erste Partner an der Stelle. Dass man da noch die Entwicklungsschritte mit dem Anbieter mitgehen muss. Wenn die aber grundsätzlich das bereitstellen, was einem hilft, dann glaube ich, kann das eine total fruchtbare Partnerschaft sein. So kann man das Ganze auch an die eigenen Bedürfnisse anpassen.
Ansgar Knipschild: Wenn Sie persönlich einen Wunsch an die künstliche Intelligenz semantha® hätten, in den nächsten fünf Jahren, berühmte Abschlussfrage: Wie würden Sie sich solch eine Intelligenz wünschen?
Christoph Spix: Wie würde ich mir eine solche Intelligenz wünschen? Das ist eine sehr gute Frage. Ich finde – das war damals auch der Impuls – Wording-Prüfung ein relativ lässiges Thema. Ich fänd total klasse, wenn man die Bedingungswerke nur reinwirft und bekommt am Ende die drei Knackpunkte raus und ist fertig. Ich denke, dass wir davon noch ein Stück weit von entfernt sind. Das sehe ich auch nicht in den nächsten fünf Jahren. Weil die Dokumente in sich vielleicht doch zu unterschiedlich sind an vielen Stellen. Mir käme es aber trotzdem sehr entgegen.
Ansgar Knipschild: Ich glaube, da bleibt noch ein wenig Arbeit für uns alle da. Sowohl von der fachlichen Seite, um da ein bisschen vorstrukturiert zuzuarbeiten und von der technischen Seite sicherlich auch. Hört sich nach einem sehr interessanten Wunsch an. Herr Spix, vielen Dank für Ihre Teilnahme hier am Podcast. Ich habe eine Menge gelernt, eine Menge mitgenommen. Vielen Dank für das Teilen Ihrer Erfahrung hier. Ich hoffe, dass unsere Zuhörer und Zuhörerinnen auch was mitgenommen haben. Vielen Dank auch an Dich, Tony, fürs gemeinsame Führen durchs Gespräch.
Toni Klein: Hat mir Spaß gebracht. Danke, Herr Spix. Super Gespräch.
Christoph Spix: Vielen Dank, dass ich heute hier sein durfte. War für mich wie gesagt das erste Mal. Wenn jemand im Nachgang vielleicht noch Interesse hat oder das Ganze mal sehen will zum Beispiel, bin ich gerne bereit da auch ein bisschen mehr zu zeigen. Gerne Kontaktaufnahme, im Zweifel über LinkedIn oder wie auch immer. Da bin ich gerne bereit und freue mich da über Feedback. Danke schön.
Ansgar Knipschild: Super. Das geben wir gerne so weiter. Und vielleicht gibt es auch noch eine Idee für ein interaktives Format, wo wir versuchen unsere Zuhörerinnen und Zuhörer aus Industrieversicherung Digital mit dazuzuholen. Das geben wir auf jeden Fall so weiter. Vielen Dank, einen schönen Tag an alle und bis zur nächsten Folge. Bis dann, tschüss!
Toni Klein: Tschüss!
Der Podcast „Industrieversicherung Digital“ ist eine Initiative für den offenen Austausch über die Digitalisierung von Industrie- und Gewerbeversicherung: Versicherer, Makler, Kunden und IT im direkten Dialog.
Machen Sie mit! Wenn Sie ein spannendes Thema, einen Erfahrungsbericht oder einen persönlichen Standpunkt mit Kolleginnen und Kollegen diskutieren möchten, melden Sie sich bei uns: E-Mail und LinkedIn-Gruppenlink auf der Mitmachen-Seite.
Podcast abonnieren über: