Bessere Daten dank künstlicher Intelligenz

Geht es um ESG, Lieferketten und Compliance, stellen fehlende Daten und mangelnde Datenqualität die größten Hindernisse bei der Bewertung dar. Dienstleister wie Creditreform sehen sich regelmäßig mit unvollständigen Datensätzen konfrontiert und müssen diese komplettieren oder gleich ganz bei Null anfangen. Wie generative KI und Data Analytics fair, transparent und zuverlässig dabei helfen können, erforscht Creditreform jetzt in einem gemeinsamen Projekt mit der Technischen Universität München (TUM). Prof. Dr. Gjergji Kasneci, Leiter des Lehrstuhls Responsible Data Science, stellt die Kooperation und ihre Ziele vor und spricht über die Chancen, die Künstliche Intelligenz für alle Unternehmen bieten kann.

Professor Dr. Gjergji Kasneci, Leiter des Lehrstuhls Responsible Data Science an der Technischen Universität München, erklärt im Gespräch mit Jessica Springfeld (Handelsblatt Media Group), wie maschinelle Lernalgorithmen fair, transparent und zuverlässig sind.

Lesen statt hören: Podcastfolge #30 zum Nachlesen

Jessica Springfeld: Stellen Sie sich vor, Sie sind auf der Suche nach einem neuen Lieferanten oder Geschäftspartner. Dieser behauptet, nachhaltig und umweltfreundlich zu wirtschaften. Doch wie können Sie sich sicher sein, dass diese Versprechen nicht nur leere Worte sind?

Jingle: Gute Geschäfte. Businesswissen in zehn Minuten. Der Creditreform Podcast.

Jessica Springfeld: In dieser Folge werfen wir einen Blick auf eine spannende Kooperation zwischen der Technischen Universität München und Creditreform. Gemeinsam erforschen sie, wie KI-basierte Methoden die Qualität von Unternehmensdaten steigern können und im gleichen Schritt auch die Recherche, zum Beispiel um Greenwashing zu bekämpfen. Vor dem Podcast haben wir mit Dr. Oliver Köttnitz, Chief Business Development Officer bei Creditreform, gesprochen und nach weiteren Einsatzgebieten gefragt.

Oliver Köttnitz: Zukünftige Anwendungsfälle in diesem Gebiet umfassen dabei zum einen die Nutzung von KI zur Erfassung und Verarbeitung von strukturierten und unstrukturierten Informationen. Darüber hinaus kann uns KI zukünftig dabei unterstützen, Informationen zu validieren und somit bietet sie eine zusätzliche Möglichkeit zur Qualitätskontrolle der Recherche in Echtzeit. Ein dritter Anwendungsfall in diesem Kontext ist die Datenbereinigung, in dem uns KI zukünftig dabei unterstützen kann, inkonsistente Informationen zu identifizieren und gegebenenfalls zu korrigieren.

Jessica Springfeld: Ich gebe zu, beim ersten Hören wirkt das vielleicht noch verwirrend. Aber genau deshalb haben wir mit dem Top-Forscher hinter diesem Projekt gesprochen: Professor Dr. Gjergji Kasneci, er leitet den Lehrstuhl Responsible Data Science an der Technischen Universität in München und arbeitet daran, dass maschinelle Lernalgorithmen fair, transparent und zuverlässig sind. Herzlich willkommen!

Gjergji Kasneci: Hallo von meiner Seite, Ich freue mich, heute hier zu sein!

Jessica Springfeld: Wir freuen uns, dass Sie es geschafft haben. Wir haben gerade einen O-Ton gehört von Oliver Köttnitz und er sieht ja tatsächlich große Chancen in dem Forschungsprojekt, das Sie gemeinsam vorantreiben. Jetzt ist das alles noch sehr theoretisch, deswegen steigen wir mal ein und machen es so konkret wie möglich. In dem Forschungsprojekt arbeiten Sie speziell an ESG-Daten. Warum gerade die Daten?

Gjergji Kasneci: Also gerade in der heutigen Zeit ist ja das Thema Environmental Social Governance ein super wichtiges Thema. Weil es geht ja im Prinzip darum, Unternehmen in die Lage zu versetzen, ihre Geschäftsstrategien nachhaltig zu gestalten und verantwortungsvoll zu gestalten. Und dort gilt es auch darum zu schauen, ob die Werte, die übermittelt werden oder in unterschiedlichen Webquellen stehen, ob sie auch der Wahrheit entsprechen. Also das Thema Greenwashing spielt hierbei eine besonders wichtige Rolle. Also wenn Sie zum Beispiel auf Zahlen schauen wie Unternehmensgröße, CO2-Ausstoß, passen denn diese Werte überhaupt zusammen? Wie kann man das feststellen? Und auch hier gilt es darum, historische Trends zu analysieren und gemeinsam mit Experten zu schauen: Sagen uns die Algorithmen das Richtige? Werden hier die richtigen Quellen in Betracht gezogen? Und so können wir im Prinzip in Iterationen gemeinsam mit Expertenwissen, mit zuverlässigen Quellen und mithilfe dieser fortschrittlichen Verfahren immer bessere Daten auch generieren.

Jessica Springfeld: Hier geht es dann ganz konkret immer um die Zahl CO2-Ausstoß oder was könnte da noch dazu gehören?

Gjergji Kasneci: Es geht nicht nur um CO2-Ausstoß, es geht auch um Unternehmenspraktiken. Mit wem arbeiten Unternehmen zusammen? Wo werden die Rohstoffe hergeholt? Welche Energiequellen werden verwendet? Wie sind die sozialen Praktiken eines Unternehmens, wie sehen sie aus etc? Diese ganzen Werte, die aus unterschiedlichen Quellen herkommen und aggregiert werden. Da muss man schauen: Wie realistisch ist das? Ist es das, was Experten erwarten würden? Ist es was uns die historischen Werte sagen? Und so würde man diese Algorithmen wirklich kontinuierlich trainieren.

Jessica Springfeld: Wir haben also eigentlich zwei Anwendungsfälle. Wir haben einmal den Fall: Da ist ein Unternehmen, das hätte gern Daten über seine eigenen ESG-Kriterien, kriegt sie aber nicht zustande, weil es oft sehr, sehr schwierig ist, das zu berechnen und das hat dann  einen neuen Weg, das zu tun. Und das zweite, höre ich raus, ist Daten zu überprüfen. Also zu gucken: Betreibt da jemand Greenwashing? Jetzt ist das Forschungsprojekt auf drei Jahre angelegt. Aber sind Sie da schon über Sachen gestolpert, wo Sie gedacht haben "Oha, da ist aber doch eine große Differenz zwischen dem, was das Unternehmen angibt, und dem, was wir prognostizieren, mit unseren Algorithmen".

Gjergji Kasneci: Genau, solche Fälle gibt es in der Tat immer wieder. Und das fängt ja schon bei dem Thema der Quellenbewertung an. Welche Quellen sind zuverlässig im Web? Wie findet man das algorithmisch heraus? Man kann ja nicht über alle Quellen manuell rübergehen und mit Experten gemeinsam schauen: Ist diese Quelle zuverlässig oder nicht? Und manchmal ist es ja auch so, dass selbst zuverlässige Quellen mal nicht ganz so richtig liegen mit dem, was sie berichten. Und auch dort gilt es, aus wirklich vielen Quellen eine Aggregation hinzubekommen, die am Ende doch der Wahrheit auf die Schliche kommt. Und dort spielen unterschiedliche Algorithmen eine Rolle. Also welches Gewicht bekommt eine Quelle und wie werden diese gewichtet und am Ende aggregiert, sodass man möglichst die Wahrheit hat am Ende der Pipeline? Das sind so die Fragen, die wir uns stellen. Ich meine, das Projekt hat gerade angefangen. Wir sind auf einem guten Weg, aber da gibt es noch Einiges zu forschen. Das sind ja drei Jahre, die wir vor uns haben, und wir freuen uns darauf, mit diesen Herausforderungen fertig zu werden.

Jessica Springfeld: Wir wollen ja heute so konkret wie möglich sein. Und deshalb kehre ich noch einmal zurück zu Oliver Köttnitz, denn er hat losgelöst von ESG noch weitere spannende Anwendungsbeispiele im Sinn.

Oliver Köttnitz: Auch im breiteren Kontext der Betrugserkennung und Prävention wird KI zukünftig eine immer wichtigere Rolle spielen, nämlich immer genau dann, wenn es darum geht, in großen Datenmodellen auffällige Verhaltensmuster bzw. Anomalien zu identifizieren, die auf potenzielle Betrugsfälle hinweisen können. Und so kann KI zum Beispiel im E-Commerce dazu genutzt werden, eine Transaktionsüberwachung in Echtzeit zu etablieren und Zahlungsausfälle zu minimieren. Stichwort Zahlungsausfälle: Abgesehen von der Anomalieerkennung hat KI natürlich ein weiteres großes Anwendungsgebiet, nämlich im Bereich von Vorhersagemodellen im Risikomanagement. Und da gibt es viele, viele Beispiele. Dazu zählen unter anderem Frühwarnmodelle zu drohenden Zahlungsausfällen oder Insolvenzen. Oder im positiven Fall Prognosemodelle zur Vorhersage von Zahlungsströmen, welche Unternehmen dann dazu nutzen können, ihre Cash Flow Planung zu optimieren. Ein weiteres Beispiel wären Prognosemodelle, die die Kapitaldienstfähigkeit von Kreditnehmern vorhersagen. Sie sehen, es gibt eine Vielzahl an Möglichkeiten, wie KI Unternehmen perspektivisch dabei unterstützen kann, bessere Entscheidungen zu treffen und letztendlich ihr Geschäft zu optimieren.

Jessica Springfeld: Sie haben es gerade schon gesagt. Man steht noch am Anfang. Mit dem Forschungsprojekt. Auf drei Jahre ist es angelegt. Deswegen gucken wir mal in die Zukunft. Drei Jahre nach vorne, 2028, während wir dann. Und wie wird sich da Ihrer Meinung nach die generative KI - vielleicht einmal logischerweise auf Ihr Projekt bezogen - aber auch generell entwickelt haben? Und wie wird das vielleicht dann auch unseren privaten und beruflichen Alltag beeinflussen?

Gjergji Kasneci: Also das sehen wir ja heute schon. Es findet eine stärkere Integration von KI Algorithmen im Alltag statt, also Modelle wie ChatGPT helfen uns beim Texte schreiben, E-Mails, schreiben, auch bei organisatorischen Aufgaben. Aber ich denke, gerade auch bei der Unterstützung kreativer Prozesse wird das eine große Hilfe sein, solche KI Modelle zu verwenden. Und es gibt natürlich auch neue Anwendungsbereiche. Also wenn Sie das Thema Chatbots nehmen und Kundenführung, ein besseres Verständnis über Kundenwünsche generieren, maßgeschneiderte Lösungen, maßgeschneiderte Strategien. Ich glaube, das sind Bereiche, wo die KI immer mehr helfen wird. Das Thema Umgang mit komplexeren Daten, Verarbeitung von komplexeren Daten. Da nimmt die KI heute schon eine wichtige Rolle ein. Aber ich glaube, in Zukunft wird diese Rolle noch weiter wachsen. Denn Effizienzsteigerung hilft uns in vielen Bereichen und ich glaube, wo wir sehr viel profitieren können, ist wirklich diese Kombination von Expertenwissen und schneller Verarbeitung, effizienter Verarbeitung durch KI und die Unterstützung bei kreativen Prozessen.

Jessica Springfeld: Jetzt vielleicht noch eine Frage zum Abschluss. Ihr Lehrstuhl heißt ja Responsible Data Science und ich habe es auch schon angesprochen: Ihr Anliegen ist ja wirklich zu gucken, das die Daten sicher sein müssen. Sie müssen fair sein, sie müssen nachvollziehbar sein. An welchen Stellen glauben Sie, dass wir da noch einen Weg vor uns haben? Vielleicht auch in den nächsten drei Jahren? Wo sind gerade Punkte, wo Sie sagen, wenn Sie sich Modelle anschauen, da sind vielleicht noch Stolpersteine, die wir ausmerzen sollten.

Gjergji Kasneci: Eine sehr gute Frage und ich glaube, eine sehr relevante Fragem, vorausgesetzt dass es heute so ist, dass Algorithmen in anderen Bereichen schon super realistische Daten generieren können. Wenn Sie das Thema Bildgenerierung nehmen, Videogenerierung. Wir haben heute schon sehr viel zu kämpfen, gerade in sozialen Medien mit Fake News, Fake Bildern, Fake Filmen. Und müssen wir einerseits eine stärkere Regulierung haben, wie die Algorithmen eingesetzt werden können. Aber auf der anderen Seite aus der Forschungsperspektive, sollten wir Algorithmen entwickeln, die in der Lage sind zu erkennen: Wann ist denn ein Inhalt durch die KI generiert? Ich glaube, das sind zwei Bereiche, wo wir sehr viel tun müssen und einen starken Fokus haben müssen.

Jessica Springfeld: Herr Kasneci, vielen, vielen Dank für die spannenden Einblicke und ganz viel Erfolg bei Ihrem Forschungsprojekt.

Gjergji Kasneci: Vielen herzlichen Dank!

Jessica Springfeld Und das war unsere neueste Folge Gute Geschäfte. Mein Name ist Jessica Springfeld. Ich freue mich sehr, dass Sie eingeschaltet haben und hoffe, wir hören uns bald wieder.

Jingle: Gute Geschäfte. Businesswissen in zehn Minuten. Der Creditreform Podcast.



Creditreform Villingen-Schwenningen