Welche Bedeutung hat KI in der Unternehmensstrategie? Kann KI einen Wettbewerbsvorteil bringen?
Ein bekannter Investor aus dem Silicon Valley sagte mir vor ein paar Tagen: „Ich würde in kein Unternehmen mehr investieren, welches keine explizite KI-Strategie hat.“ Damit stellt sich aber die Frage, was denn in eine KI-Strategie gehört? Dem gehe ich in diesem und in weiteren Beiträgen nach.
Ganz am Anfang steht die pragmatische Frage: Make or Buy? Sollte man eigene KI-Modelle entwickeln, oder kann man nicht fertige Modelle vom Markt kaufen? Sowohl als auch lautet die Antwort.
Im Enterprise-Einsatz sind die spezifischen Fragestellungen oft so individuell, dass die Übertragung eines Modells auf eine andere Organisation nur geringe Erfolge zeigt. Ein Beispiel: die kanadische Fluglinie Westjet hat versucht, KI-Modelle von US-amerikanischen Airlines zu übernehmen. Bald stellte sich jedoch heraus, dass das kanadische Netz mit vielen kleinen Flughäfen und anderen Klimaeinflüssen völlig andere Eigenschaften hat, als das Netz der USA. Erst mit eigenen Modellen gelingt nun beispielsweise die vorausschauende Kapazitätsplanung, die verkürzte Bearbeitungszeiten für die Gepäckabfertigung ermöglicht. Hieraus können wir ableiten, dass es drei Klassen von KI-Modellen gibt, die sich für den Einsatz im Unternehmen eignen: übertragbare Modelle, individuelle Modelle und große Modelle.
Übertragbare Modelle sind auf einen ganz speziellen Anwendungsfall zugeschnitten und dabei auf viele andere Unternehmen übertragbar. Dazu muss der Anwendungsfall generisch genug sein, dass er in diesen Unternehmen sehr vergleichbar ist. Ein sehr einfaches Beispiel ist eine KI für Business Intelligence, die dabei hilft Daten in einem Data Warehouse für Fachanwender leichter abfragen zu können. Solche Modelle steigern die Produktivität, ähnlich wie klassische Software, und werden daher unverzichtbar.
Individuelle Modelle basieren auf den spezifischen Daten eines Unternehmens. Hierbei können Daten zum Einsatz kommen, die anderen Unternehmen nicht vorliegen, oder die besonders geschützt werden müssen. Mit solchen Modellen kann ein Unternehmen einen besonderen Marktvorteil erlangen. Die Beschaffung geeigneter Daten stellt bei der Entwicklung von KI-Modellen heute eine der größten Hürden dar. Unternehmen, die dies erkennen und ihre Unternehmensstrategie darauf abstellen, können einen unschlagbaren Wettbewerbsvorteil aufbauen.
Die dritte Klasse von Modellen sind so genannte Foundation Models. Hierbei handelt es sich um sehr große KI-Modelle, die von deren Entwicklern auf einer massiven Menge von Daten trainiert wurden. Large Language Models (LLM) sind die bekanntesten Vertreter dieser Klasse (z.B. Chat GPT), Diffusion Models — seltener auch als Large Image Models bezeichnet — sind ein weiterer Vertreter dieser Klasse (z.B. Midjourney), die auf der Generierung oder Umwandlung von Bildern basieren. Aufgrund der großen Datenmengen, mit denen diese Modelle trainiert wurden, haben sie – sozusagen – „alles schon einmal gesehen“. Das bedeutet, dass diese Modelle in der Lage sind, aus den Beispielen, die sie während ihres Trainings gesehen haben, zu lernen und diese Erfahrung auf neue Daten anzuwenden, die sie noch nicht gesehen haben. Das ermöglicht diesen Modellen, mit sehr geringem Zusatztraining auch wertvolle Ergebnisse mit neuen Daten zu erreichen. Das gilt zumindest dann, wenn die Daten einigermaßen vergleichbar sind mit den Daten, die zum Training verwendet wurden. Ein Large Language Model, welches mit riesigen Textmengen in Englisch und Deutsch trainiert wurde, wird daher gute Ergebnisse in der Verarbeitung englischer und deutscher Texte erzielen. Es ist jedoch nahezu wertlos bei der Verarbeitung chinesischer oder arabischer Texte. Foundation Models sind also dazu geeignet, mit geringen zusätzlichen Anpassungen in ganz unterschiedlichen Kontexten eingesetzt zu werden. Sie haben einen sehr großen Wissensstand und erhalten die spezifische Anpassung an die eigentliche Aufgabe innerhalb des Anwender-Unternehmens durch so genanntes Finetuning oder Prompt Engineering. Wie das genau funktioniert, schauen wir uns in einem eigenen Beitrag an.
Was bedeutet das nun für unsere Strategie? Eine gute Strategie nutzt die Chancen aller drei Klassen von Modellen aus und setzt jede Klasse dort ein, wo sie einen Nutzen erbringt. In der Praxis sollte jedes Unternehmen übertragbare Modelle einkaufen, eigene Modelle entwickeln und Foundation Models einsetzen. Aber damit ist kein USP zu erlangen. Dieses Verhalten kann also nur die Basis sein. Einen strategischen Wettbewerbsvorteil kann nur erreichen, wer eigene KI-Modelle auf Grundlage eigener, proprietärer Daten erschafft oder anpasst. Und dazu muss der Umgang mit Daten komplett neu gedacht werden. Dafür möchte ich zwei Beispiele geben:
OpenAI hat mit ChatGPT ein wirklich interessantes Produkt geschaffen. Das dahinter liegende Large Language Model ist marktführend und die Strategie, eine Kombination aus offener API, Plugins und Integration in Microsoft Azure zu implementieren ist schlau. Aber APIs und eine Integration mit einem Cloud-Anbieter bietet auch der Wettbewerb und Plugins wird die Konkurrenz auch leicht kopieren. Was passiert also, wenn das nächste Modell der Konkurrenz eine bessere Architektur hat? Es handelt sich um einen Wettbewerb der besten Köpfe. Die Strategie von OpenAI ist deshalb inzwischen weit ausgefeilter: ChatGPT hat ein herausragendes User Interface und ist für ganz normale Nutzer direkt und kostenlos zugänglich. Damit sammelt OpenAI zu geringen Kosten eine riesige Menge an Trainingsdaten für die kommende Generation von KIs. Nach aktuellem Stand der Technik ist dieses so genannte Reinforcement Learning with Human Feedback (RLHF) die beste Methode, um ein sehr gutes KI-Modell zu erzeugen. KI-Forscher sprechen auch von „the Human in the Loop“. Durch die Interaktionen mit menschlichen Nutzern lernt das Modell und verbessert sich spürbar. Und OpenAI hat sich mit diesem für die Nutzer kostenlosen Werkzeug einen einzigartigen Datenbestand gesichert, der das Feedback und die Ideen von mehr als 100 Millionen Menschen abbildet. Kein Wettbewerber, nicht einmal Google und Facebook, können hier aktuell mithalten.
Eine ähnliche konsequente Strategie verfolgt Tesla. Tesla ist mit seinen Elektrofahrzeugen Marktführer und führt mit dem Model Y in Europa die PKW-Zulassungsstatistik aller Antriebsarten an. Dabei hat Tesla die mit Abstand höchste Marge aller Massenhersteller und das einzige globale Ladenetz. Alles Zeichen einer extrem guten Strategie. Aber der wesentliche Clou der Strategie von Tesla liegt woanders. Tesla stattet seit Jahren alle Fahrzeuge mit der vollständigen Hardware für autonomes Fahren aus und aktualisiert die Software auf all diesen Fahrzeugen regelmäßig durch Over-the-Air-Softwareupdates. In jedem Fahrzeug der Flotte — mittlerweile mehr als vier Millionen Fahrzeuge auf den wichtigsten Fahrzeugmärkten weltweit — läuft der Autopilot ständig im Hintergrund mit, selbst dann, wenn der Fahrer ihn gar nicht aktiv einschaltet. Der Autopilot vergleicht permanent das eigene (geplante) Fahrverhalten mit dem tatsächlichen Fahrverhalten des Fahrers. Sobald die Software wichtige Abweichungen erkennt, werden relevante Daten gesichert und nachts an Tesla übermittelt. Damit verfügt Tesla über Feedback zu der eigenen Software aus 100 Milliarden tatsächlich gefahrener Kilometer bei Tag und Nacht und jeder Wettersituation. Kein anderer Hersteller hat auch nur im Ansatz vergleichbare Daten. Man schätzt, dass Waymo (Google) über weniger als 1% dieser Datenmenge verfügt und andere Hersteller viel weiter zurück liegen. Insbesondere hat keine noch so große Flotte von Testfahrzeugen Daten zu echten Unfallsituationen, denn die Testfahrer müssen Unfälle schon aus regulatorischen Gründen unbedingt vermeiden. In der Praxis kommen kritische Situationen und Unfälle aber vor und Tesla erhält jeweils detaillierte Daten dazu.
Was machen Unternehmen, die keine eigenen Daten haben? Es gibt im Prinzip drei Alternativen: sie kaufen Daten von Dritten oder gehen dafür Partnerschaften ein, sie bauen Testumgebungen auf, in denen die Daten in einem kontrollierten Umfeld gesammelt werden oder sie bauen eine Simulation, in der die Daten künstlich erzeugt werden. Oft wird eine Kombination davon eingesetzt. Gerade die Simulation stellt jedoch erhebliche Anforderungen an deren Qualität. Am Beispiel des autonomen Fahrens kann man das beobachten: die heutigen Simulatoren, die von Firmen wie Waymo oder Tesla eingesetzt werden, übertreffen die Qualität von Videospielen um Größenordnungen — und das für einen „Spieler“, der gar nichts für das Spielvergüngen bezahlt.
Richten Sie Ihr Augenmerk also auf genau eine Frage: Wie können Sie sich einen Datenvorteil verschaffen?
Was haben Sie für Fragen zu künstlicher Intelligenz? Setzen Sie KI in ihrem Unternehmen bereits ein oder sind Sie noch auf der Suche nach geeigneten Strategien? Ich freue mich auf den Dialog.