Machen Sie Ihre Daten bereit für Generative AI
Generative AI – ein Begriff im Umfeld neuer Technologien, der uns aktuell vielerorts begegnet. Dahinter steckt Artificial Intelligence (AI, dt.: Künstliche Intelligenz), die neue Ideen und Inhalte erstellen beziehungsweise selbst generieren kann – z. B. Texte, Bilder, Videos, aber auch Konversationen und sogar Codes sind möglich. Um solche Inhalte mithilfe von Generative AI (also generierender künstlicher Intelligenz) zu erhalten, wird der KI eine große Anzahl an bereits vorhandenen Daten zur Verfügung gestellt. Auf dieser Grundlage erlernt diese dann den Aufbau, die Struktur, das Muster, den Stil oder die Machart der Daten und kann so neue Texte mit ähnlichem Inhalt formulieren.
Stellen Sie sich vor, sie wollen eine Zeichnung erstellen. Durch den Input einer breiten Masse an verschiedenen Zeichnungen, die sozusagen als „Lernmaterial“ für die KI dienen, lernt die KI die Art zu zeichnen und zieht Erkenntnisse über Stile, Macharten oder Farben. Auf Basis dieser Erkenntnisse ist die KI dann in der Lage (wie im sehr einfachen Beispiel unten gezeigt), eine völlig neue Zeichnung zu produzieren:
(links: drei Vorlagen aus Stockfotos, rechts: Gen AI generierte neue Variante)
Dieses sehr simple Beispiel veranschaulicht, wie neue Inhalte durch den Input von alten Inhalten generiert werden. Dies geht in der Realität weit über die einfache Zeichnung eines Baumes hinaus – große Datenmenge können in Sekunden verarbeitet und analysiert werden. Im gleichen Zuge können Auswertungen erstellt und Handlungsempfehlungen mitgegeben werden. Und selbst da ist noch nicht Schluss!
Doch warum sind viele Unternehmen trotz der vielversprechenden Möglichkeiten noch nicht bereit, Generative KI für ihr Datenmanagement zu nutzen?
Der Gedanke, lästige und vor allem zeitintensive Datenverwaltung in Zukunft von Künstlicher Intelligenz übernehmen zu lassen, klingt zunächst verlockend.
Nehmen wir z. B. an, Sie wollen aus verschiedenen Merkmalen Ihres Produkts einen Text erstellen lassen. Die KI wird das vortrefflich lösen, indem sie die vorhandenen Informationen in den Kontext setzt und zu einer gut klingenden Beschreibung formt.
Betrachten wir dies erneut an einem sehr vereinfachten Beispiel:
Bitten wir die KI, eine Kurzbeschreibung aus vorhandenen Attributen für eine Produktdetailseite zu erzeugen, ist uns insofern erst einmal geholfen, als dass wir die angeforderten Komponenten in Sekundenschnelle erhalten:
Passt, fertig. Oder?
In der Realität würde vermutlich jeder Produktmanager oder Marketingverantwortliche wesentliche Attribute des Produkts und seine individuellen Vorzüge an den Anfang stellen. Oder man würde andere Informationen rauskürzen, um für bestimmte Print- oder Online-Kanäle einen kürzeren Text zu erhalten. Und diese Regel gilt vielleicht wieder nicht, wenn eine technische Dokumentation gefordert ist, die alle relevanten Informationen enthalten soll, aber weniger den Anspruch an werbliche Aufbereitung hat.
Es bleibt also in diesem Beispiel letztlich das Problem von spezifischen Regeln und Hierarchien für die Produktkommunikation übrig, welches nicht unmittelbar durch KI zu lösen ist und Vorarbeit in den eigenen Daten erfordert.
Was ist also (mindestens) zu tun, bevor der Einsatz von Gen AI im Datenmanagement für Unternehmen überhaupt infrage kommt?
1) GRANULARE DATENBASIS:
Wie bereits angesprochen, bedarf die Erstellung von Texten zunächst einer sauberen Datenbasis. Hierfür muss im ersten Schritt eine granulare Datenbasis vorhanden sein, die wesentliche Produktmerkmale beinhaltet. Diese Basis erlaubt der KI überhaupt erst vollwertige und korrekte Produktbeschreibungen zu formulieren.
2) UNTERNEHMENSSPRECH:
Jedes Unternehmen hat seine eigene Marken-DNA, die sich auch in den Produkttexten wiederfinden muss. Die Erstellung von Texten passend zum „Unternehmenssprech“ ist nur möglich, wenn zunächst die Terminologie-Datenbank aufgeräumt und sauber ist. Sonst wird aus einem Schraubendreher am Ende dann doch wieder ein Schraubenzieher.
3) BESTANDSDATEN:
Damit beispielsweise Bilder anhand gewisser Regeln automatisch mit Informationen wie Meta-Daten versorgt werden, müssen zunächst die Bestandsdaten (oder zumindest ein Teil davon) die korrekten Informationen enthalten. Dies kann beispielweise die Asset-Kategorie sein. Auch diese Informationen müssen zunächst manuell von Menschen hinterlegt werden.
Das bedeutet konkret: Bevor Unternehmen Generative KI effektiv nutzen können, müssen sie über gut strukturierte Daten verfügen, die zusätzliche Informationen und Regeln für die weitere Bearbeitung durch eine KI enthalten. Darüber hinaus benötigen generative KI-Modelle große Mengen an hochwertigen Trainingsdaten, um zuverlässige und genaue Ergebnisse zu erzielen. Viele Unternehmen haben jedoch mit Problemen in der Datenstruktur und -qualität zu kämpfen, z. B. mit unvollständigen oder inkonsistenten Daten und Regeln.
Die Daten, welche die Generative KI nutzt, müssen in Bezug auf Genauigkeit, Aktualität, Kategorisierung und andere Eigenschaften in hoher Qualität vorliegen, damit die daraus resultierenden Modelle effektiv und nützlich sind. Minderwertige interne Daten führen zu minderwertigen Ergebnissen in generativen KI-Modellen.
Um das Potenzial der Generativen KI voll ausschöpfen zu können, müssen Unternehmen die Bedeutung gut strukturierter Daten als Voraussetzung erkennen. Durch Investitionen in Data Governance, Datenqualitätssicherung und effiziente Datenverwaltungspraktiken können Unternehmen die Erfolgsquote ihrer generativen KI-Initiativen erheblich steigern.