Zero-Shot Learning
Beim Zero-Shot Learning (ZSL) erkennt und klassifiziert ein Machine-Learning-Modell Objekte oder Begriffe, die während der ursprünglichen Trainingsphase nicht im Datensatz enthalten waren. Anstatt auf statische Label-Paare angewiesen zu sein, nutzt das Modell semantische Informationen oder Beschreibungen, um Transferleistungen zu erbringen. Es überträgt gelerntes Wissen über Merkmale und Zusammenhänge auf vollkommen unbekannte Szenarien. Ein Sprachmodell versteht so beispielsweise die Intention hinter einer Kundenanfrage in einer neuen Produktnische, obwohl es nie mit exakt diesen Fachbegriffen gefüttert wurde.
Für den deutschen Mittelstand ist dieser Ansatz technologisch wegweisend, da er die größte Hürde bei KI-Projekten adressiert: den Mangel an hochwertigen, gelabelten Trainingsdaten. Traditionelles Deep Learning erfordert oft tausende manuell annotierte Beispiele, was zeitaufwendig und kostspielig ist. Da Zero-Shot-Modelle bereits eine breite Wissensbasis mitbringen, sinken die Implementierungskosten drastisch. In Bezug auf die DSGVO bietet dies den Vorteil, dass weniger unternehmenseigene, oft sensible Daten für langwierige Nachschulungsprozesse bereitgestellt oder an externe Dienstleister übermittelt werden müssen.
Ein praktisches Anwendungsszenario findet sich in der automatisierten Ticket-Klassifizierung eines mittelständischen Maschinenbauers. Wenn das Unternehmen eine neue Produktlinie einführt, müsste ein klassisches System erst mühsam mit hunderten Support-E-Mails neu trainiert werden, um Anfragen korrekt zuzuordnen. Ein auf Zero-Shot Learning basierendes System versteht die semantische Nähe der neuen Begriffe zu bestehenden Kategorien jedoch sofort. Es sortiert die Anfragen nach Dringlichkeit oder Fachbereich, ohne dass ein Data Scientist manuell eingreifen muss. Das beschleunigt die Reaktionszeit und die allgemeine Time-to-Market erheblich.
Trotz der hohen Flexibilität sollten Entscheider beachten, dass Zero-Shot-Modelle bei hochspezifischen Nischenthemen an Präzision verlieren können. Aktuell verschieben sich viele Architekturen hin zu Few-Shot Learning, bei dem lediglich zwei bis drei Beispiele genügen, um die Genauigkeit für Spezialanwendungen massiv zu steigern. Unternehmen sollten Zero-Shot primär als mächtiges Werkzeug für Rapid Prototyping und für Aufgaben mit hoher Varianz betrachten, während für geschäftskritische Prozesse mit minimaler Fehlertoleranz weiterhin eine stichprobenartige Validierung durch Experten notwendig bleibt.