Temperature (KI)
Die Temperature ist ein zentraler Konfigurationswert in Large Language Models (LLMs), der die Wahrscheinlichkeitsverteilung bei der Vorhersage des jeweils nächsten Wortes skaliert. Technisch gesehen beeinflusst dieser Parameter die Softmax-Funktion am Ende des neuronalen Netzes: Ein niedriger Wert nahe Null führt dazu, dass das Modell fast ausschließlich das statistisch wahrscheinlichste Wort wählt, was zu deterministischen, konsistenten und faktenorientierten Ergebnissen führt. Ein hoher Wert, üblicherweise bis zu 2.0, flacht diese Verteilung ab, sodass auch weniger wahrscheinliche Begriffe zum Zug kommen, was die Varianz und die gefühlte Kreativität der Ausgabe erhöht.
Für deutsche Unternehmen ist die gezielte Wahl der Temperature eine strategische Entscheidung zwischen Prozesssicherheit und Innovationspotenzial. In regulatorisch sensiblen Bereichen, die unter die Sorgfaltspflichten der DSGVO oder des EU AI Acts fallen, ist eine niedrige Temperature oft zwingend erforderlich, um Halluzinationen zu minimieren und die Reproduzierbarkeit von KI-Entscheidungen zu gewährleisten. IT-Entscheider müssen berücksichtigen, dass eine hohe Temperature zwar menschlicher wirkt, aber das Risiko für Falschinformationen signifikant steigert. Dies hat direkte Auswirkungen auf die Haftung und die Qualitätssicherung, weshalb die Parametersteuerung ein integraler Bestandteil jeder professionellen API-Implementierung sein sollte.
Ein konkretes Beispiel aus dem Mittelstand ist der Einsatz einer KI-gestützten Wissensdatenbank bei einem Maschinenbauer. Wenn ein Servicetechniker Drehmomente für eine spezifische Anlage abfragt, muss die Temperature auf 0 oder nahe 0 gesetzt sein, da hier nur die exakte Information aus den Quelldokumenten zählen darf. Würde das System hingegen zur Ideengenerierung für eine neue Marketingkampagne derselben Firma genutzt, empfiehlt sich ein Wert von etwa 0,7 bis 0,9. In diesem Fall ist die statistische Abweichung erwünscht, um repetitive Worthülsen zu vermeiden und kreative semantische Verknüpfungen zu ermöglichen, die über den Standard-Output hinausgehen.
Unternehmen sollten jedoch beachten, dass die Temperature allein kein Garant für Korrektheit ist, da auch bei niedrigen Werten inhaltliche Fehler auftreten können, wenn die Datenbasis lückenhaft ist. Aktuell geht der Trend dahin, die Temperature nicht global festzulegen, sondern dynamisch über spezialisierte Agenten-Workflows zu steuern. So kann innerhalb einer Anwendung je nach Teilaufgabe zwischen strikter Faktenreue und explorativer Generierung gewechselt werden. Wer diesen Regler präzise beherrscht, reduziert nicht nur rechtliche Risiken, sondern optimiert durch präzisere Antworten oft auch den Token-Verbrauch und damit die laufenden Betriebskosten.