Home/Glossar/Large Language Model (LLM)

Large Language Model (LLM)

Ein auf riesigen Textmengen trainiertes KI-Modell das Sprache versteht und generiert — die Grundlage für ChatGPT, Claude und Co.

Ein Large Language Model (LLM) ist ein KI-Modell das auf enormen Mengen an Textdaten trainiert wurde — Bücher, Webseiten, wissenschaftliche Artikel, Code und mehr. Durch dieses Training lernt das Modell statistische Muster in Sprache zu erkennen und vorherzusagen, was als nächstes kommen sollte.

Das Ergebnis: LLMs können Text verstehen, zusammenfassen, übersetzen, erklären und generieren. Sie sind die technische Grundlage für Tools wie ChatGPT (GPT-4 von OpenAI), Claude (Anthropic), Gemini (Google) und viele andere.

Die "Large" in "Large Language Model" bezieht sich auf die Größe des Modells, gemessen in Parametern — das sind vereinfacht gesagt die "Einstellschrauben" die beim Training angepasst werden. GPT-4 soll laut Schätzungen über eine Billion Parameter haben.

Für Nutzer wichtig zu verstehen: LLMs haben keine echte "Intelligenz" oder "Meinung" — sie generieren statistisch wahrscheinliche Antworten basierend auf ihrem Training. Das erklärt warum sie manchmal selbstbewusst falsche Dinge sagen (Halluzinieren). Außerdem haben LLMs einen Wissens-Cutoff: Sie kennen keine Ereignisse nach ihrem letzten Training.

← Zurück zum Glossar