Large Language Model (LLM)
Ein Large Language Model (LLM) ist ein KI-Modell das auf enormen Mengen an Textdaten trainiert wurde — Bücher, Webseiten, wissenschaftliche Artikel, Code und mehr. Durch dieses Training lernt das Modell statistische Muster in Sprache zu erkennen und vorherzusagen, was als nächstes kommen sollte.
Das Ergebnis: LLMs können Text verstehen, zusammenfassen, übersetzen, erklären und generieren. Sie sind die technische Grundlage für Tools wie ChatGPT (GPT-4 von OpenAI), Claude (Anthropic), Gemini (Google) und viele andere.
Die "Large" in "Large Language Model" bezieht sich auf die Größe des Modells, gemessen in Parametern — das sind vereinfacht gesagt die "Einstellschrauben" die beim Training angepasst werden. GPT-4 soll laut Schätzungen über eine Billion Parameter haben.
Für Nutzer wichtig zu verstehen: LLMs haben keine echte "Intelligenz" oder "Meinung" — sie generieren statistisch wahrscheinliche Antworten basierend auf ihrem Training. Das erklärt warum sie manchmal selbstbewusst falsche Dinge sagen (Halluzinieren). Außerdem haben LLMs einen Wissens-Cutoff: Sie kennen keine Ereignisse nach ihrem letzten Training.