Home/Glossar/Token

Token

Die kleinste Einheit mit der Sprachmodelle Text verarbeiten — grob ein Wort oder Wortteil.

Token sind die Grundbausteine mit denen Sprachmodelle Text verarbeiten. Ein Token entspricht grob einem kurzen Wort oder einem Wortteil — in Englisch entspricht 1 Token ungefähr 4 Buchstaben oder 0,75 Wörtern. "Tokenisierung" ist das Aufteilen von Text in diese Einheiten.

Warum ist das relevant für Nutzer? Weil fast alle KI-APIs nach Tokens abgerechnet werden. OpenAI, Anthropic und Google berechnen Kosten per 1.000 oder 1.000.000 Tokens — getrennt nach Input (dein Prompt) und Output (die Antwort der KI). Ein typischer kurzer Prompt mit Antwort kostet vielleicht 500-2.000 Tokens.

Außerdem hat jedes Modell ein "Context Window" — eine maximale Anzahl von Tokens die es gleichzeitig verarbeiten kann. GPT-4 hat z.B. ein Context Window von 128.000 Tokens (entspricht ca. 100.000 Wörtern oder einem ganzen Roman). Ältere Modelle hatten nur 4.000 Tokens — das war der Grund warum frühere Chatbots den Gesprächsanfang "vergessen" haben.

Für Entwickler die mit KI-APIs arbeiten: Token-Limits und -Kosten sind der wichtigste Faktor bei der Architektur von KI-Anwendungen. Prompts kurz und präzise halten spart Geld.

← Zurück zum Glossar