Question 1

Was ist ein Token bei KI und LLMs?

Accepted Answer

Ein Token ist eine Texteinheit — meist ein Wort, ein Wortteil oder ein Satzzeichen — die ein großes Sprachmodell als einzelne Einheit verarbeitet. Bei OpenAIs GPT-Modellen entsprechen 1.000 Token etwa 750 englischen Wörtern. Die Preisgestaltung aller großen LLM-APIs (OpenAI, Anthropic, Google) basiert auf Token, mit getrennten Tarifen für Eingabe und Ausgabe.

Question 2

Wie berechne ich die Kosten der ChatGPT-API?

Accepted Answer

Multiplizieren Sie Ihre Eingabe-Token-Anzahl mit dem Eingabepreis des Modells pro Million Token, und addieren Sie die Ausgabe-Token multipliziert mit dem Ausgabepreis. GPT-4o kostet beispielsweise etwa 5,00 $ pro Million Eingabe-Token und 15,00 $ pro Million Ausgabe-Token (Stand Anfang 2025). Unser Token-Rechner automatisiert diese Berechnung.

Question 3

Warum sind Ausgabe-Token teurer als Eingabe-Token?

Accepted Answer

Das Generieren von Ausgabe-Token erfordert einen vollständigen Vorwärtsdurchlauf des Modells für jeden erzeugten Token — ein rechenintensiver Prozess. Das Lesen von Eingabe-Token ist ein einzelner paralleler Durchlauf über den Kontext. Diese Asymmetrie spiegelt sich bei nahezu allen Anbietern wider: Ausgabe-Token kosten typischerweise 2 bis 5 Mal mehr als Eingabe-Token des gleichen Modells.

Question 4

Wie viele Token verbraucht ein typisches ChatGPT-Gespräch?

Accepted Answer

Ein kurzes Gespräch mit zwei bis drei Wendungen verbraucht etwa 200 bis 500 Token. Eine detaillierte Frage mit ausführlicher Antwort kann 1.000 bis 3.000 Token umfassen. Zusammenfassungen langer Dokumente oder RAG-Pipelines können Zehntausende Token pro Anfrage verbrauchen. Mit dem Token-Rechner können Sie Ihre eigenen Mengen eingeben und die Kosten in jeder Größenordnung schätzen.

Question 5

Welche LLM-API ist 2025 am günstigsten?

Accepted Answer

Open-Weight-Modell-APIs wie DeepSeek, Groq-gehostetes Llama oder Mistral bieten die niedrigsten Token-Preise — oft unter 0,10 $ pro Million Eingabe-Token. Unter den proprietären Frontier-Modellen liegen GPT-4o Mini und Claude Haiku im Budget-Bereich. Das günstigste Modell hängt von Ihren Genauigkeitsanforderungen und Aufgabentypen ab.

Question 6

Verbraucht Deutsch mehr Tokens als Englisch?

Accepted Answer

Ja, meistens schon. Deutsch hat tendenziell längere Wörter durch Komposition (Substantive wie 'Kraftfahrzeugzulassungsstelle'), die ein Tokenizer in mehr Teilstücke aufteilt. Als Faustregel gilt: Deutschsprachige Texte verbrauchen etwa 10–20 % mehr Token als semantisch gleichwertige englische Texte. Das sollten Sie bei der Budgetplanung für mehrsprachige KI-Anwendungen berücksichtigen.

Technologie

Token-Rechner

Technologie-Rechner

LLM API-Kostenrechner

Was sind KI-Tokens?

Modelle und Anbieter vergleichen

Häufig gestellte Fragen