Question 1

Wie viele Tokens hat ein deutsches Wort?

Accepted Answer

Ein deutsches Wort besteht im Durchschnitt aus 1,3 bis 1,5 Tokens -- mehr als im Englischen (ca. 1,0 bis 1,3 Tokens pro Wort). Der Grund: Die Tokenizer der großen KI-Modelle wurden überwiegend auf englischen Texten trainiert und zerlegen lange deutsche Komposita in mehrere Teil-Tokens. Das Wort 'Krankenversicherung' wird beispielsweise in 3-4 Tokens zerlegt, während einfache Wörter wie 'ich' oder 'und' jeweils nur ein Token ergeben.

Question 2

Warum sind Output-Tokens teurer als Input-Tokens?

Accepted Answer

Output-Tokens sind 3- bis 8-mal teurer, weil die Generierung von Text rechenintensiver ist als das Lesen. Beim Input verarbeitet das Modell alle Tokens parallel (Encoding). Beim Output muss es dagegen jeden Token einzeln vorhersagen und sequenziell erzeugen (Decoding), was deutlich mehr GPU-Rechenleistung erfordert.

Question 3

Was kostet eine einzelne ChatGPT-API-Anfrage?

Accepted Answer

Eine typische API-Anfrage mit GPT-4o (500 Input-Tokens, 300 Output-Tokens) kostet etwa $0,004 -- umgerechnet rund 0,0037 EUR. Bei 1.000 solchen Anfragen pro Tag ergibt das rund 111 EUR monatlich. Mit dem günstigeren GPT-4o Mini sinken die Kosten auf unter 0,001 EUR pro Anfrage, also rund 7 EUR pro Monat für dieselbe Menge.

Question 4

Welches KI-Modell hat das beste Preis-Leistungs-Verhältnis?

Accepted Answer

Das hängt vom Anwendungsfall ab. Die günstigsten Modelle (Input/Output pro 1 Mio. Tokens): Amazon Nova Micro ($0,035/$0,14), GPT-5 Nano ($0,05/$0,40), Gemini 2.0 Flash-Lite ($0,075/$0,30), Mistral Small ($0,10/$0,30), GPT-4.1 Nano ($0,10/$0,40), Llama 4 Scout via Groq ($0,11/$0,34), Grok 4.1 Fast ($0,20/$0,50), DeepSeek V3.2 ($0,28/$0,42). Die Mittelklasse: GPT-5 Mini ($0,25/$2,00), Gemini 2.5 Flash ($0,30/$2,50), GPT-4.1 Mini ($0,40/$1,60), GPT-5.2 ($0,875/$7,00), Claude Haiku 4.5 ($1/$5), o4-mini ($1,10/$4,40). Die Premium-Modelle: GPT-5 ($1,25/$10), GPT-5.1 ($1,25/$10), GPT-5.3 ($1,75/$14), GPT-4.1 ($2/$8), GPT-5.4 ($2,50/$15), Claude Sonnet 4.6 ($3/$15), Grok 4 ($3/$15), Claude Opus 4.6 ($5/$25). Als Faustregel: Testen Sie mehrere Modelle mit Ihren konkreten Aufgaben und vergleichen Sie Qualität und Kosten.

Question 5

Wie kann ich meine monatlichen KI-Kosten vorab berechnen?

Accepted Answer

Schätzen Sie drei Werte: (1) die durchschnittliche Anzahl Input-Tokens pro Anfrage, (2) die durchschnittliche Anzahl Output-Tokens pro Antwort und (3) die Anzahl der Anfragen pro Monat. Multiplizieren Sie diese Werte mit den Token-Preisen des gewählten Modells. Unser Token-Rechner erledigt dies automatisch: Geben Sie Ihren Text ein, wählen Sie ein Modell, und Sie sehen sofort die Kosten pro Anfrage und die hochgerechneten Monatskosten.

Question 6

Sind deutsche Texte teurer als englische bei der KI-Verarbeitung?

Accepted Answer

Ja, typischerweise 20 bis 30 % teurer. Deutsche Texte erzeugen mehr Tokens als die gleiche Information auf Englisch, weil die BPE-Tokenizer auf englischdominanten Trainingsdaten basieren. Lange Komposita wie 'Kraftfahrzeughaftpflichtversicherung' werden in viele Tokens zerlegt. Auch Umlaute (ä, ö, ü) und das ß können zusätzliche Tokens verursachen. Wer KI-gestützte Anwendungen für den deutschen Markt plant, sollte diesen Aufschlag in der Kostenkalkulation berücksichtigen.

Question 7

Was ist der Unterschied zwischen Tokens und Wörtern?

Accepted Answer

Wörter sind linguistische Einheiten, die durch Leerzeichen getrennt werden. Tokens sind dagegen algorithmische Einheiten, die ein KI-Modell intern verwendet. Ein Wort kann aus einem oder mehreren Tokens bestehen. Das englische Wort 'hello' ist ein Token, aber 'unbelievable' wird in 'un', 'believ' und 'able' zerlegt -- drei Tokens. Im Deutschen ist das Verhältnis noch ungünstiger: 'Gesundheitsministerium' ergibt typischerweise 4-5 Tokens. Satzzeichen, Zahlen und Sonderzeichen sind jeweils eigene Tokens.

Question 8

Wie unterscheiden sich die Preise von GPT, Claude und Gemini?

Accepted Answer

Stand März 2026: Die Flaggschiff-Modelle kosten pro 1 Mio. Input/Output-Tokens: Claude Opus 4.6 ca. $5/$25, GPT-4.1 ca. $2/$8, Gemini 2.5 Pro ca. $1,25/$10, Grok 4 ca. $3/$15, Mistral Large ca. $2/$6. Die Mittelklasse-Modelle: Claude Sonnet 4.6 $3/$15, GPT-4.1 Mini $0,40/$1,60, Gemini 2.5 Flash $0,30/$2,50, o4-mini $1,10/$4,40. Die Budget-Modelle: Claude Haiku 4.5 $1/$5, GPT-4.1 Nano $0,10/$0,40, Gemini 2.0 Flash-Lite $0,075/$0,30, DeepSeek V3.2 $0,28/$0,42, Grok 4.1 Fast $0,20/$0,50, Mistral Small $0,10/$0,30, Llama 4 Scout via Groq $0,11/$0,34, Amazon Nova Micro $0,035/$0,14. Die Preise sind im Vergleich zu 2024 um etwa 80 % gesunken.

Question 9

Wie vergleichen sich alle KI-API-Anbieter beim Preis im Jahr 2026?

Accepted Answer

Hier ein vollständiger Preisvergleich aller großen KI-API-Anbieter (Input/Output pro 1 Mio. Tokens, Stand März 2026):

Budget: Grok 4.1 Fast (xAI) $0,20/$0,50 | DeepSeek V3.2 $0,28/$0,42 | Gemini 2.5 Flash $0,30/$2,50 | GPT-4.1 Mini $0,40/$1,60.

Alle Preise in USD. Viele Anbieter gewähren zusätzlich Rabatte für Batch-Verarbeitung (bis 50 %) und Prompt-Caching (bis 90 %). Open-Source-Modelle wie Llama 4 und DeepSeek V3.2 können über Hosting-Anbieter wie Groq besonders günstig genutzt werden.

Question 10

Welche KI-Modelle eignen sich am besten für Programmierung, Reasoning und kreative Aufgaben?

Accepted Answer

Programmierung: Claude Opus 4.6 und Claude Sonnet 4.6 (Anthropic) gelten als die stärksten Modelle für Code-Generierung, Debugging und Refactoring. Codestral (Mistral) ist speziell für Code optimiert und bietet ein hervorragendes Preis-Leistungs-Verhältnis. GPT-5.4 und GPT-4.1 (OpenAI) und DeepSeek V3.2 liefern ebenfalls starke Code-Ergebnisse.

Reasoning und komplexe Logik: o3 und o4-mini (OpenAI) sind auf mehrstufiges Reasoning spezialisiert. DeepSeek R1 bietet starkes Reasoning als Open-Source-Alternative. Gemini 2.5 Pro (Google) überzeugt bei langen, analytischen Aufgaben mit seinem 1-Mio.-Token-Kontextfenster.

Kreative Texte und Konversation: Claude Opus 4.6 und Claude Sonnet 4.6 erzeugen besonders natürliche und kreative Texte. Grok 4 (xAI) punktet mit humorvollem, ungefiltertem Stil. GPT-4.1 ist ein solider Allrounder für kreative Inhalte.

Kontextfenster für große Projekte: Grok 4.1 Fast bietet mit 2 Mio. Tokens das größte Kontextfenster. GPT-4.1, Claude Opus/Sonnet 4.6 und Gemini 2.5 Pro unterstützen jeweils 1 Mio. Tokens -- ideal für die Analyse großer Codebasen oder umfangreicher Dokumente.

Token-Rechner

$0.01

$1.05

$31.50

$383.25

Tokens aus Text schätzen

Token-Rechner. KI-Token-Anzahl und API-Kostenberechnung für LLM-Modelle.

Was sind Tokens bei KI-Sprachmodellen?

Wie berechnet man KI-Token und API-Kosten?

Formel zur Berechnung der Token-Kosten

Praxisbeispiele: Token-Kosten für typische Anwendungsfälle

Kundenservice-Chatbot für einen deutschen Online-Shop

Dokumentenanalyse in einer Kanzlei

Content-Erstellung für ein SaaS-Startup

Tipps zur Senkung Ihrer KI-Token-Kosten

Häufig gestellte Fragen zu KI-Tokens und Kosten

Wie viele Tokens hat ein deutsches Wort?

Warum sind Output-Tokens teurer als Input-Tokens?

Was kostet eine einzelne ChatGPT-API-Anfrage?

Welches KI-Modell hat das beste Preis-Leistungs-Verhältnis?

Wie kann ich meine monatlichen KI-Kosten vorab berechnen?

Sind deutsche Texte teurer als englische bei der KI-Verarbeitung?

Was ist der Unterschied zwischen Tokens und Wörtern?

Wie unterscheiden sich die Preise von GPT, Claude und Gemini?

Wie vergleichen sich alle KI-API-Anbieter beim Preis im Jahr 2026?

Welche KI-Modelle eignen sich am besten für Programmierung, Reasoning und kreative Aufgaben?

Wichtige Begriffe rund um KI-Tokens

Token

Tokenisierung (Tokenization)

BPE (Byte Pair Encoding)

Kontextfenster (Context Window)

Input-Tokens

Output-Tokens

Prompt-Caching

LLM (Large Language Model)

Quellen und Referenzen