Token kalkulátor
Számold ki az AI nyelvi modellek használatának költségét. Becsüld meg a tokeneket szövegből, és hasonlítsd össze a GPT-4, Claude, Gemini és más modellek árait.
$
$
Költség kérésenként
$0.02
Bemenet: $0.0050 · Kimenet: $0.01
Napi költség
$1.75
100 kérések naponta
Havi költség
$52.50
30 napok
Éves költség
$638.75
365 napok
Tokenek becslése szövegből
Token kalkulátor. AI token számolás és API költségbecslés LLM modellekhez.
Mi az a token az AI nyelvi modelleknél?
Hogyan számítsd ki az AI API token költségét?
AI token költség képlet
- = Az API-hívás teljes költsége (USD-ben)
- = Bemeneti tokenek száma (prompt, rendszer-prompt és kontextus)
- = Kimeneti tokenek száma (a modell által generált válasz)
- = Az 1 millió bemeneti token ára a választott modellnél
- = Az 1 millió kimeneti token ára a választott modellnél
Gyakorlati példák: AI API token költségek forintban
Magyar nyelvű ügyfélszolgálati chatbot: havi 30 000 beszélgetés
Dokumentum-összefoglalás egy budapesti ügyvédi irodánál
AI kódolási asszisztens egy 10 fős fejlesztőcsapatnak
Tippek az AI API token költségek csökkentéséhez
- Válaszd ki a feladathoz legmegfelelőbb modellt. Egyszerű feladatokhoz (osztályozás, kivonat, összefoglalás) használj budget modelleket: GPT-5.4 Nano, GPT-5.4 Mini, Gemini 2.5 Flash-Lite, Claude Haiku 4.5, DeepSeek V4 Flash, Mistral Small 4 vagy Amazon Nova Micro. A prémium modelleket (Claude Fable 5, Claude Opus 4.8, Claude Sonnet 4.6, GPT-5.5, GPT-5.4, Gemini 3.1 Pro, Grok 4.3) tartsd fenn a komplex elemzésekhez és kódoláshoz. Feladatalapú modell-routing alkalmazásával akár 40-60%-kal csökkenthetők a költségek.
- Használj prompt gyorsítótárazást (prompt caching). Ha az alkalmazásod minden kérésnél ugyanazt a rendszer-promptot küldi, a gyorsítótárazás akár 90%-kal csökkentheti a bemeneti token költségeket. Az OpenAI automatikusan alkalmazza, az Anthropic explicit cache_control fejléc beállítást igényel.
- Használd a Batch API-t nem sürgős feladatokhoz. Az OpenAI és az Anthropic 50%-os kedvezményt ad a kötegelt (batch) feldolgozásra. Tömeges elemzések, riportok és adatfeldolgozás esetén érdemes kihasználni.
- Rövidítsd a promptjaidat. Minden felesleges token pénzbe kerül. Távolítsd el a redundáns utasításokat és a túl részletes kontextust. Egy jól megfogalmazott 500 tokenes prompt gyakran jobb eredményt ad, mint egy 2000 tokenes -- és 75%-kal kevesebbe kerül.
- Korlátozd a kimeneti token számot. Állítsd be a max_tokens paramétert a ténylegesen szükséges értékre. Ha egymondatos választ vársz, állítsd 100 tokenre a limitet, ne engedd, hogy a modell bekezdéseket generáljon.
- Magyar szövegeknél figyelj a tokenizálási felárra. A magyar nyelv agglutináló jellegéből adódóan ugyanaz a tartalom 50-100%-kal több tokent igényel, mint angolul. Ha lehetséges, a rendszer-promptot és a fix utasításokat írd angolul, a felhasználói interakciót pedig hagyd magyarul -- ez akár 20-30%-ot spórolhat a bemeneti költségeken.
- Monitorozd és állíts be költségriasztást. Használd a szolgáltató költségfigyelő felületét vagy külső eszközöket (pl. Helicone) a tokenfogyasztás nyomon követésére. Állíts be havi költségkorlátot a nem várt túllépések megelőzésére.
Gyakran ismételt kérdések az AI tokenekről és árazásról
Hány token egy magyar szó?
Egy magyar szó átlagosan 1,3-1,5 tokenből áll, szemben az angol szavak 1,0-1,3 tokenes átlagával. A különbség oka, hogy a tokenizáló algoritmusok (BPE) túlnyomórészt angol szövegeken lettek betanítva, így a magyar ragozott, toldalékolt szavakat több kisebb egységre bontják. Rövid, gyakori szavak ("a", "és", "nem") általában 1 token, de hosszabb összetett szavak, mint a "költségvetés" vagy "összehasonlítás", 3-5 tokent is igényelhetnek. Összességében egy 1000 szavas magyar szöveg jellemzően 1300-1500 token.
Miért drágább a magyar szöveg feldolgozása, mint az angolé?
A magyar szöveg feldolgozása átlagosan 50-100%-kal drágább, mint az azonos tartalmú angol szövegé. Ennek fő oka a tokenizálás hatékonysága: a magyar agglutináló nyelv, ami azt jelenti, hogy ragokkal, jelekkel és képzőkkel fejezzük ki a nyelvtani viszonyokat. A tokenizáló ezeket a hosszú, összetett szavakat több kisebb tokenre bontja. Az újabb tokenizálók javítottak ezen: az OpenAI jelenlegi (GPT-5.4/5.5) modelljeiben használt o200k_base tokenizáló körülbelül 1,16-szor hatékonyabb magyar szövegen, mint a korábbi generációké, de a különbség az angolhoz képest továbbra is fennáll.
Mennyibe kerül egy ChatGPT API-hívás forintban?
Egy tipikus API-hívás GPT-5.4-gyel (500 bemeneti + 300 kimeneti token) körülbelül 0,0058 USD-be kerül, ami 375 Ft-os árfolyamon kb. 2,2 Ft. Napi 1000 ilyen kérésnél ez havi kb. 65 000 Ft. A budget GPT-5.4 Nano modellel ugyanez mindössze kb. 0,0005 USD (0,18 Ft) kérésenként, azaz havi kb. 5300 Ft a 1000 napi kérésre. A prémium GPT-5.5 modellel viszont ugyanez a mennyiség havi kb. 130 000 Ft-ba kerülne.
Melyik a legolcsóbb AI modell API-használatra 2026-ban?
2026 júniusában a legolcsóbb API-modellek (bemenet/kimenet 1M tokenre): Amazon Nova Micro (0,035/0,14 USD), Cohere Command R7B (0,0375/0,15 USD), Llama 3.1 8B Groq-on (0,05/0,08 USD), Mistral Small 4 (0,10/0,30 USD), Gemini 2.5 Flash-Lite (0,10/0,40 USD), Llama 4 Scout Groq-on (0,11/0,34 USD), DeepSeek V4 Flash (0,14/0,28 USD), GPT-5.4 Nano (0,20/1,25 USD). A közép kategóriában: Gemini 3.1 Flash-Lite (0,25/1,50 USD), Gemini 2.5 Flash (0,30/2,50 USD), DeepSeek V4 Pro (0,435/0,87 USD), Mistral Large 3 (0,50/1,50 USD), GPT-5.4 Mini (0,75/4,50 USD), Claude Haiku 4.5 (1/5 USD), Grok 4.3 (1,25/2,50 USD). A prémium szegmensben: GPT-5.4 (2,50/15 USD), Claude Sonnet 4.6 (3/15 USD), Claude Opus 4.8 (5/25 USD), GPT-5.5 (5/30 USD), Claude Fable 5 (10/50 USD). A legjobb választás a feladat összetettségétől függ.
Mi a különbség a token és a szó között?
A szó nyelvi egység, amelyet szóközök választanak el. A token viszont a modell tokenizáló algoritmusa által meghatározott feldolgozási egység -- lehet teljes szó, szótöredék, egyetlen karakter vagy írásjel. Az angol "hello" egy token, de az "unbelievable" szó három tokenre bomlik: "un", "believ", "able". A magyar nyelven a helyzet még összetettebb: a "megváltoztathatatlanság" szó akár 5-6 tokenre is széteshet. Ezért a token-alapú árazás nem feleltethető meg közvetlenül a szószámnak.
Hogyan csökkenthetem a prompt gyorsítótárazással a költségeimet?
A prompt gyorsítótárazás (prompt caching) a rendszeresen ismétlődő prompt-részek (pl. rendszer-prompt) előre kiszámított kulcs-érték vektorait tárolja, így azokat nem kell minden kérésnél újra feldolgozni. A gyorsítótárazott tokenekre jellemzően a normál bemeneti ár 10-25%-a érvényes -- az OpenAI GPT-5.4/5.5 családja és az Anthropic Claude modelljei egyaránt a bemeneti ár 10%-át számítják fel a cache-találatokra. Ha az alkalmazásod minden kéréshez ugyanazt a 500 tokenes rendszer-promptot küldi, a gyorsítótárazás akár 90%-kal csökkentheti a bemeneti költségeket erre a részre. Az OpenAI automatikusan alkalmazza, az Anthropic-nál és a Google-nál explicit beállítás szükséges.
Hogyan hasonlíthatom össze a GPT, Claude és Gemini árazását?
2026 júniusában az árak (1M token, bemenet/kimenet): Prémium kategória -- Claude Fable 5: 10/50 USD, GPT-5.5: 5/30 USD, Claude Opus 4.8: 5/25 USD, Claude Sonnet 4.6: 3/15 USD, GPT-5.4: 2,50/15 USD, Gemini 3.1 Pro: 2/12 USD, Gemini 3.5 Flash: 1,50/9 USD, Gemini 2.5 Pro: 1,25/10 USD. Közép kategória -- Grok 4.3: 1,25/2,50 USD, Claude Haiku 4.5: 1/5 USD, GPT-5.4 Mini: 0,75/4,50 USD, Gemini 3 Flash: 0,50/3 USD, DeepSeek V4 Pro: 0,435/0,87 USD, Gemini 2.5 Flash: 0,30/2,50 USD. Budget -- GPT-5.4 Nano: 0,20/1,25 USD, DeepSeek V4 Flash: 0,14/0,28 USD, Gemini 2.5 Flash-Lite: 0,10/0,40 USD, Mistral Small 4: 0,10/0,30 USD, Amazon Nova Micro: 0,035/0,14 USD. Az OpenAI a régebbi modelleket (GPT-4.1, GPT-4o, o3, GPT-5-től GPT-5.3-ig) kivezette a standard árlistájáról, a DeepSeek pedig a V3.2-t és az R1-et a V4 családba vonta össze. Az árak 2024 óta kb. 80%-kal csökkentek.
Mennyibe kerül egy 10 000 szavas dokumentum feldolgozása?
Egy 10 000 szavas magyar dokumentum nagyjából 13 000-15 000 bemeneti token (az angol megfelelőjénél kb. 30%-kal több). GPT-5.4-gyel (2,50 USD / 1M bemenet) a bemeneti költség kb. 0,035 USD. Ha a modell 500 szavas összefoglalást generál (kb. 700 kimeneti token, 15 USD / 1M kimenet), a kimeneti költség 0,011 USD. Összesen: kb. 0,046 USD, azaz mintegy 17 Ft dokumentumonként. 1000 dokumentum feldolgozása kb. 17 000 Ft-ba kerülne. A budget GPT-5.4 Mini modellel ez csupán kb. 5100 Ft lenne -- több mint háromszor olcsóbb.
Melyik AI modell a legjobb kódolásra, elemzésre és kreatív írásra?
Kódolás: a Claude Fable 5, a Claude Opus 4.8 és a Claude Sonnet 4.6 (Anthropic) vezeti a kódolási rangsorokat, amelyeket a GPT-5.5 és a GPT-5.4 (OpenAI), valamint a Codestral (Mistral, 0,30/0,90 USD) és az ágens-alapú kódoláshoz készült Devstral 2 (0,40/2,00 USD) követ. A Claude modellek standard áron elérhető 1 millió tokenes kontextusablaka ideális nagy kódbázisokhoz. Elemzés és logika: a GPT-5.5 és a GPT-5.4 (OpenAI) láncolatos gondolkodást (chain-of-thought) alkalmaz, a DeepSeek V4 Pro (0,435/0,87 USD) a budget reasoning bajnok, a Gemini 3.1 Pro komplex analízisekhez kiváló. Kreatív írás: Claude Sonnet 4.6 a minőség és ár egyensúlyát kínálja, a Gemini 3.5 Flash gyors multimodális feldolgozást nyújt, a Grok 4.3 (1,25/2,50 USD) pedig valós idejű adathozzáféréssel rendelkezik. Tömeges feldolgozás: DeepSeek V4 Flash, Amazon Nova Micro, Mistral Small 4 és Llama 4 Groq-on a legalacsonyabb költségűek.
Fogalomtár: AI tokenek és kapcsolódó kifejezések
Token
A nagy nyelvi modellek (LLM-ek) legkisebb szövegfeldolgozási egysége. Lehet teljes szó, szórészlet, karakter vagy írásjel. Az API-költségek token-alapúak: a szolgáltatók 1 millió tokenre vetítve adják meg az árakat.
Tokenizáló (Tokenizer)
Az az algoritmus, amely a nyers szöveget tokenekre bontja. Különböző modellek különböző tokenizálókat használnak (pl. tiktoken az OpenAI-nál, SentencePiece a Google-nál), ezért ugyanaz a szöveg eltérő tokenszámot eredményezhet szolgáltatónként.
BPE (Byte Pair Encoding)
A legelterjedtebb tokenizálási algoritmus, amelyet a modern LLM-ek használnak. A leggyakrabban előforduló karakterpárokat iteratívan összevonja, így építi fel a szókészletet. A GPT, Claude és Llama modellek mind BPE-variánsokat alkalmaznak.
Kontextusablak (Context Window)
Az a maximális tokenszám, amelyet egy modell egyetlen kérésben (bemenet + kimenet együtt) feldolgozhat. 2026-ban a kontextusablakok mérete 128K-tól 1M token fölé terjed: a Claude Fable 5, a Claude Opus 4.8 és a Claude Sonnet 4.6 standard áron teljes 1M tokenes ablakot kínál, a Grok 4.3 és a DeepSeek V4 szintén 1M tokent támogat, a Gemini 2.5 Pro pedig akár 1M tokent kezel.
Bemeneti és kimeneti tokenek
A bemeneti (input) tokenek a modellnek küldött szöveg tokenizált formája (prompt, rendszer-prompt, kontextus). A kimeneti (output) tokenek a modell által generált válasz. A kimeneti tokenek jellemzően 3-8-szor drágábbak, mivel a szekvenciális generálás nagyobb számítási kapacitást igényel.
Prompt gyorsítótárazás (Prompt Caching)
Költségoptimalizálási technika, amely az ismétlődő prompt-részek előre kiszámított kulcs-érték párjait tárolja. A gyorsítótárazott bemeneti tokenek a normál ár 10-25%-áért számlázódnak, ami akár 90%-os megtakarítást jelent az ismétlődő prompt-részeknél.
LLM (Large Language Model)
Nagy nyelvi modell -- hatalmas szövegkorpuszon betanított mesterségesintelligencia-rendszer, amely emberi szintű szöveget képes megérteni és generálni. A legfontosabb LLM-ek 2026-ban: GPT-5.5 és GPT-5.4 (OpenAI), Claude Fable 5 és Claude Opus 4.8 (Anthropic), Gemini 3.1 Pro (Google), Grok 4.3 (xAI), Llama 4 (Meta), DeepSeek V4 és Mistral Large 3.
Források és hivatkozások
A tartalmat a Smart Calculators csapata ellenorizte