Question 1

Câți tokeni are un text de 1.000 de cuvinte în română?

Accepted Answer

Un text de 1.000 de cuvinte în limba română are aproximativ 1.600-1.800 de tokeni. Limba română consumă mai mulți tokeni per cuvânt decât engleza din cauza diacriticelor (ă, â, î, ș, ț), a formelor gramaticale mai lungi și a structurii morfologice complexe. Prin comparație, 1.000 de cuvinte în engleză generează aproximativ 1.333 de tokeni. Acest lucru înseamnă că procesarea textelor românești prin API-uri AI este cu 20-35% mai costisitoare decât pentru texte în engleză de aceeași lungime.

Question 2

De ce sunt tokenii de ieșire mai scumpi decât cei de intrare?

Accepted Answer

Tokenii de ieșire costă de 3-5 ori mai mult din cauza modului în care LLM-urile generează text. Tokenii de intrare sunt procesați într-o singură trecere prin model, cu toți tokenii calculați în paralel. Tokenii de ieșire, în schimb, trebuie generați unul câte unul secvențial -- fiecare token nou necesită o trecere separată prin model (forward pass). Această generare secvențială este mult mai costisitoare computațional. De exemplu, Claude Sonnet 4.6 taxează 3 $ per milion de tokeni de intrare, dar 15 $ per milion de tokeni de ieșire -- un raport de 5:1.

Question 3

Care este cel mai ieftin model AI pentru utilizare prin API în 2026?

Accepted Answer

În martie 2026, cele mai ieftine opțiuni API sunt: Amazon Nova Micro (0,035 $/0,14 $ per 1M tokeni), GPT-5 Nano (0,05 $/0,40 $), Gemini 2.0 Flash-Lite (0,075 $/0,30 $), Mistral Small (0,10 $/0,30 $), GPT-4.1 Nano (0,10 $/0,40 $) și Llama 4 Scout prin Groq (0,11 $/0,34 $). Pentru un raport calitate-preț echilibrat, opțiuni bune includ Gemini 2.5 Flash (0,30 $/2,50 $), GPT-4.1 Mini (0,40 $/1,60 $) și Claude Haiku 4.5 (1 $/5 $). Modelele buget gestionează bine clasificarea, extracția și Q&A simplu, dar raționamentul complex necesită modele premium.

Question 4

Cum reduce prompt caching costurile cu AI?

Accepted Answer

Prompt caching stochează vectorii cheie-valoare ai prefixelor de prompt repetitive (precum prompturile de sistem) astfel încât să nu fie recalculați la fiecare cerere. Tokenii din cache sunt facturați la 10-50% din tariful normal. Pentru aplicații care trimit același prompt de sistem cu fiecare cerere -- chatboți, asistenți de cod, procesoare de documente -- prompt caching poate reduce costurile totale de intrare cu până la 90%. OpenAI aplică caching automat, în timp ce Anthropic și Google necesită configurare explicită.

Question 5

Care este diferența dintre tokeni și cuvinte?

Accepted Answer

Un cuvânt este o unitate de limbaj separată prin spații. Un token este o unitate definită de tokenizer-ul modelului -- poate fi un cuvânt întreg, o parte de cuvânt, un singur caracter sau un semn de punctuație. Cuvintele comune precum «este» sau «și» sunt de obicei un singur token. Cuvintele mai lungi sau mai rare sunt împărțite în mai mulți tokeni: «implementare» poate deveni «imple», «ment», «are» (3 tokeni). Numerele, codul de programare și textele în limbi non-engleze (inclusiv română) necesită de obicei mai mulți tokeni per cuvânt.

Question 6

Cât costă să procesezi un document de 10.000 de cuvinte cu GPT?

Accepted Answer

Un document de 10.000 de cuvinte în engleză are aproximativ 13.333 tokeni de intrare. Cu GPT-4.1 (2,00 $ per 1M tokeni de intrare), costul de intrare este de aproximativ 0,027 $. Dacă modelul generează un rezumat de 500 de cuvinte (circa 667 tokeni de ieșire la 8,00 $ per 1M), costul de ieșire este 0,005 $. Cost total per document: aproximativ 0,032 $ (circa 0,16 lei). Procesarea a 1.000 de astfel de documente ar costa circa 160 lei. Cu GPT-4.1 mini, aceeași operație costă aproximativ 0,006 $ per document -- de circa 5 ori mai puțin. Pentru documente în română, adaugă 20-35% la estimarea de tokeni.

Question 7

Consumă imaginile și fișierele tokeni în modelele AI multimodale?

Accepted Answer

Da. Când folosești modele cu capabilități de viziune precum GPT-4o sau Gemini, imaginile sunt convertite în tokeni pe baza rezoluției lor. O imagine de 1024x1024 pixeli consumă aproximativ 765 tokeni cu GPT-4o, calculat prin împărțirea imaginii în secțiuni de 512px (170 tokeni fiecare) plus un cost de bază de 85 tokeni. Imaginile cu rezoluție mai mare folosesc mai mulți tokeni, iar modul «high detail» costă semnificativ mai mult decât «low detail». PDF-urile și alte documente sunt de obicei convertite mai întâi în text, apoi tokenizate normal.

Question 8

Care sunt cele mai bune modele AI pentru programare, raționament și scriere creativă?

Accepted Answer

Pentru programare: Claude Opus 4.6 și Claude Sonnet 4.6 de la Anthropic conduc în benchmark-urile de cod, urmate de GPT-5.4 și GPT-4.1 de la OpenAI -- GPT-4.1 cu fereastra de context de 1M tokeni este ideal pentru proiecte mari de cod. Pentru raționament și matematică: o3 și o4-mini (OpenAI) folosesc raționament pas-cu-pas (chain-of-thought), DeepSeek R1 (0,55 $/2,19 $) este campionul raționamentului la buget redus, iar Gemini 2.5 Pro excelează la analize complexe. Pentru scriere creativă: Claude Sonnet 4.6 oferă cel mai bun echilibru calitate-cost, iar GPT-4o gestionează intrări multimodale (text, imagini, audio).

Calculator de tokeni

$0.01

$1.05

$31.50

$383.25

Estimare tokeni din text