Question 1

Колко токена са 1 000 думи на български?

Accepted Answer

Приблизително 2 000 токена. Българският текст (кирилица) изразходва 60-70% повече токени от английския поради начина на работа на токенизаторите. В английския 1 000 думи са около 1 333 токена, а в българския -- около 1 800-2 100. Причината е, че токенизаторите (tiktoken, SentencePiece) са обучени предимно на англоезични данни и кирилските символи се кодират по-малко ефективно. На практика API извикванията на български са с 50-70% по-скъпи от аналогичните на английски.

Question 2

Защо изходните токени са по-скъпи от входните?

Accepted Answer

Изходните токени струват 3-5 пъти повече поради изчислителна асиметрия. Входните токени се обработват паралелно за един проход през модела. Изходните обаче се генерират последователно -- всеки нов токен изисква отделен изчислителен проход. Това прави генерирането на отговори значително по-ресурсоемко. Например Claude Sonnet 4.6 таксува $3 за милион входни, но $15 за милион изходни токена -- съотношение 1:5.

Question 3

Кой е най-евтиният AI модел за API през 2026 г.?

Accepted Answer

Към юни 2026 г. най-евтините API модели са: Amazon Nova Micro ($0,035/$0,14 за 1М входни/изходни токена), Cohere Command R7B ($0,0375/$0,15), Llama 3.1 8B чрез Groq ($0,05/$0,08), Mistral Small 4 ($0,10/$0,30), Gemini 2.5 Flash-Lite ($0,10/$0,40), Llama 4 Scout чрез Groq ($0,11/$0,34), DeepSeek V4 Flash ($0,14/$0,28), GPT-5.4 Nano ($0,20/$1,25). Среден сегмент: Gemini 3.1 Flash-Lite ($0,25/$1,50), Gemini 2.5 Flash ($0,30/$2,50), DeepSeek V4 Pro ($0,435/$0,87), Mistral Large 3 ($0,50/$1,50), GPT-5.4 Mini ($0,75/$4,50), Claude Haiku 4.5 ($1/$5), Grok 4.3 ($1,25/$2,50). Премиум: GPT-5.4 ($2,50/$15), Claude Sonnet 4.6 ($3/$15), Claude Opus 4.8 ($5/$25), GPT-5.5 ($5/$30), Claude Fable 5 ($10/$50). Бюджетните модели се справят добре с класификация, извличане на данни и прости отговори, но за комплексно разсъждение изберете премиум клас.

Question 4

Колко струва обработка на документ от 10 000 думи на български през GPT?

Accepted Answer

За български документ от 10 000 думи -- това са приблизително 20 000 входни токена (поради кирилицата). С GPT-5.4 ($2,50 за 1М входни) входната цена е около $0,05. Ако моделът генерира резюме от 500 думи (~1 000 изходни при $15 за 1М), изходът ще струва $0,015. Общо за един документ: ~$0,065 (около 0,12 лв.). Обработката на 1 000 такива документа е около $65 (~117 лв.). С GPT-5.4 Mini ($0,75/$4,50) същата операция струва ~$0,020 за документ -- над 3 пъти по-евтино.

Question 5

Как кеширането на промпти намалява разходите за AI?

Accepted Answer

Кеширането на промпти запазва изчислените key-value вектори на повтарящите се части от промпта (напр. системния промпт), за да не се преизчисляват при всяка заявка. Кешираните токени се таксуват на приблизително 10-25% от стандартната цена за входни токени -- семейството GPT-5.4/5.5 на OpenAI и моделите Claude на Anthropic таксуват кеш попаденията на 10% от входната цена. За приложения с постоянен системен промпт -- чатботове, AI асистенти, пайплайни за обработка -- кеширането намалява разходите за входни токени с до 90%. OpenAI включва кеширането автоматично, Anthropic и Google изискват изрична конфигурация.

Question 6

Каква е разликата между токени и думи?

Accepted Answer

Думата е езикова единица, разделена от интервали. Токенът е единица, дефинирана от токенизатора на модела -- може да бъде цяла дума, част от дума, символ или пунктуация. Чести думи като 'the' или 'и' обикновено са един токен. Дълги или редки думи се разбиват на няколко: например 'програмиране' може да стане 2-3 токена. Числа, код и нелатински текст (включително кирилица) изискват повече токени на дума.

Question 7

Как да преброя токените в текста преди изпращане към API?

Accepted Answer

Има три подхода. Първо: използвайте библиотеката tiktoken в Python (import tiktoken; enc = tiktoken.get_encoding('o200k_base'); len(enc.encode(text))). Второ: поставете текста в онлайн калкулатор на токени и получете резултата веднага. Трето: използвайте приближение -- за български текст приблизително 2 токена на дума или 1 токен на 2 кирилски символа. За продукшън средата програмният подход чрез tiktoken или SDK на доставчика е най-надежден.

Question 8

Колко струват всички основни AI модели в сравнение през 2026 г.?

Accepted Answer

Пълно сравнение на цените към юни 2026 г. (входни/изходни за 1М токена). Бюджетни: Amazon Nova Micro ($0,035/$0,14), Cohere Command R7B ($0,0375/$0,15), Llama 3.1 8B чрез Groq ($0,05/$0,08), Mistral Small 4 ($0,10/$0,30), Gemini 2.5 Flash-Lite ($0,10/$0,40), Llama 4 Scout чрез Groq ($0,11/$0,34), DeepSeek V4 Flash ($0,14/$0,28), GPT-5.4 Nano ($0,20/$1,25). Средни: Gemini 3.1 Flash-Lite ($0,25/$1,50), Gemini 2.5 Flash ($0,30/$2,50), Codestral ($0,30/$0,90), DeepSeek V4 Pro ($0,435/$0,87), Gemini 3 Flash ($0,50/$3,00), Mistral Large 3 ($0,50/$1,50), Llama 3.3 70B чрез Groq ($0,59/$0,79), GPT-5.4 Mini ($0,75/$4,50), Claude Haiku 4.5 ($1/$5), Grok 4.3 ($1,25/$2,50). Премиум: Gemini 2.5 Pro ($1,25/$10), Gemini 3.5 Flash ($1,50/$9), Mistral Medium 3.5 ($1,50/$7,50), Gemini 3.1 Pro ($2/$12), Cohere Command R+ ($2,50/$10), GPT-5.4 ($2,50/$15), Amazon Nova Premier ($2,50/$12,50), Claude Sonnet 4.6 ($3/$15), Claude Opus 4.8 ($5/$25), GPT-5.5 ($5/$30), Claude Fable 5 ($10/$50). Имайте предвид, че OpenAI премахна по-старите модели (GPT-4.1, GPT-4o, o3, GPT-5 до 5.3) от стандартната си ценова листа, а DeepSeek обедини V3.2 и R1 в семейството V4.

Калкулатор за токени

$0.02

$1.75

$52.50

$638.75

Оценка на токени от текст