Question 1

Сколько токенов в 1 000 слов русского текста?

Accepted Answer

Примерно 2 000 токенов. Русский текст расходует на 60-70% больше токенов, чем английский, из-за кириллического алфавита. Если в английском 1 000 слов -- это ~1 333 токена, то в русском -- около 1 800-2 100 токенов. Это связано с тем, что токенизаторы (tiktoken, SentencePiece) обучались преимущественно на англоязычных данных, и кириллические символы кодируются менее эффективно. На практике это означает, что API-вызовы на русском обходятся на 50-70% дороже, чем аналогичные на английском.

Question 2

Почему выходные токены дороже входных?

Accepted Answer

Выходные токены стоят в 3-5 раз дороже из-за вычислительной асимметрии. Входные токены обрабатываются параллельно за один проход через модель. Выходные же генерируются последовательно -- каждый новый токен требует отдельного вычислительного прохода. Это делает генерацию ответа значительно более ресурсоёмкой. Например, Claude Sonnet 4.6 берёт $3 за миллион входных, но $15 за миллион выходных -- соотношение 1:5.

Question 3

Какая самая дешёвая модель ИИ для API в 2026 году?

Accepted Answer

По состоянию на март 2026 года самые дешёвые API-модели: Amazon Nova Micro ($0,035/$0,14 за 1М входных/выходных токенов), GPT-5 Nano ($0,05/$0,40), Gemini 2.0 Flash-Lite ($0,075/$0,30), Mistral Small ($0,10/$0,30), GPT-4.1 Nano ($0,10/$0,40). Средний сегмент: Gemini 2.5 Flash ($0,30/$2,50), GPT-4.1 Mini ($0,40/$1,60), Claude Haiku 4.5 ($1/$5). Премиум: Gemini 2.5 Pro ($1,25/$10), GPT-4.1 ($2/$8), Claude Sonnet 4.6 ($3/$15), Claude Opus 4.6 ($5/$25). Для open-source: Llama 4 через Groq стоит $0,11/$0,34 за 1М.

Question 4

Сколько стоит обработать документ на 10 000 слов через GPT?

Accepted Answer

Для русского документа на 10 000 слов -- это примерно 20 000 входных токенов. С GPT-4.1 ($2 за 1М входных) стоимость ввода составит около $0,04. Если модель сгенерирует резюме на 500 слов (~1 000 выходных токенов при $8 за 1М), выход обойдётся в $0,008. Итого за один документ: ~$0,048 (примерно 4,3 руб.). Обработка 1 000 таких документов -- около $48 (~4 300 руб.). На GPT-4.1 mini та же операция стоит ~$0,010 за документ -- в 5 раз дешевле.

Question 5

Как кэширование промптов снижает расходы?

Accepted Answer

Кэширование промптов сохраняет вычисленные key-value векторы повторяющихся частей промпта (например, системный промпт), чтобы не пересчитывать их при каждом запросе. Кэшированные токены тарифицируются по ставке 10-50% от обычной цены входных токенов. Для приложений с постоянным системным промптом -- чат-боты, ИИ-ассистенты, конвейеры обработки документов -- кэширование снижает затраты на входные токены до 90%. OpenAI включает кэширование автоматически, Anthropic и Google требуют явной настройки.

Question 6

Чем отличаются токены от слов?

Accepted Answer

Слово -- единица языка, разделённая пробелами. Токен -- единица, определяемая токенизатором модели: это может быть целое слово, часть слова, символ или знак препинания. Частые слова вроде «the» или «и» -- обычно один токен. Длинные или редкие слова разбиваются на несколько: например, «программирование» может стать 2-3 токенами. Числа, код и нелатинский текст (в том числе кириллица) обычно требуют больше токенов на слово.

Question 7

Как подсчитать токены в тексте до отправки в API?

Accepted Answer

Есть три способа. Первый: используйте библиотеку tiktoken в Python (import tiktoken; enc = tiktoken.encoding_for_model('gpt-4'); len(enc.encode(text))). Второй: воспользуйтесь онлайн-калькулятором токенов -- вставьте текст и мгновенно увидите результат. Третий: используйте приближение -- для русского текста примерно 2 токена на слово или 1 токен на 2 кириллических символа. Для продакшена программный подход через tiktoken или SDK провайдера наиболее надёжен, так как использует тот же токенизатор, что и API.

Question 8

Сколько сравнительно стоят все основные модели ИИ в 2026 году?

Accepted Answer

Полное сравнение цен на март 2026 (входные/выходные за 1М токенов). Бюджетные: Amazon Nova Micro ($0,035/$0,14), GPT-5 Nano ($0,05/$0,40), Gemini 2.0 Flash-Lite ($0,075/$0,30), Mistral Small ($0,10/$0,30), DeepSeek V3.2 ($0,28/$0,42). Средние: GPT-4.1 Mini ($0,40/$1,60), Gemini 2.5 Flash ($0,30/$2,50), Claude Haiku 4.5 ($1/$5), o4-mini ($1,10/$4,40). Премиум: Gemini 2.5 Pro ($1,25/$10), GPT-4.1 ($2/$8), GPT-5.4 ($2,50/$15), Claude Sonnet 4.6 ($3/$15), Grok 4 ($3/$15), Claude Opus 4.6 ($5/$25). Российские разработчики также могут использовать отечественные прокси-сервисы (GenAPI, GPTunnel) с оплатой в рублях.

Калькулятор токенов

$0.01

$1.05

$31.50

$383.25

Оценить токены по тексту