Калькулятор токенів AI
Розрахуйте вартість використання мовних моделей AI. Оцініть токени з тексту та порівняйте ціни між моделями, як-от GPT-4, Claude, Gemini.
$
$
Вартість за запит
$0.02
Вхід: $0.0050 · Вихід: $0.01
Щоденна вартість
$1.75
100 запитів на день
Щомісячна вартість
$52.50
30 дні
Річна вартість
$638.75
365 дні
Оцінити токени з тексту
Калькулятор токенів AI. Підрахунок токенів та розрахунок вартості API для LLM-моделей.
Що таке калькулятор токенів ШІ?
Як розрахувати вартість токенів ШІ
Формула розрахунку вартості токенів ШІ
- = Загальна вартість API-виклику в доларах США
- = Кількість вхідних токенів (промпт, системне повідомлення, контекст)
- = Кількість вихідних токенів (згенерована відповідь моделі)
- = Ціна за 1 мільйон вхідних токенів для обраної моделі
- = Ціна за 1 мільйон вихідних токенів для обраної моделі
Приклади розрахунку вартості токенів ШІ
Чат-бот підтримки для українського інтернет-магазину: 50 000 діалогів на місяць
Автоматизація обробки заявок на Djinni: 1 000 відгуків на день
ШІ-асистент для команди розробників із 20 осіб
Поради щодо зниження витрат на API нейромереж
- Обирайте правильну модель для кожної задачі. Бюджетні моделі (GPT-5.4 Nano, GPT-5.4 Mini, Gemini 2.5 Flash-Lite, Claude Haiku 4.5, DeepSeek V4 Flash, Mistral Small 4, Amazon Nova Micro) підходять для класифікації, вилучення даних і простих відповідей. Преміальні моделі (GPT-5.5, GPT-5.4, Claude Fable 5, Claude Opus 4.8, Claude Sonnet 4.6, Gemini 3.1 Pro, Grok 4.3) потрібні для задач зі складним міркуванням. Маршрутизація за складністю задачі скорочує витрати на 40-60%.
- Увімкніть кешування промптів. Якщо застосунок надсилає однаковий системний промпт із кожним запитом (чат-боти, асистенти), кешування знижує вартість вхідних токенів до 90%. OpenAI вмикає його автоматично, Anthropic вимагає вказівки заголовків cache_control.
- Використовуйте Batch API для неспішних задач. OpenAI та Anthropic пропонують пакетну обробку зі знижкою 50% на токени. Звіти, масовий аналіз, обробка даних -- все це можна відправляти пакетами і заощаджувати вдвічі.
- Скорочуйте промпти до мінімуму. Кожен зайвий токен коштує грошей. Видаліть повторювані інструкції та багатослівні пояснення. Лаконічний промпт на 500 токенів часто працює краще за роздутий на 2 000 -- і коштує на 75% менше.
- Обмежуйте довжину відповіді. Параметр max_tokens запобігає генерації надмірно довгих відповідей. Якщо потрібна коротка відповідь -- встановіть ліміт у 100-200 токенів замість того, щоб дозволяти моделі писати абзацами.
- Моніторте витрати й встановлюйте ліміти. Використовуйте дашборди провайдерів або сторонні інструменти (Helicone, LangSmith) для відстеження споживання за моделями та ендпоінтами. Встановіть жорсткі ліміти витрат, щоб баг або сплеск трафіку не спустошив бюджет.
- Розгляньте open-source моделі для великих обсягів. Self-hosted моделі (Llama 4, Mistral Small 4, DeepSeek V4) не тарифікуються за токени. Хостинг через Groq або Together AI пропонує open-weight моделі від $0,05 за мільйон токенів (Llama 3.1 8B -- $0,05/$0,08, Llama 4 Scout -- $0,11/$0,34). При мільйонах запитів на день self-hosting обходиться в 5-10 разів дешевше за комерційні API.
- Для українського тексту пишіть промпти англійською. Оскільки кирилиця витрачає на 60-70% більше токенів, ніж латиниця, системні промпти та інструкції краще писати англійською. Відповідь моделі можна запитати українською -- лише вихідний текст буде кирилицею, що суттєво зменшить вхідні витрати.
Часті запитання про токени ШІ та вартість API
Скільки коштує один токен GPT у гривнях?
Вартість одного токена залежить від моделі. Бюджетна GPT-5.4 Nano коштує $0,0000002 за вхідний токен ($0,20 за 1М), що при курсі $1 = 44 грн складає приблизно 0,0000088 грн за токен. GPT-5.4 Mini -- $0,00000075 за вхідний токен ($0,75 за 1М), тобто 0,000033 грн. Преміальна GPT-5.4 -- $0,0000025 за вхідний токен ($2,50 за 1М), тобто 0,00011 грн. На практиці: обробка 1 000 слів українського тексту (~2 000 токенів) коштує від 0,018 грн (GPT-5.4 Nano) до 0,22 грн (GPT-5.4).
Скільки токенів у 1 000 слів українського тексту?
Приблизно 1 800-2 100 токенів. Українська мова витрачає на 60-70% більше токенів, ніж англійська, через кириличний алфавіт. Якщо в англійській 1 000 слів -- це ~1 333 токени, то в українській -- близько 2 000. Це пов'язано з тим, що токенізатори (tiktoken, SentencePiece) навчалися переважно на англомовних даних, і кириличні символи кодуються менш ефективно. На практиці це означає, що API-виклики українською обходяться на 50-70% дорожче, ніж аналогічні англійською.
Чому вихідні токени дорожчі за вхідні?
Вихідні токени коштують у 3-5 разів дорожче через обчислювальну асиметрію. Вхідні токени обробляються паралельно за один прохід через модель. Вихідні ж генеруються послідовно -- кожен новий токен вимагає окремого обчислювального проходу. Це робить генерацію відповіді значно ресурсоємнішою. Наприклад, Claude Sonnet 4.6 бере $3 за мільйон вхідних, але $15 за мільйон вихідних -- співвідношення 1:5.
Яка найдешевша модель ШІ для API у 2026 році?
Станом на червень 2026 року найдешевші API-моделі за провайдерами: Amazon Nova Micro ($0,035/$0,14 за 1М вхідних/вихідних токенів), Cohere Command R7B ($0,0375/$0,15), Llama 3.1 8B через Groq ($0,05/$0,08), Mistral Small 4 ($0,10/$0,30), Gemini 2.5 Flash-Lite ($0,10/$0,40), Llama 4 Scout через Groq ($0,11/$0,34), DeepSeek V4 Flash ($0,14/$0,28), GPT-5.4 Nano ($0,20/$1,25). Середній сегмент: Gemini 3.1 Flash-Lite ($0,25/$1,50), Gemini 2.5 Flash ($0,30/$2,50), DeepSeek V4 Pro ($0,435/$0,87), Mistral Large 3 ($0,50/$1,50), GPT-5.4 Mini ($0,75/$4,50), Claude Haiku 4.5 ($1/$5), Grok 4.3 ($1,25/$2,50). Преміум: Gemini 2.5 Pro ($1,25/$10), GPT-5.4 ($2,50/$15), Claude Sonnet 4.6 ($3/$15), Claude Opus 4.8 ($5/$25), GPT-5.5 ($5/$30), Claude Fable 5 ($10/$50). Для open-source: Llama 4 через Groq -- $0,11/$0,34 за 1М.
Як кешування промптів знижує витрати на API?
Кешування промптів зберігає обчислені key-value вектори повторюваних частин промпту (наприклад, системний промпт), щоб не перераховувати їх при кожному запиті. Кешовані токени тарифікуються за ставкою 10-25% від звичайної ціни вхідних токенів (родина GPT-5.4/5.5 від OpenAI та моделі Claude від Anthropic -- за 10%). Для застосунків із постійним системним промптом -- чат-боти, ШІ-асистенти, конвеєри обробки документів -- кешування знижує витрати на вхідні токени до 90%. OpenAI вмикає кешування автоматично, Anthropic і Google вимагають явного налаштування.
Скільки коштує обробити документ на 10 000 слів через GPT?
Для українського документа на 10 000 слів -- це приблизно 20 000 вхідних токенів. З GPT-5.4 ($2,50 за 1М вхідних) вартість введення складе близько $0,05. Якщо модель згенерує резюме на 500 слів (~1 000 вихідних токенів при $15 за 1М), вихід обійдеться в $0,015. Разом за один документ: ~$0,065 (приблизно 2,86 грн). Обробка 1 000 таких документів -- близько $65 (~2 860 грн). На GPT-5.4 Mini ($0,75/$4,50) та сама операція коштує ~$0,020 за документ -- більш ніж утричі дешевше.
Чим відрізняються токени від слів?
Слово -- одиниця мови, відокремлена пробілами. Токен -- одиниця, визначена токенізатором моделі: це може бути ціле слово, частина слова, символ або знак пунктуації. Часті слова на кшталт «the» або «і» -- зазвичай один токен. Довші або рідкісніші слова розбиваються на кілька: наприклад, «програмування» може стати 2-3 токенами. Числа, код і нелатинський текст (зокрема кирилиця) зазвичай потребують більше токенів на слово.
Як порівнюються ціни всіх основних моделей ШІ у 2026 році?
Повне порівняння цін на червень 2026 (вхідні/вихідні за 1М токенів). Бюджетні: Amazon Nova Micro ($0,035/$0,14), Cohere Command R7B ($0,0375/$0,15), Llama 3.1 8B через Groq ($0,05/$0,08), Mistral Small 4 ($0,10/$0,30), Gemini 2.5 Flash-Lite ($0,10/$0,40), Llama 4 Scout через Groq ($0,11/$0,34), DeepSeek V4 Flash ($0,14/$0,28), GPT-5.4 Nano ($0,20/$1,25). Середні: Gemini 3.1 Flash-Lite ($0,25/$1,50), Gemini 2.5 Flash ($0,30/$2,50), Codestral ($0,30/$0,90), DeepSeek V4 Pro ($0,435/$0,87), Gemini 3 Flash ($0,50/$3), Mistral Large 3 ($0,50/$1,50), GPT-5.4 Mini ($0,75/$4,50), Claude Haiku 4.5 ($1/$5), Grok 4.3 ($1,25/$2,50). Преміум: Gemini 2.5 Pro ($1,25/$10), Gemini 3.5 Flash ($1,50/$9), Mistral Medium 3.5 ($1,50/$7,50), Gemini 3.1 Pro ($2/$12), Cohere Command R+ ($2,50/$10), GPT-5.4 ($2,50/$15), Amazon Nova Premier ($2,50/$12,50), Claude Sonnet 4.6 ($3/$15), Claude Opus 4.8 ($5/$25), GPT-5.5 ($5/$30), Claude Fable 5 ($10/$50). Зверніть увагу: OpenAI прибрала старіші моделі (GPT-4.1, GPT-4o, o3, GPT-5 -- 5.3) зі стандартного прайсу, а DeepSeek об'єднала V3.2 і R1 у родину V4. Для українських розробників, які оплачують в гривнях: більшість провайдерів приймають міжнародні картки Visa/Mastercard, а Google Cloud і AWS мають партнерські програми для українських компаній.
Ключові терміни
Токен
Мінімальна одиниця тексту, яку обробляє мовна модель. Токеном може бути слово, частина слова, символ або знак пунктуації. Для англійського тексту 1 токен -- приблизно 4 символи, для українського -- близько 2 символів.
Токенізатор
Алгоритм, що перетворює вихідний текст на послідовність токенів. Різні моделі використовують різні токенізатори (tiktoken у OpenAI, SentencePiece у Google), тому один і той самий текст може дати різну кількість токенів у різних провайдерів.
BPE (Byte Pair Encoding)
Найпоширеніший алгоритм токенізації у сучасних LLM. Будує словник шляхом ітеративного злиття найчастіших пар символів або підслів. Використовується у GPT, Claude та Llama.
Контекстне вікно
Максимальна кількість токенів, яку модель може обробити за один запит (вхідні + вихідні). Розміри варіюються від 128K до понад 1M токенів: Claude Fable 5, Claude Opus 4.8 і Claude Sonnet 4.6 включають повне вікно на 1M за стандартною ціною, Grok 4.3 і DeepSeek V4 підтримують 1M, а Gemini 2.5 Pro -- до 1M токенів.
Кешування промптів (Prompt Caching)
Функція оптимізації, що зберігає обчислені key-value пари повторюваних частин промпту. Знижує вартість кешованих вхідних токенів до 90% і зменшує затримку до 85% для довгих промптів.
Вхідні та вихідні токени
Вхідні токени -- токени вашого промпту, надісланого моделі. Вихідні -- токени, згенеровані моделлю у відповіді. Вихідні токени коштують у 3-5 разів дорожче через послідовний характер генерації.
Ціна за мільйон токенів
Стандартна одиниця тарифікації API мовних моделей. Провайдери вказують ціни в доларах за 1 мільйон токенів ($/1M), окремо для вхідних і вихідних. Позначається як X/Y, де X -- ціна вхідних, Y -- ціна вихідних.
Джерела та посилання
Вміст перевірено командою Smart Calculators