Smart Calculators

Smart

Calculators

ٹوکن کیلکولیٹر

AI لینگویج ماڈل استعمال کی لاگت حساب کریں۔ متن سے ٹوکن کا تخمینہ لگائیں اور GPT-4، Claude، Gemini جیسے ماڈلز کی قیمتوں کا موازنہ کریں۔

ٹوکن کیلکولیٹر۔ AI ٹوکن شمار اور LLM ماڈلز کے لیے API لاگت کا تخمینہ۔
ٹوکن کیلکولیٹر کسی بھی متن میں ٹوکنز کی تعداد کا تخمینہ لگاتا ہے اور GPT، Claude، Gemini، Grok اور DeepSeek جیسے ماڈلز کی API لاگت حساب کرتا ہے۔ یہ تقریباً ہر 4 حروف پر 1 ٹوکن کے معیاری تناسب سے متن کی لمبائی کو ٹوکنز میں تبدیل کرتا ہے اور ہر ماڈل کی فی دس لاکھ ٹوکن قیمت لگا کر ان پٹ اور آؤٹ پٹ لاگت فوری طور پر دکھاتا ہے۔

AI ٹوکن کیا ہوتا ہے؟

AI ٹوکن وہ بنیادی اکائی ہے جسے GPT، Claude، Gemini، Grok، DeepSeek، Mistral اور Llama جیسے بڑے لینگویج ماڈلز (LLMs) ٹیکسٹ پروسیس کرنے کے لیے استعمال کرتے ہیں۔ ایک ٹوکن ایک مکمل لفظ، لفظ کا حصہ، یا رموزِ اوقاف ہو سکتا ہے۔ انگریزی میں 1,000 ٹوکن تقریباً 750 الفاظ کے برابر ہوتے ہیں۔
OpenAI، Anthropic، Google، xAI، DeepSeek اور Mistral جیسے AI فراہم کنندگان اپنی API کی قیمت ٹوکنز کی بنیاد پر مقرر کرتے ہیں۔ ہر API کال میں دو قسم کے ٹوکنز خرچ ہوتے ہیں: ان پٹ ٹوکنز (آپ کا پرامپٹ) اور آؤٹ پٹ ٹوکنز (ماڈل کا جواب)۔ آؤٹ پٹ ٹوکنز عام طور پر 3 سے 5 گنا زیادہ مہنگے ہوتے ہیں کیونکہ ماڈل کو ہر لفظ الگ سے تخلیق کرنا پڑتا ہے۔
پاکستانی ڈویلپرز اور فری لانسرز کے لیے ایک اہم بات: اردو ٹیکسٹ انگریزی کے مقابلے میں 2 سے 3 گنا زیادہ ٹوکنز استعمال کرتا ہے۔ اس کی وجہ یہ ہے کہ ٹوکنائزر الگورتھم بنیادی طور پر انگریزی ڈیٹا پر تربیت یافتہ ہیں۔ اس کا مطلب ہے کہ اردو میں AI ایپلیکیشنز بنانے کی لاگت نمایاں طور پر زیادہ ہو سکتی ہے۔ یہ کیلکولیٹر آپ کو مختلف AI ماڈلز کی لاگت کا درست اندازہ لگانے میں مدد کرتا ہے۔
نوٹ: پاکستان میں "ٹوکن ٹیکس" کی اصطلاح عام طور پر گاڑیوں کے رجسٹریشن ٹیکس کے لیے استعمال ہوتی ہے۔ یہاں ہم AI ماڈلز میں ٹیکسٹ پروسیسنگ کی اکائی "ٹوکن" کی بات کر رہے ہیں جو بالکل مختلف مفہوم رکھتی ہے۔

AI ٹوکن کی لاگت کا حساب کیسے لگائیں؟

AI API کی لاگت معلوم کرنے کے لیے آپ کو تین معلومات درکار ہیں: ان پٹ ٹوکنز کی تعداد، آؤٹ پٹ ٹوکنز کی تعداد، اور منتخب ماڈل کی فی ملین ٹوکن قیمت۔
مرحلہ وار طریقہ کار:
1. ان پٹ ٹوکنز کا اندازہ لگائیں۔ انگریزی ٹیکسٹ کے لیے الفاظ کی تعداد کو 1.33 سے ضرب دیں۔ اردو ٹیکسٹ کے لیے 2.5 سے 3 سے ضرب دیں کیونکہ اردو زیادہ ٹوکنز استعمال کرتی ہے۔
2. آؤٹ پٹ ٹوکنز کا اندازہ لگائیں۔ مختصر جواب (ایک دو جملے) میں 50 سے 100 ٹوکنز، اور تفصیلی جواب میں 500 سے 2,000 ٹوکنز لگتے ہیں۔
3. ماڈل کی قیمت معلوم کریں۔ AI فراہم کنندگان فی 10 لاکھ ٹوکنز کی شرح سے قیمت لگاتے ہیں، ان پٹ اور آؤٹ پٹ کی الگ الگ قیمتیں ہوتی ہیں۔
4. نیچے دیے گئے فارمولے سے حساب لگائیں۔
5. پاکستانی روپے میں لاگت جاننے کے لیے نتیجے کو 278 سے ضرب دیں (1 امریکی ڈالر تقریباً 278 روپے)۔
مثال کے طور پر، اگر آپ Claude Sonnet 4.6 (ان پٹ $3/ملین، آؤٹ پٹ $15/ملین) استعمال کرتے ہوئے 2,000 ٹوکنز کا پرامپٹ بھیجیں اور 500 ٹوکنز کا جواب وصول کریں، تو لاگت ہوگی: (2,000 / 1,000,000 x $3) + (500 / 1,000,000 x $15) = $0.006 + $0.0075 = $0.0135 فی درخواست، یعنی تقریباً 3.75 روپے۔ اگر آپ روزانہ 5,000 ایسی درخواستیں بھیجیں تو ماہانہ لاگت تقریباً $2,025 یعنی 5,62,950 روپے بنتی ہے۔

AI ٹوکن لاگت کا فارمولا

C=Tin×Pin+Tout×Pout1,000,000C = \frac{T_{in} \times P_{in} + T_{out} \times P_{out}}{1{,}000{,}000}
  • CC = API کال کی کل لاگت (امریکی ڈالر میں)
  • TinT_{in} = ان پٹ ٹوکنز کی تعداد (آپ کا پرامپٹ، سسٹم ہدایات، اور سیاق و سباق)
  • ToutT_{out} = آؤٹ پٹ ٹوکنز کی تعداد (ماڈل کا تخلیق کردہ جواب)
  • PinP_{in} = منتخب ماڈل کی فی 10 لاکھ ان پٹ ٹوکنز قیمت
  • PoutP_{out} = منتخب ماڈل کی فی 10 لاکھ آؤٹ پٹ ٹوکنز قیمت
پاکستانی روپے میں لاگت جاننے کے لیے:
CPKR=C×278C_{PKR} = C \times 278
ماہانہ لاگت کا اندازہ لگانے کے لیے توسیعی فارمولا:
Cmonthly=C×N×30C_{monthly} = C \times N \times 30
جہاں $N$ روزانہ API درخواستوں کی تعداد ہے۔ مارچ 2026 کی قیمتوں کے مطابق، بجٹ ماڈلز جیسے Amazon Nova Micro ($0.035/$0.14 فی ملین) سے لے کر پریمیم ماڈلز جیسے Claude Opus 4.6 ($5/$25 فی ملین) تک قیمتوں میں 140 گنا سے زیادہ فرق ہے۔ پاکستانی فری لانسرز جو Upwork یا Fiverr پر ڈالر میں کماتے ہیں، ان کے لیے API لاگت کا درست حساب منافع اور نقصان کا فرق ہو سکتا ہے۔

AI ٹوکن لاگت کی عملی مثالیں

Upwork فری لانسر: کلائنٹ کے لیے AI چیٹ بوٹ بنانا

ایک پاکستانی فری لانسر Upwork پر ایک کلائنٹ کے لیے کسٹمر سروس چیٹ بوٹ بنا رہا ہے۔ چیٹ بوٹ روزانہ 2,000 گفتگو سنبھالتا ہے، ہر گفتگو میں اوسطاً 800 ان پٹ ٹوکنز اور 400 آؤٹ پٹ ٹوکنز خرچ ہوتے ہیں۔
GPT-4.1 mini ($0.40/$1.60 فی ملین) استعمال کرنے پر: ان پٹ لاگت: 2,000 x 800 / 1,000,000 x $0.40 = $0.64 یومیہ آؤٹ پٹ لاگت: 2,000 x 400 / 1,000,000 x $1.60 = $1.28 یومیہ ماہانہ کل: $57.60 یعنی تقریباً 16,013 روپے
اگر کلائنٹ بہتر معیار کے لیے Claude Sonnet 4.6 ($3/$15 فی ملین) چاہے تو ماہانہ لاگت $540 یعنی تقریباً 1,50,120 روپے ہوگی -- 9 گنا سے زیادہ فرق۔ فری لانسر کو کلائنٹ کو دونوں آپشنز دکھانے چاہیئں تاکہ معیار اور لاگت میں توازن قائم ہو سکے۔

پاکستانی سٹارٹ اپ: اردو کانٹینٹ جنریشن ایپ

لاہور کا ایک سٹارٹ اپ اردو میں سوشل میڈیا پوسٹس تخلیق کرنے والی ایپ بنا رہا ہے۔ ہر پوسٹ کے لیے 200 الفاظ کا اردو پرامپٹ (تقریباً 500 ٹوکنز) اور 150 الفاظ کا اردو آؤٹ پٹ (تقریباً 400 ٹوکنز) درکار ہے۔ نوٹ کریں کہ 200 اردو الفاظ تقریباً 500 ٹوکنز بنتے ہیں جبکہ 200 انگریزی الفاظ صرف 267 ٹوکنز ہوتے -- اردو 2 گنا زیادہ مہنگی ہے۔
روزانہ 5,000 پوسٹس تخلیق کرنے پر Gemini 2.5 Flash ($0.30/$2.50 فی ملین) سے: ان پٹ: 5,000 x 500 / 1,000,000 x $0.30 = $0.75 یومیہ آؤٹ پٹ: 5,000 x 400 / 1,000,000 x $2.50 = $5.00 یومیہ ماہانہ کل: $172.50 یعنی تقریباً 47,955 روپے
یہی کام GPT-5.4 ($2.50/$15 فی ملین) سے کریں تو ماہانہ لاگت $1,312.50 یعنی 3,64,875 روپے ہوگی۔ سٹارٹ اپ مرحلے میں بجٹ ماڈل سے شروع کرنا اور معیار کی جانچ کے بعد فیصلہ کرنا عقلمندی ہے۔

فری لانس مترجم: AI سے ترجمہ میں مدد

کراچی کی ایک فری لانسر روزانہ 20 دستاویزات کا انگریزی سے اردو ترجمہ AI کی مدد سے کرتی ہے۔ ہر دستاویز میں اوسطاً 1,500 الفاظ (2,000 ان پٹ ٹوکنز) ہیں اور اردو ترجمہ تقریباً 4,500 ٹوکنز لیتا ہے (اردو آؤٹ پٹ انگریزی سے 2 گنا سے زیادہ ٹوکنز استعمال کرتا ہے)۔
Claude Haiku 4.5 ($1/$5 فی ملین) سے: ان پٹ: 20 x 2,000 / 1,000,000 x $1 = $0.04 یومیہ آؤٹ پٹ: 20 x 4,500 / 1,000,000 x $5 = $0.45 یومیہ ماہانہ کل: $14.70 یعنی تقریباً 4,085 روپے
اس فری لانسر کی Upwork پر ماہانہ آمدنی 2 سے 3 لاکھ روپے ہے۔ AI API کی لاگت اس کی آمدنی کا صرف 1.5 سے 2 فیصد ہے جبکہ پیداواری صلاحیت 3 گنا بڑھ جاتی ہے -- یہ بہترین سرمایہ کاری ہے۔

AI API ٹوکن لاگت کم کرنے کے عملی طریقے

  • ہر کام کے لیے صحیح ماڈل چنیں۔ سادہ کام (FAQ جوابات، درجہ بندی، خلاصہ) کے لیے بجٹ ماڈلز جیسے GPT-4.1 mini، Gemini 2.5 Flash-Lite، Claude Haiku، DeepSeek V3.2، Grok 4.1 Fast، Amazon Nova Micro یا Mistral Small استعمال کریں۔ پیچیدہ استدلال کے لیے GPT-5.4، GPT-4.1، Claude Sonnet/Opus، Gemini 2.5 Pro، یا Grok 4 محفوظ رکھیں۔ ماڈل روٹنگ سے 40 سے 60 فیصد لاگت کم ہو سکتی ہے۔
  • پرامپٹ کیشنگ فعال کریں۔ اگر آپ کا سسٹم پرامپٹ ہر درخواست میں ایک جیسا ہے تو Anthropic اور OpenAI کی پرامپٹ کیشنگ سے ان پٹ ٹوکنز پر 90 فیصد تک رعایت مل سکتی ہے۔ پاکستانی سٹارٹ اپس کے لیے یہ لاکھوں روپے کی بچت ہو سکتی ہے۔
  • اردو ٹیکسٹ کی اضافی لاگت کا خیال رکھیں۔ اردو 2 سے 3 گنا زیادہ ٹوکنز استعمال کرتی ہے۔ ممکن ہو تو درمیانی پروسیسنگ انگریزی میں کریں اور صرف صارف کے سامنے آنے والا مواد اردو میں رکھیں۔ اس سے 40 سے 60 فیصد ٹوکنز بچ سکتے ہیں۔
  • بیچ API کا فائدہ اٹھائیں۔ OpenAI اور Anthropic غیر فوری کاموں کے لیے بیچ پروسیسنگ پر 50 فیصد رعایت دیتے ہیں۔ اگر آپ کو فوری نتائج کی ضرورت نہیں (رپورٹس، بلک تجزیہ) تو بیچ میں بھیجیں اور آدھی لاگت بچائیں۔
  • max_tokens پیرامیٹر ضرور مقرر کریں۔ حد مقرر کیے بغیر ماڈل ضرورت سے زیادہ لمبے جوابات دے سکتا ہے جس سے غیر ضروری لاگت آتی ہے۔ اگر ایک جملے کا جواب چاہیے تو آؤٹ پٹ 100 ٹوکنز تک محدود کریں۔
  • خرچ کی نگرانی اور حدود مقرر کریں۔ API فراہم کنندگان کے ڈیش بورڈ میں خرچ کی حدود (spending limits) لگائیں اور تنبیہات فعال کریں۔ کوڈ میں ایک غلط لوپ پورے مہینے کا بجٹ چند گھنٹوں میں ختم کر سکتا ہے۔
  • اوپن سورس ماڈلز پر غور کریں۔ Llama 4 (Meta)، DeepSeek V3.2، اور Mistral Small جیسے ماڈلز Groq پر $0.11 سے $0.50 فی ملین ٹوکنز میں دستیاب ہیں۔ زیادہ حجم والے پاکستانی سٹارٹ اپس کے لیے خود ہوسٹنگ سے 5 سے 10 گنا بچت ممکن ہے۔

AI ٹوکنز اور API لاگت: اکثر پوچھے جانے والے سوالات

اردو ٹیکسٹ میں انگریزی سے زیادہ ٹوکنز کیوں لگتے ہیں؟

LLM ٹوکنائزرز جیسے BPE (Byte Pair Encoding) ان زبانوں کو زیادہ مؤثر طریقے سے انکوڈ کرتے ہیں جو تربیتی ڈیٹا میں زیادہ تھیں۔ GPT-4، Claude اور Gemini کا 60 سے 80 فیصد تربیتی ڈیٹا انگریزی ہے، اس لیے انگریزی الفاظ کم ٹوکنز میں ظاہر ہوتے ہیں۔ اردو ایک مورفولوجیکل طور پر امیر زبان ہے جو نستعلیق رسم الخط استعمال کرتی ہے، جس کی وجہ سے ایک اردو لفظ 2 سے 4 ٹوکنز لے سکتا ہے جبکہ وہی مفہوم انگریزی میں 1 سے 1.3 ٹوکنز میں آ جاتا ہے۔ اس کا مطلب ہے کہ اردو میں AI ایپلیکیشنز کی لاگت 2 سے 3 گنا زیادہ ہو سکتی ہے۔

2026 میں سب سے سستا AI ماڈل کون سا ہے؟

مارچ 2026 کی قیمتوں کے مطابق سب سے سستے ماڈلز: Amazon Nova Micro ($0.035/$0.14 فی ملین، یعنی تقریباً 10/39 روپے)، GPT-5 Nano ($0.05/$0.40)، Gemini 2.0 Flash-Lite ($0.075/$0.30)، Mistral Small ($0.10/$0.30)، GPT-4.1 Nano ($0.10/$0.40)، Groq پر Llama 4 Scout ($0.11/$0.34)، Grok 4.1 Fast ($0.20/$0.50)، اور DeepSeek V3.2 ($0.28/$0.42)۔ درمیانی بجٹ: GPT-5 Mini ($0.25/$2.00)، Gemini 2.5 Flash ($0.30/$2.50)، GPT-4.1 Mini ($0.40/$1.60)، Claude Haiku 4.5 ($1/$5)۔ پریمیم: Gemini 2.5 Pro ($1.25/$10)، GPT-5 ($1.25/$10)، GPT-4.1 ($2/$8)، Claude Sonnet 4.6 ($3/$15)، Grok 4 ($3/$15)، Claude Opus 4.6 ($5/$25)۔ سادہ کاموں کے لیے بجٹ ماڈلز بالکل کافی ہیں۔

پاکستانی فری لانسرز AI API کی ادائیگی کیسے کریں؟

AI API فراہم کنندگان (OpenAI، Anthropic، Google) صرف امریکی ڈالر میں ادائیگی قبول کرتے ہیں۔ پاکستان سے ادائیگی کے طریقے: بین الاقوامی ویزا/ماسٹر کارڈ ڈیبٹ یا کریڈٹ کارڈ، Payoneer ورچوئل کارڈ (جو Upwork/Fiverr آمدنی سے جڑا ہو)، یا NayaPay/SadaPay کا بین الاقوامی کارڈ۔ ہر ادائیگی پر بینک کی طرف سے 2 سے 3 فیصد غیر ملکی کرنسی چارج لگ سکتا ہے۔ لاگت کا حساب لگاتے وقت اس اضافی چارج کو بھی شامل کریں۔

ان پٹ ٹوکنز اور آؤٹ پٹ ٹوکنز میں قیمت کا فرق کیوں ہے؟

آؤٹ پٹ ٹوکنز 3 سے 5 گنا زیادہ مہنگے ہوتے ہیں کیونکہ ماڈل انہیں تخلیق کرنے کے لیے بالکل مختلف طریقے سے کام کرتا ہے۔ ان پٹ ٹوکنز ایک ہی بار میں متوازی طور پر پروسیس ہوتے ہیں۔ آؤٹ پٹ ٹوکنز ایک ایک کر کے ترتیب وار تخلیق ہوتے ہیں -- ہر نئے ٹوکن کے لیے ماڈل کو الگ فارورڈ پاس چلانا پڑتا ہے۔ مثال کے طور پر Claude Sonnet 4.6 میں ان پٹ $3 فی ملین ہے جبکہ آؤٹ پٹ $15 فی ملین -- یعنی 5 گنا فرق۔ اس لیے جوابات مختصر رکھنا لاگت بچانے کا مؤثر ترین طریقہ ہے۔

ChatGPT Plus سبسکرپشن اور API میں کیا فرق ہے؟

ChatGPT Plus ماہانہ $20 (تقریباً 5,560 روپے) میں ویب انٹرفیس کے ذریعے GPT-4o تک رسائی دیتا ہے -- یہ ذاتی استعمال کے لیے مناسب ہے۔ API استعمال کے مطابق چارج کرتا ہے اور آپ کی ایپلیکیشنز میں AI کو پروگراماتی طور پر شامل کرنے دیتا ہے۔ اگر آپ فری لانسر ہیں اور کلائنٹ کے لیے AI ایپ بنا رہے ہیں تو API واحد آپشن ہے۔ اگر ماہانہ 7,500 سے کم درخواستیں ہوں تو API سستا پڑتا ہے، ورنہ Plus زیادہ فائدہ مند ہو سکتا ہے۔

GPT-4o، Claude Sonnet اور Gemini Pro میں لاگت کا موازنہ کیا ہے؟

مارچ 2026 کی قیمتیں (فی ملین ٹوکنز): GPT-4o ان پٹ $2.50 اور آؤٹ پٹ $10 (PKR 695/2,780 فی ملین)۔ Claude Sonnet 4.6 ان پٹ $3 اور آؤٹ پٹ $15 (PKR 834/4,170 فی ملین)۔ Gemini 2.5 Pro ان پٹ $1.25 اور آؤٹ پٹ $10 (PKR 348/2,780 فی ملین)۔ Gemini ان پٹ میں سب سے سستا ہے، Claude آؤٹ پٹ میں سب سے مہنگا۔ تاہم صرف قیمت نہیں دیکھنی چاہیے: Claude کوڈنگ اور تجزیے میں بہترین ہے، GPT-4o ملٹی موڈل کاموں میں آگے ہے، اور Gemini لمبے سیاق و سباق میں (10 لاکھ ٹوکنز تک) مضبوط ہے۔

پرامپٹ کیشنگ کیا ہے اور یہ لاگت کیسے کم کرتی ہے؟

پرامپٹ کیشنگ ایک تکنیک ہے جس میں بار بار بھیجے جانے والے پرامپٹ حصے (جیسے سسٹم ہدایات) کو محفوظ کر لیا جاتا ہے تاکہ ہر بار دوبارہ حساب نہ لگانا پڑے۔ کیش شدہ ٹوکنز پر 10 سے 50 فیصد لاگت لگتی ہے، یعنی 90 فیصد تک بچت ممکن ہے۔ مثال: اگر آپ کا سسٹم پرامپٹ 500 ٹوکنز کا ہے اور روزانہ 10,000 درخواستیں بھیجتے ہیں تو کیشنگ سے ماہانہ تقریباً $4.50 کی بجائے $0.45 خرچ ہوتے ہیں -- 1,125 روپے کی بچت صرف ایک پرامپٹ سے۔ OpenAI خودکار کیشنگ کرتا ہے جبکہ Anthropic میں آپ کو cache_control ہیڈرز لگانے ہوتے ہیں۔

10,000 الفاظ کی دستاویز GPT سے پروسیس کرنے کی لاگت کتنی ہے؟

10,000 انگریزی الفاظ تقریباً 13,333 ان پٹ ٹوکنز بنتے ہیں۔ GPT-4.1 ($2/ملین ان پٹ) سے صرف ان پٹ لاگت $0.027 (تقریباً 7.5 روپے)۔ اگر 500 الفاظ کا خلاصہ چاہیں (667 آؤٹ پٹ ٹوکنز، $8/ملین آؤٹ پٹ) تو آؤٹ پٹ لاگت $0.005 (1.4 روپے)۔ کل: $0.032 یعنی 9 روپے فی دستاویز۔ 1,000 دستاویزات: $32 یعنی تقریباً 8,896 روپے۔ سستے GPT-4.1 mini سے یہی کام $0.006 فی دستاویز یعنی تقریباً 1.7 روپے میں ہو جاتا ہے -- 5 گنا کم لاگت۔


اہم اصطلاحات

ٹوکن (Token)

ٹیکسٹ کی سب سے چھوٹی اکائی جسے LLM پروسیس کرتا ہے۔ ایک ٹوکن ایک مکمل لفظ، لفظ کا حصہ، حرف، یا رموزِ اوقاف ہو سکتا ہے۔ انگریزی کے عام الفاظ 1 سے 2 ٹوکنز جبکہ اردو الفاظ 2 سے 4 ٹوکنز لیتے ہیں۔

ٹوکنائزر (Tokenizer)

وہ الگورتھم جو خام ٹیکسٹ کو ٹوکنز میں تبدیل کرتا ہے۔ مختلف ماڈلز مختلف ٹوکنائزر استعمال کرتے ہیں -- OpenAI کا tiktoken، Google کا SentencePiece -- اسی لیے ایک ہی ٹیکسٹ مختلف ماڈلز میں مختلف ٹوکن شمار دے سکتا ہے۔

BPE (بائٹ پیئر انکوڈنگ)

جدید LLMs میں سب سے عام ٹوکنائزیشن الگورتھم۔ یہ بار بار آنے والے حروف کے جوڑوں کو ملا کر ایک ٹوکن بناتا ہے۔ GPT، Claude، Grok، DeepSeek اور Mistral سب BPE کی مختلف شکلیں استعمال کرتے ہیں۔

سیاق ونڈو (Context Window)

ایک درخواست میں ماڈل جتنے ٹوکنز پروسیس کر سکتا ہے اس کی زیادہ سے زیادہ حد۔ GPT-4.1 میں 10 لاکھ، Claude Opus 4.6 میں 10 لاکھ، Gemini 2.5 Pro میں 10 لاکھ سے زیادہ، اور Grok 4.1 Fast میں 20 لاکھ ٹوکنز تک کی حد ہے۔

پرامپٹ کیشنگ (Prompt Caching)

بار بار بھیجے جانے والے پرامپٹ حصوں کو محفوظ کر کے دوبارہ استعمال کرنے کی تکنیک۔ کیش شدہ ٹوکنز پر 90 فیصد تک رعایت ملتی ہے۔ OpenAI خودکار طور پر اور Anthropic واضح ترتیب سے یہ سہولت فراہم کرتے ہیں۔

فی ملین ٹوکنز قیمت (Cost per Million Tokens)

AI API قیمتوں کی معیاری اکائی۔ فراہم کنندگان فی 10 لاکھ ٹوکنز کی قیمت بتاتے ہیں، ان پٹ اور آؤٹ پٹ کی الگ الگ شرحوں کے ساتھ۔ آؤٹ پٹ عام طور پر 3 سے 5 گنا مہنگا ہوتا ہے۔

API (ایپلیکیشن پروگرامنگ انٹرفیس)

وہ انٹرفیس جو ڈویلپرز کو AI ماڈلز سے پروگراماتی طور پر رابطہ کرنے، درخواستیں بھیجنے اور جوابات وصول کرنے دیتا ہے۔ ادائیگی پروسیس شدہ ٹوکنز کی بنیاد پر ہوتی ہے۔