Question 1

כמה טוקנים יש ב-1,000 מילים בעברית?

Accepted Answer

בממוצע, 1,000 מילים בעברית צורכות כ-2,000-2,500 טוקנים במודלים כמו GPT ו-Claude. לשם השוואה, 1,000 מילים באנגלית מתורגמות לכ-1,333 טוקנים. ההפרש נובע מכך שמערכות הטוקנייזר (כמו tiktoken) מותאמות בעיקר לאנגלית ולשפות לטיניות, בעוד שעברית כשפה שמית עם מורפולוגיה עשירה (אותיות ניקוד, מילות יחס מחוברות, שורשים) דורשת פירוק לחתיכות קטנות יותר. המשמעות המעשית: עיבוד טקסט עברי עולה 50-100% יותר מאנגלית.

Question 2

למה טוקני פלט יקרים יותר מטוקני קלט?

Accepted Answer

טוקני פלט יקרים פי 3-5 מטוקני קלט בגלל ההבדל בתהליך החישובי. טוקני קלט מעובדים במעבר אחד במקביל דרך המודל. לעומת זאת, טוקני פלט חייבים להיווצר אחד-אחד ברצף — כל טוקן חדש דורש מעבר חישובי נפרד. תהליך סדרתי זה יקר הרבה יותר מבחינת חישוב וזיכרון. לדוגמה, Claude Sonnet 4.6 גובה 3$ למיליון טוקני קלט אבל 15$ למיליון טוקני פלט — יחס של 1:5.

Question 3

מה המודל הכי זול ל-API של בינה מלאכותית ב-2026?

Accepted Answer

נכון למרץ 2026, המודלים הזולים ביותר (קלט/פלט למיליון טוקנים): Amazon Nova Micro ($0.035/$0.14), GPT-5 Nano ($0.05/$0.40), Gemini 2.0 Flash-Lite ($0.075/$0.30), Mistral Small ($0.10/$0.30), GPT-4.1 Nano ($0.10/$0.40), Llama 4 Scout דרך Groq ($0.11/$0.34), Grok 4.1 Fast ($0.20/$0.50), ו-DeepSeek V3.2 ($0.28/$0.42). בשקלים, מודל כמו Gemini 2.0 Flash-Lite עולה כ-0.28 ₪ למיליון טוקני קלט — פחות מאגורה למאה קריאות קצרות. לפני שבוחרים מודל זול, חשוב לבדוק את האיכות בעברית — לא כל המודלים הזולים מתמודדים טוב עם עברית.

Question 4

מה ההבדל בין טוקנים למילים?

Accepted Answer

מילה היא יחידת שפה שמופרדת ברווחים. טוקן הוא יחידה שמוגדרת על ידי הטוקנייזר של המודל — הוא יכול להיות מילה שלמה, חלק ממילה, תו בודד או סימן פיסוק. מילים נפוצות כמו 'the' או 'is' הן בדרך כלל טוקן אחד. מילים ארוכות או נדירות מפוצלות למספר טוקנים: למשל, 'unbelievable' הופכת ל-'un', 'believ', 'able' (3 טוקנים). בעברית, מילה כמו 'שהשתמשתי' עשויה להתפצל ל-4-5 טוקנים. קוד, מספרים וטקסט שאינו באנגלית בדרך כלל דורשים יותר טוקנים למילה.

Question 5

איך Prompt Caching מפחית עלויות?

Accepted Answer

Prompt Caching שומר את וקטורי ה-key-value של פרומפטים חוזרים (כמו הוראות מערכת) כך שאין צורך לחשב אותם מחדש בכל בקשה. טוקנים שמורים מחויבים ב-10-50% מהמחיר הרגיל, תלוי בספק. לאפליקציות ששולחות את אותן הוראות מערכת בכל בקשה — צ’אטבוטים, עוזרי קוד, מעבדי מסמכים — Prompt Caching יכול להפחית עלויות קלט עד 90%. ב-OpenAI זה פועל אוטומטית; ב-Anthropic וב-Google נדרשת הגדרה מפורשת.

Question 6

כמה עולה לעבד מסמך של 10,000 מילים בעברית?

Accepted Answer

מסמך של 10,000 מילים בעברית הוא כ-20,000-25,000 טוקני קלט (בהשוואה ל-13,333 טוקנים לאותו אורך באנגלית). עם GPT-4.1 (2.00$ למיליון טוקני קלט), עלות הקלט בלבד היא כ-$0.04-$0.05 (כ-0.15-0.19 ₪). אם המודל מייצר סיכום של 500 מילים (כ-1,200 טוקנים ב-8.00$ למיליון), עלות הפלט היא כ-$0.01 (כ-0.04 ₪). סך הכול לעיבוד מסמך אחד: כ-0.20 ₪. עיבוד 1,000 מסמכים כאלה: כ-200 ₪. עם GPT-4.1 mini, העלות נמוכה פי 5 בערך.

Question 7

האם כדאי להשתמש ב-API או במנוי ChatGPT Plus?

Accepted Answer

זה תלוי בסוג השימוש. מנוי ChatGPT Plus עולה 20$ לחודש (כ-75 ₪) ומספק שימוש נדיב אך מוגבל במודלים כמו GPT-4o. API, לעומת זאת, מתומחר לפי צריכה בפועל. אם אתם צורכים פחות מ-7,500 בקשות בחודש (עם ממוצע 500 טוקנים לבקשה), ה-API זול יותר. אבל המנוי עדיף למשתמש בודד שצריך ממשק שיחה. לאפליקציות ומוצרים תוכנתיים, ה-API הוא האפשרות היחידה.

Question 8

האם תמונות וקבצים צורכים טוקנים במודלים רב-מודליים?

Accepted Answer

כן. כשמשתמשים במודלים שתומכים בראייה ממוחשבת כמו GPT-4o או Gemini, תמונות מומרות לטוקנים לפי הרזולוציה שלהן. תמונה של 1024×1024 פיקסלים צורכת כ-765 טוקנים ב-GPT-4o, כשהחישוב מתבצע על ידי חלוקת התמונה לאריחים של 512 פיקסלים (170 טוקנים כל אחד) בתוספת עלות בסיס של 85 טוקנים. תמונות ברזולוציה גבוהה יותר צורכות יותר טוקנים. מסמכי PDF וקבצים אחרים בדרך כלל מומרים לטקסט תחילה ואז מטוקנזים כרגיל.

מחשבון טוקנים

$0.01

$1.05

$31.50

$383.25

הערך טוקנים מטקסט