Question 1

מהו טוקן בהקשר של AI ומודלי שפה (LLM)?

Accepted Answer

טוקן הוא פיסת טקסט — בדרך כלל מילה, חלק ממילה או סימן פיסוק — שמודל שפה גדול מעבד כיחידה בודדת. מודלי GPT של OpenAI משתמשים בטוקנייזר בשם tiktoken, כאשר 1,000 טוקנים שווים ל-750 מילים באנגלית בערך. התמחור של כל ממשקי ה-API המובילים (OpenAI, Anthropic, Google) מחושב לפי טוקן, עם תעריפים נפרדים לקלט (מה ששולחים) ולפלט (מה שהמודל מייצר).

Question 2

איך מחשבים את עלות השימוש ב-API של ChatGPT?

Accepted Answer

הכפילו את מספר טוקני הקלט במחיר הקלט למיליון טוקנים של המודל, ואז הוסיפו את מספר טוקני הפלט כפול מחיר הפלט. לדוגמה, GPT-4o גובה כ-$5.00 למיליון טוקני קלט ו-$15.00 למיליון טוקני פלט נכון לתחילת 2025. מחשבון הטוקנים שלנו מבצע את החשבון הזה עבורכם כך שתוכלו להעריך עלויות לכל אורך פרומפט וגודל תגובה.

Question 3

למה טוקני פלט יקרים יותר מטוקני קלט?

Accepted Answer

ייצור טוקני פלט דורש מהמודל לבצע forward pass מלא לכל טוקן שהוא מייצר, מה שתובעני חישובית. קריאת טוקני קלט היא מעבר מקבילי בודד על ההקשר. חוסר הסימטריה הזה בא לידי ביטוי בתמחור של כמעט כל הספקים — טוקני פלט עולים בדרך כלל פי 2 עד 5 מטוקני קלט לאותו מודל.

Question 4

כמה טוקנים צורכת שיחה טיפוסית עם ChatGPT?

Accepted Answer

חילופי דברים קצרים (שניים-שלושה סיבובים) צורכים בערך 200–500 טוקנים. שאלה מפורטת עם תשובה מעמיקה עשויה להגיע ל-1,000–3,000 טוקנים. סיכום מסמכים ארוכים או צינורות RAG (יצירה מוגברת אחזור) יכולים לצרוך עשרות אלפי טוקנים לבקשה. מחשבון הטוקנים מאפשר לכם לקבוע כמויות משלכם ולהעריך עלויות בכל קנה מידה.

Question 5

איזה API של מודל שפה הכי זול ב-2025?

Accepted Answer

נכון ל-2025, ממשקי API של מודלים בקוד פתוח (DeepSeek, Llama על Groq, Mistral) מציעים את המחירים הנמוכים ביותר לטוקן — לעיתים מתחת ל-$0.10 למיליון טוקני קלט. בין מודלי החזית הקנייניים, GPT-4o Mini ו-Claude Haiku נמצאים בדרג התקציבי. האפשרות הזולה ביותר תלויה במשימה הספציפית: מודל שדורש פחות טוקנים להשלמת משימה עשוי להיות חסכוני יותר גם במחיר גבוה יותר לטוקן.

Question 6

האם השפה שכותבים בה משפיעה על כמות הטוקנים?

Accepted Answer

כן, באופן משמעותי. אנגלית היא השפה היעילה ביותר מבחינת טוקנים ברוב הטוקנייזרים של LLM. שפות עם כתבים לא-לטיניים — ערבית, הינדי, יפנית, קוריאנית, תאילנדית — צורכות לרוב פי 2 עד 4 טוקנים למילה. סינית יעילה מעט יותר משפות CJK אחרות אך עדיין יקרה יותר לתו מאנגלית. המשמעות: יישומים רב-לשוניים צריכים לתקצב צריכת טוקנים גבוהה יותר בהשוואה לעומסי עבודה באנגלית בלבד.

טכנולוגיה

מחשבון טוקנים

מחשבוני טכנולוגיה

הערכת עלות API של מודלי שפה

הבנת טוקנים של AI

השוואה בין מודלים וספקים

שאלות נפוצות