Question 1

AI 和 LLM 中的 token 是甚麼？

Accepted Answer

Token 是一個文字片段——通常是一個詞、詞的一部分或標點符號——大型語言模型將其作為一個單位來處理。OpenAI 的 GPT 模型使用名為 tiktoken 的分詞器，其中 1,000 個 token 約等於 750 個英文詞。每個主要 LLM API（OpenAI、Anthropic、Google）的定價都按 token 計算，輸入（你發送的內容）和輸出（模型生成的內容）有不同的費率。

Question 2

如何計算使用 ChatGPT API 的成本？

Accepted Answer

將輸入 token 數乘以模型的每百萬輸入 token 價格，再加上輸出 token 數乘以輸出價格。例如，截至 2025 年初，GPT-4o 每百萬輸入 token 約收費 $5.00，每百萬輸出 token 約 $15.00。我們的 token 計算機自動完成這些計算，讓你無需手動運算即可估算任何提示長度和回應大小的成本。

Question 3

為甚麼輸出 token 比輸入 token 貴？

Accepted Answer

生成輸出 token 需要模型為其產生的每個 token 執行完整的前向傳播，這是計算密集型的。讀取輸入 token 是一次對整個上下文的平行傳播。這種不對稱性反映在幾乎所有供應商的定價中——同一模型的輸出 token 通常比輸入 token 貴 2 至 5 倍。

Question 4

典型的 ChatGPT 對話使用多少 token？

Accepted Answer

一段簡短的對話交流（兩到三輪）大約使用 200 至 500 個 token。一個詳細的問題加上完整的回答可能使用 1,000 至 3,000 個 token。長篇文件摘要或 RAG（檢索增強生成）流程每次請求可能消耗數萬個 token。Token 計算機讓你設定自己的 token 數量來估算任何規模的成本。

Question 5

2025 年哪個 LLM API 最便宜？

Accepted Answer

截至 2025 年，開源模型 API（DeepSeek、Groq 託管的 Llama、Mistral）提供最低的每 token 價格——通常低於每百萬輸入 token $0.10。在前沿專有模型中，GPT-4o Mini 和 Claude Haiku 屬於經濟層。最便宜的選擇取決於你的具體任務：一個完成任務所需 token 較少的模型，即使每 token 價格較高，也可能更經濟。

Question 6

使用的語言會影響 token 數量嗎？

Accepted Answer

會，影響很大。在大多數 LLM 分詞器中，英文是 token 效率最高的語言。使用非拉丁文字的語言——阿拉伯文、印地文、日文、韓文、泰文——每個詞通常使用 2 至 4 倍的 token。中文比其他 CJK 語言效率稍高，但每個字元仍比英文更費 token。這意味着多語言應用應為比同等純英文工作負載更高的 token 消耗做預算。

科技

Token 計算機

科技計算機

LLM API 成本估算

了解 AI Token

比較模型和供應商

常見問題