Question 1

在 AI 與 LLM 領域裡，token 是什麼？

Accepted Answer

Token 是一段文字片段——通常是一個單字、單字的一部分或一個標點——大型語言模型把它當成一個單位來處理。OpenAI 的 GPT 系列使用名為 tiktoken 的分詞器，1,000 個 token 約等於 750 個英文單字。每一家主流 LLM API（OpenAI、Anthropic、Google）都以 token 計費，且 input（你送出的內容）與 output（模型生成的內容）的費率分開計算。

Question 2

如何計算 ChatGPT API 的使用費用？

Accepted Answer

把 input token 數乘以該模型的每百萬 input token 單價，再加上 output token 數乘以 output 單價。例如 2025 年初的 GPT-4o，每百萬 input token 約 5.00 美元、每百萬 output token 約 15.00 美元。我們的 Token 計算器會自動完成這些換算，讓你不用手動計算就能估算任何提示詞長度與回覆規模的成本。

Question 3

為什麼 output token 比 input token 貴？

Accepted Answer

生成 output token 時，模型必須為每一個新產出的 token 跑一次完整的前向推論（forward pass），計算量非常密集；讀取 input token 則是對整個上下文做一次平行處理。這種不對稱反映在幾乎所有服務商的定價上——同一個模型的 output token 通常會比 input token 貴 2 到 5 倍。

Question 4

一段典型的 ChatGPT 對話會消耗多少 token？

Accepted Answer

一段簡短的對話交流（兩到三輪）大約使用 200 到 500 個 token。一個詳細的提問配上完整回答可能會用到 1,000 到 3,000 個 token。長篇文件摘要或 RAG（檢索增強生成）流程每次請求則可能消耗數萬個 token。Token 計算器讓你自由設定 token 數，估算任何規模下的成本。

Question 5

2025 年最便宜的 LLM API 是哪一家？

Accepted Answer

截至 2025 年，開源權重模型 API（DeepSeek、Groq 託管的 Llama、Mistral）提供最低的每 token 單價——通常壓在每百萬 input token 0.10 美元以下。前沿專有模型中，GPT-4o Mini 與 Claude Haiku 屬於經濟級。最便宜的選擇仍取決於你的具體任務：一個完成同樣任務所需 token 較少的模型，即使單價略高，整體成本反而可能更低。

Question 6

我使用的語言會影響 token 數量嗎？

Accepted Answer

會，而且差距很大。在大多數 LLM 分詞器中，英文是 token 效率最高的語言。使用非拉丁文字的語言——阿拉伯文、印地文、日文、韓文、泰文——每個詞通常會消耗 2 到 4 倍的 token。繁體中文每個字大約對應 1.8 到 2 個 token，比起其他 CJK 語言略有優勢，但每字元仍比英文耗 token。這代表多語應用要為更高的 token 消耗預留預算，特別是面向台灣使用者的純中文工作負載。

科技

Token 計算機

科技計算器

LLM API 成本估算

認識 AI Token

比較模型與服務商

常見問題