Question 1

繁體中文 1,000 字會被切成多少 token？

Accepted Answer

用 OpenAI 的 cl100k_base（GPT-3.5、GPT-4 系列）或 o200k_base（GPT-4o、GPT-5）編碼實測，繁體中文每 1,000 字約 1,800 到 2,000 token——也就是 1 個中文字約 1.8 到 2.0 token。常用字（我、的、是、台、灣）通常 1 token，較生僻字或專有名詞會被拆成 2 到 3 個 byte 的 token。比較英文：1,000 字英文只要約 1,333 token。同樣的服務，繁體中文使用者的 API 成本大約比英文使用者多 40% 到 50%。

Question 2

為什麼 output token 比 input token 貴 3 到 5 倍？

Accepted Answer

因為生成方式不同。Input 可以一次平行運算所有 token（一次 forward pass 就完成），output 則必須一個 token、一個 token 序列產生，每個新 token 都要再跑一次完整的 forward pass，計算量與 GPU 記憶體頻寬都遠高於 input。所以 Claude Sonnet 4.6 是 input $3、output $15（5:1）；GPT-4.1 是 $2 / $8（4:1）。設計 prompt 時，能用 input 帶過的就別讓模型輸出，例如「給我 1-10 的分數」就比「請詳細說明分析過程並給出評分」省 90% 的 output 成本。

Question 3

2026 年最便宜的 LLM API 是哪一家？

Accepted Answer

依 2026 年 3 月公告，每百萬 token（input/output）最便宜的依序是：Amazon Nova Micro（$0.035/$0.14）、OpenAI GPT-5 Nano（$0.05/$0.40）、Google Gemini 2.0 Flash-Lite（$0.075/$0.30）、Mistral Small（$0.10/$0.30）、GPT-4.1 Nano（$0.10/$0.40）、Llama 4 Scout 經 Groq（$0.11/$0.34）、xAI Grok 4.1 Fast（$0.20/$0.50）、DeepSeek V3.2（$0.28/$0.42）。中階性價比代表是 Gemini 2.5 Flash（$0.30/$2.50）、GPT-4.1 Mini（$0.40/$1.60）、Claude Haiku 4.5（$1/$5）。「最便宜」要看任務難度配對：分類抽取用 Nova Micro/Flash-Lite，需要中文邏輯推理用 Claude Haiku 或 GPT-4.1 Mini 比較穩。

Question 4

Prompt caching 對台灣場景的省錢效果有多大？

Accepted Answer

對於有重複 context 的應用（聊天機器人、知識庫問答、長 system prompt），效果非常明顯。Anthropic 的快取讀取單價只要 input 原價的 10%、寫入快取只是 1.25 倍，5 分鐘內第二次呼叫就能回本。OpenAI 自動套用 prompt caching 不需設定，但 Anthropic 與 Google 需要明確標 cache_control。實務上：5,000 token 的 RAG 系統 prompt + 文件 chunk，啟用快取後 input 從 5,000 × $3 = $0.015 降到 5,000 × $0.30 = $0.0015，省 90%。對中文 RAG（同樣語意 token 數較多）省下的絕對金額更可觀。

Question 5

怎麼在送 API 前先精準算出 token 數？

Accepted Answer

三種主流做法。第一，用 OpenAI 的 tiktoken（Python：import tiktoken; enc = tiktoken.encoding_for_model("gpt-4o"); len(enc.encode(text))）或 JavaScript 套件 gpt-tokenizer。Anthropic 提供 anthropic.messages.count_tokens API，Google 有 client.count_tokens()。第二，用上方的 Token 計算器，貼上文字立刻看到 GPT、Claude、Gemini 的 token 數比較。第三，用粗估值（中文 1.8–2 token/字、英文 0.25 token/字），快速心算。生產系統建議走第一種，每 1,000 次呼叫的誤差不會超過 1%。

Question 6

Token 和「字」、「字元」、「詞」差在哪？

Accepted Answer

詞（word）是人類語言的單位，token 是 BPE/SentencePiece 演算法切出來的單位，可能是整個英文單字、子詞、一個中文字、單一標點。常見英文字「the」、「is」是 1 token；長字「unbelievable」會被切成「un」、「believ」、「able」三個 token。繁體中文「你好」可能是 2 token、「人工智慧」可能是 2 到 4 token，視前後文與訓練語料而定。所以 token 不會等於字數，更不會等於字元數，這也是 LLM 計價無法簡單對應「我寫了多少字」的原因。

Question 7

處理一份 5,000 字的繁體中文文件大約要多少錢？

Accepted Answer

5,000 字繁體中文約 9,000 到 10,000 token（取 1 字 ≈ 1.9 token）。用 GPT-4.1（input $2/M、output $8/M）讀這份文件、產一份 500 字摘要（約 950 token output），單次成本約 $0.026（input）+ $0.008（output）= $0.034，約新台幣 1.1 元。每天處理 1,000 份就是 $34（新台幣 1,070 元）/日、$1,020（新台幣 32,200 元）/月。改用 GPT-4.1 Mini 月費降到 $204（新台幣 6,440 元），是文件處理 pipeline 的常見選擇。

Question 8

圖片或檔案會吃 token 嗎？多模態怎麼算？

Accepted Answer

會。視覺模型（GPT-4o、Gemini、Claude 3.5 Sonnet）會把圖片切 patch 編碼成 token。GPT-4o 處理一張 1024×1024 的圖約 765 token：拆成 4 個 512px tile（每 tile 170 token）+ 基底 85 token；high detail 模式會多倍計費，low detail 約固定 85 token。Gemini 對圖片每張固定 258 token、Claude 視解析度約 500 到 1,500 token。PDF 通常先 OCR 或抽文字後再丟入 prompt，跟一般文字一樣計費。語音則是另套計費（OpenAI Whisper 是按分鐘）。

Question 9

Token 計算器免費嗎？資料會被儲存嗎？

Accepted Answer

完全免費、不需要註冊、沒有使用次數限制。所有 token 計算都在瀏覽器端完成，輸入的文字不會送到我們的伺服器、不會被記錄、也不會用於任何訓練。對於放心貼公司內部 prompt、客戶資料 prefix、未公開 system prompt 都很合適。如果要在自動化 pipeline 中持續計算，可以直接整合 OpenAI tiktoken（Python）或 gpt-tokenizer（JavaScript）等開源套件，在地端執行。

Question 10

Claude、GPT、Gemini 三家 2026 年定價怎麼比？

Accepted Answer

依 2026 年 3 月公告（USD/1M tokens，input/output）：頂規方案——Claude Opus 4.6（$5/$25）、GPT-5.4（$2.50/$15）、Gemini 2.5 Pro（$1.25/$10）。標準方案——Claude Sonnet 4.6（$3/$15）、GPT-5（$1.25/$10）、Gemini 3 Flash（$0.50/$3.00）。經濟方案——Claude Haiku 4.5（$1/$5）、GPT-4.1 Mini（$0.40/$1.60）、Gemini 2.5 Flash（$0.30/$2.50）。極省方案——GPT-5 Nano（$0.05/$0.40）、GPT-4.1 Nano（$0.10/$0.40）、Gemini 2.5 Flash-Lite（$0.10/$0.40）。Anthropic 沒有 Nano 等級的超低價方案，但 Claude 系列在 prompt caching 後（90% 折扣）的中長文件處理常常反而最划算。實作建議：先用 Token 計算器把候選模型的單次成本算出來，再評估品質落差是否值得價差。

Token 計算機

$0.01

$1.05

$31.50

$383.25

從文字估算 token 數

Token 計算器。估算 GPT、Claude、Gemini 等 LLM 的 token 數與 API 費用。

什麼是 AI Token 計算器？為什麼台灣開發者需要它？

如何計算 LLM API 費用？

AI Token 費用計算公式

Token 費用試算實例：台灣 SaaS 與工程團隊情境

中文客服機器人：每月 50,000 次對話

iThome 鐵人賽參賽者：自架文件問答 RAG 30 天

20 人開發團隊用 Claude Code：月帳單試算

降低 LLM API 成本的實戰技巧

Token 與 LLM API 費用常見問題

繁體中文 1,000 字會被切成多少 token？

為什麼 output token 比 input token 貴 3 到 5 倍？

2026 年最便宜的 LLM API 是哪一家？

Prompt caching 對台灣場景的省錢效果有多大？

怎麼在送 API 前先精準算出 token 數？

Token 和「字」、「字元」、「詞」差在哪？

處理一份 5,000 字的繁體中文文件大約要多少錢？

圖片或檔案會吃 token 嗎？多模態怎麼算？

Token 計算器免費嗎？資料會被儲存嗎？

Claude、GPT、Gemini 三家 2026 年定價怎麼比？

Token 與 LLM 計費名詞

Token（詞元）

Tokenizer（分詞器）

BPE（Byte Pair Encoding）

Context Window（上下文視窗）

Prompt Caching（提示詞快取）

Input vs. Output Tokens

Cost per Million Tokens（每百萬 token 單價）

Batch API

參考資料與來源