Question 1

Tiếng Việt tốn bao nhiêu token so với tiếng Anh?

Accepted Answer

Tiếng Việt tiêu thụ nhiều token hơn tiếng Anh đáng kể do cấu trúc dấu thanh và ký tự đặc biệt. Trung bình, một từ tiếng Việt tạo ra 1,5 đến 3 token, trong khi một từ tiếng Anh chỉ khoảng 1-1,3 token. Ví dụ, từ "Một" trong tiếng Việt có thể tốn tới 5 token, trong khi "One" chỉ mất 1 token. Điều này có nghĩa cùng một nội dung viết bằng tiếng Việt có thể tốn chi phí API cao hơn 50-100% so với tiếng Anh. Đây là hạn chế của tokenizer được tối ưu chủ yếu cho tiếng Anh, không phải lỗi của người dùng.

Question 2

Tại sao token đầu ra đắt hơn token đầu vào?

Accepted Answer

Token đầu ra đắt gấp 3-5 lần vì cách các mô hình LLM sinh văn bản. Token đầu vào được xử lý song song trong một lượt tính toán duy nhất. Nhưng token đầu ra phải được sinh ra từng token một theo thứ tự -- mỗi token mới yêu cầu một lượt xử lý riêng qua toàn bộ mô hình. Quá trình sinh tuần tự này tốn nhiều tài nguyên tính toán và bộ nhớ hơn, khiến đầu ra đắt hơn nhiều. Ví dụ, Claude Sonnet 4.6 tính 3 USD/triệu token đầu vào nhưng 15 USD/triệu token đầu ra -- tỷ lệ 5:1.

Question 3

Mô hình AI nào rẻ nhất để dùng API năm 2026?

Accepted Answer

Tính đến tháng 3 năm 2026, các mô hình API rẻ nhất theo nhà cung cấp: Amazon Nova Micro (0,035/0,14 USD/triệu token), GPT-5 Nano (0,05/0,40 USD), Gemini 2.0 Flash-Lite (0,075/0,30 USD), Mistral Small (0,10/0,30 USD), GPT-4.1 Nano (0,10/0,40 USD), Llama 4 Scout qua Groq (0,11/0,34 USD), Grok 4.1 Fast (0,20/0,50 USD), và DeepSeek V3.2 (0,28/0,42 USD). Tầm trung: Gemini 2.5 Flash (0,30/2,50 USD), GPT-4.1 Mini (0,40/1,60 USD), Claude Haiku 4.5 (1/5 USD). Cao cấp: Gemini 2.5 Pro (1,25/10 USD), GPT-4.1 (2/8 USD), Claude Sonnet 4.6 (3/15 USD), Claude Opus 4.6 (5/25 USD). Mô hình rẻ nhất phù hợp cho phân loại, trích xuất và Q&A đơn giản, nhưng suy luận phức tạp cần mô hình cao cấp hơn.

Question 4

Chi phí dùng API AI hàng tháng cho startup Việt Nam là bao nhiêu?

Accepted Answer

Chi phí phụ thuộc vào mô hình và khối lượng sử dụng. Dự án nhẹ (100 yêu cầu/ngày với GPT-4.1 mini): khoảng 25.000-130.000 VND/tháng. Ứng dụng production (1.000 yêu cầu/ngày với GPT-4.1): khoảng 1.280.000-5.120.000 VND/tháng. Sử dụng chuyên sâu với mô hình cao cấp: có thể vượt 25.600.000 VND/tháng. Lưu ý rằng giá API tính bằng USD, nên tỷ giá USD/VND ảnh hưởng trực tiếp đến chi phí thực tế. Máy tính token của chúng tôi giúp ước tính chính xác dựa trên thông số cụ thể của bạn.

Question 5

Prompt caching giúp giảm chi phí AI như thế nào?

Accepted Answer

Prompt caching lưu trữ các vector key-value của phần prompt lặp lại (như system prompt) để không phải tính toán lại mỗi yêu cầu. Token đã cache được tính phí chỉ bằng 10-50% giá thông thường, tùy nhà cung cấp. Đối với ứng dụng gửi cùng system prompt mỗi lần -- chatbot, trợ lý lập trình, xử lý tài liệu -- prompt caching có thể giảm tổng chi phí đầu vào lên tới 90%. OpenAI áp dụng prompt caching tự động, Anthropic và Google yêu cầu cấu hình rõ ràng.

Question 6

Token và từ (word) khác nhau như thế nào?

Accepted Answer

Từ (word) là đơn vị ngôn ngữ phân tách bằng dấu cách. Token là đơn vị do tokenizer của mô hình định nghĩa -- có thể là một từ nguyên vẹn, một phần của từ, một ký tự đơn, hoặc dấu câu. Các từ phổ biến như "the" hay "is" thường là 1 token. Từ dài hoặc ít phổ biến bị tách thành nhiều token: "unbelievable" có thể thành "un", "believ", "able" (3 token). Với tiếng Việt, do dấu thanh (sắc, huyền, hỏi, ngã, nặng) và ký tự đặc biệt, mỗi từ thường tốn nhiều token hơn tiếng Anh. Đây là lý do giá theo token không ánh xạ trực tiếp với số từ.

Question 7

Hình ảnh và file có tiêu tốn token trong mô hình AI đa phương tiện không?

Accepted Answer

Có. Khi sử dụng mô hình hỗ trợ hình ảnh như GPT-4o hoặc Gemini, hình ảnh được chuyển đổi thành token dựa trên độ phân giải. Một hình ảnh 1024x1024 tiêu thụ khoảng 765 token với GPT-4o. Hình ảnh độ phân giải cao hơn sử dụng nhiều token hơn, và chế độ "high detail" tốn nhiều hơn đáng kể so với "low detail". File PDF và tài liệu khác thường được chuyển đổi thành văn bản trước, sau đó được tokenize bình thường.

Question 8

Giá API AI có giống nhau ở Việt Nam so với các nước khác không?

Accepted Answer

Có, giá API từ OpenAI, Anthropic và Google được tính bằng USD và áp dụng đồng nhất trên toàn cầu. Không có chênh lệch giá theo khu vực. Tuy nhiên, khi quy đổi sang VND, tỷ giá USD/VND ảnh hưởng đến chi phí thực tế. Với tỷ giá dao động quanh 25.600 VND/USD, developer và doanh nghiệp Việt Nam cần tính thêm yếu tố biến động tỷ giá khi lập kế hoạch ngân sách dài hạn. Ngoài ra, do tiếng Việt tiêu thụ nhiều token hơn tiếng Anh, chi phí xử lý nội dung tiếng Việt cao hơn so với nội dung tiếng Anh cùng độ dài.

Máy tính token

$0.01

$1.05

$31.50

$383.25

Ước tính token từ văn bản

Máy tính token. Đếm token AI và ước tính chi phí API cho các mô hình LLM.

Máy Tính Token AI Là Gì?

Cách Tính Chi Phí Token AI

Công Thức Tính Chi Phí Token AI

Ví Dụ Tính Chi Phí Token AI

Chatbot chăm sóc khách hàng cho sàn thương mại điện tử: 50.000 cuộc hội thoại/tháng

Hệ thống tóm tắt tin tức tự động: 1.000 bài viết mỗi ngày

Trợ lý lập trình AI cho đội ngũ 20 developer

Mẹo Giảm Chi Phí Token AI Hiệu Quả

Câu Hỏi Thường Gặp Về Token AI Và Chi Phí API

Tiếng Việt tốn bao nhiêu token so với tiếng Anh?

Tại sao token đầu ra đắt hơn token đầu vào?

Mô hình AI nào rẻ nhất để dùng API năm 2026?

Chi phí dùng API AI hàng tháng cho startup Việt Nam là bao nhiêu?

Prompt caching giúp giảm chi phí AI như thế nào?

Token và từ (word) khác nhau như thế nào?

Hình ảnh và file có tiêu tốn token trong mô hình AI đa phương tiện không?

Giá API AI có giống nhau ở Việt Nam so với các nước khác không?

Thuật Ngữ Quan Trọng

Token

Tokenizer

BPE (Byte Pair Encoding)

Cửa sổ ngữ cảnh (Context Window)

Prompt Caching

Token đầu vào và đầu ra

Chi phí trên triệu token

Nguồn tham khảo