Question 1

ภาษาไทยใช้ token มากกว่าภาษาอังกฤษกี่เท่า?

Accepted Answer

ภาษาไทยใช้ token มากกว่าภาษาอังกฤษประมาณ 2-4 เท่า สำหรับข้อความที่มีความหมายเดียวกัน สาเหตุหลักคือ BPE tokenizer ของ LLM ส่วนใหญ่ถูกฝึกจากข้อมูลภาษาอังกฤษเป็นหลัก ทำให้คำภาษาอังกฤษถูกบีบอัดเป็น 1-2 token ได้อย่างมีประสิทธิภาพ แต่ตัวอักษรไทยซึ่งใช้ UTF-8 encoding 3 byte ต่อตัวอักษร กลับถูกแบ่งเป็น 1 token ต่อ 1 ตัวอักษร (ในกรณี OpenAI) ตัวอย่างเช่น คำว่า "สวัสดี" ใช้ 6 token แต่ "Hello" ใช้เพียง 1 token ซึ่งหมายความว่าค่า API ภาษาไทยแพงกว่าภาษาอังกฤษตามสัดส่วนเดียวกัน

Question 2

Token คืออะไรใน AI ต่างจากคำ (word) อย่างไร?

Accepted Answer

Token คือหน่วยย่อยที่ AI ใช้ประมวลผลข้อความ ซึ่งไม่เหมือนกับ "คำ" ในภาษาปกติ token อาจเป็นคำทั้งคำ ส่วนหนึ่งของคำ ตัวอักษรเดียว หรือเครื่องหมายวรรคตอน คำที่พบบ่อยอย่าง "the" หรือ "is" มักเป็น 1 token แต่คำยาวหรือไม่ค่อยพบจะถูกแบ่งเป็นหลาย token เช่น "unbelievable" อาจถูกแบ่งเป็น "un", "believ", "able" (3 token) สำหรับภาษาไทยที่ไม่มีช่องว่างระหว่างคำ tokenizer จะแบ่งตามตัวอักษรหรือกลุ่มตัวอักษรแทน ทำให้ 1 คำภาษาไทยอาจใช้ 3-8 token

Question 3

โมเดล AI ที่ถูกที่สุดสำหรับใช้งาน API ในปี 2026 คือตัวไหน?

Accepted Answer

ในเดือนมีนาคม 2026 โมเดลที่ถูกที่สุดเรียงตามราคา (input/output ต่อ 1M token) คือ Amazon Nova Micro ($0.035/$0.14), GPT-5 Nano ($0.05/$0.40), Gemini 2.0 Flash-Lite ($0.075/$0.30), Mistral Small ($0.10/$0.30), GPT-4.1 Nano ($0.10/$0.40), Llama 4 Scout ผ่าน Groq ($0.11/$0.34), Grok 4.1 Fast ($0.20/$0.50) และ DeepSeek V3.2 ($0.28/$0.42) สำหรับงานระดับกลาง มี Gemini 2.5 Flash ($0.30/$2.50), GPT-4.1 Mini ($0.40/$1.60), Claude Haiku 4.5 ($1/$5) และ o4-mini ($1.10/$4.40) ระดับพรีเมียม ได้แก่ Gemini 2.5 Pro ($1.25/$10), GPT-5 ($1.25/$10), GPT-4.1 ($2/$8), Claude Sonnet 4.6 ($3/$15) และ Claude Opus 4.6 ($5/$25)

Question 4

ChatGPT API ราคาเท่าไหร่ คิดเงินยังไง?

Accepted Answer

ChatGPT API คิดค่าบริการแบบ pay-per-use ตามจำนวน token ที่ใช้ ไม่ใช่ค่ารายเดือนแบบ ChatGPT Plus (699 บาท/เดือน) ราคาแยกตามโมเดล เช่น GPT-4.1 mini คิด $0.40 ต่อ 1M input token และ $1.60 ต่อ 1M output token ส่วน GPT-4.1 คิด $2/$8 ต่อ 1M token ในทางปฏิบัติ หากส่งข้อความภาษาไทย 500 ตัวอักษรและรับคำตอบ 300 token ด้วย GPT-4.1 mini จะมีค่าใช้จ่ายประมาณ $0.00068 (0.024 บาท) ต่อคำขอ ซึ่งหมายความว่า งบ 350 บาท (10 ดอลลาร์) สามารถเรียก API ได้ราว 14,700 ครั้ง

Question 5

Prompt caching คืออะไร ช่วยลดค่าใช้จ่ายได้อย่างไร?

Accepted Answer

Prompt caching คือเทคโนโลยีที่เก็บ key-value vectors ของส่วน prompt ที่ถูกส่งซ้ำ (เช่น system prompt) ไว้ในหน่วยความจำ เพื่อไม่ต้องคำนวณใหม่ทุกครั้ง token ที่ cache แล้วจะถูกคิดเพียง 10-50% ของราคาปกติ ขึ้นอยู่กับผู้ให้บริการ สำหรับแอปพลิเคชันที่ส่ง system prompt เดิมกับทุกคำขอ เช่น แชทบอท ผู้ช่วยเขียนโค้ด หรือ RAG pipeline prompt caching สามารถลดค่า input ได้สูงสุด 90% OpenAI เปิด cache อัตโนมัติ ส่วน Anthropic และ Google ต้องตั้งค่าเอง

Question 6

ข้อความภาษาไทย 1,000 ตัวอักษรใช้กี่ token?

Accepted Answer

สำหรับ OpenAI (GPT series) ข้อความภาษาไทย 1,000 ตัวอักษรใช้ประมาณ 800-1,200 token ขึ้นอยู่กับเนื้อหา ข้อความที่มีสระ วรรณยุกต์ และตัวเลขผสมจะใช้ token มากกว่าข้อความพยัญชนะล้วน สำหรับ Gemini บน Vertex AI ที่คิดตามตัวอักษร 1,000 ตัวอักษรไทยจะถูกนับเป็น 1,000 characters เท่ากับภาษาอังกฤษ ซึ่งประหยัดกว่ามาก เปรียบเทียบกัน: ข้อความภาษาอังกฤษ 1,000 ตัวอักษรใช้เพียง 250-333 token (OpenAI) ดังนั้นภาษาไทยจึงใช้ token มากกว่า 3-4 เท่า

Question 7

เปรียบเทียบ Claude API กับ GPT API อันไหนคุ้มกว่า?

Accepted Answer

ขึ้นอยู่กับงานและปริมาณการใช้ สำหรับงานทั่วไปปริมาณมาก GPT-4.1 mini ($0.40/$1.60) ถูกกว่า Claude Haiku 4.5 ($1/$5) ประมาณ 2.5 เท่า สำหรับงานคุณภาพสูง Claude Sonnet 4.6 ($3/$15) และ GPT-5.4 ($2.50/$15) มีราคาใกล้เคียงกัน แต่ Claude โดดเด่นด้านการเขียนโค้ดและเข้าใจบริบทยาว ส่วน GPT-4.1 ($2/$8) มี context window 1 ล้าน token เหมาะกับ codebase ขนาดใหญ่ สำหรับนักพัฒนาไทย แนะนำเริ่มจากโมเดลถูก (GPT-4.1 mini หรือ Gemini 2.5 Flash) ทดสอบคุณภาพก่อน แล้วค่อยเลื่อนขึ้นมาใช้โมเดลพรีเมียมเฉพาะงานที่ต้องการ

Question 8

รูปภาพและไฟล์ใช้ token อย่างไรในโมเดล AI แบบ multimodal?

Accepted Answer

รูปภาพจะถูกแปลงเป็น token ตามความละเอียด สำหรับ GPT-4o รูปขนาด 1024x1024 พิกเซลใช้ประมาณ 765 token คำนวณจากการแบ่งรูปเป็น tile ขนาด 512x512 (170 token ต่อ tile) บวกค่าฐาน 85 token รูปที่ละเอียดสูงกว่าจะใช้ token มากขึ้น โหมด "high detail" แพงกว่า "low detail" อย่างมาก PDF และเอกสารอื่นจะถูกแปลงเป็นข้อความก่อนแล้วค่อยนับ token ตามปกติ แอปพลิเคชันที่รับรูปภาพจำนวนมากควรประมาณค่า token ของรูปภาพเป็นพิเศษ

คำนวณ Token AI

$0.01

$1.05

$31.50

$383.25

ประมาณ Token จากข้อความ