Question 1

Berapa token yang dihasilkan daripada 1,000 perkataan teks bahasa Melayu?

Accepted Answer

Lebih kurang 1,500 hingga 2,000 token. Bahasa Melayu menghasilkan lebih banyak token berbanding bahasa Inggeris kerana struktur perkataan yang lebih panjang. Sebagai perbandingan, 1,000 perkataan Inggeris menghasilkan kira-kira 1,333 token. Perkataan pendek seperti "di" atau "dan" biasanya 1 token, manakala perkataan panjang seperti "mempertanggungjawabkan" boleh menghasilkan 3-5 token. Bilangan tepat bergantung pada tokenizer yang digunakan oleh setiap model.

Question 2

Mengapa token output lebih mahal daripada token input?

Accepted Answer

Token output berkos 3-5x lebih tinggi kerana cara LLM menjana teks. Token input diproses dalam satu forward pass melalui model, dengan semua token dikira secara selari. Token output pula mesti dijana satu per satu secara berurutan -- setiap token baharu memerlukan forward pass berasingan. Proses penjanaan berurutan ini jauh lebih intensif dari segi pengiraan dan memori. Contohnya, Claude Sonnet 4.6 mengenakan USD 3 per juta token input tetapi USD 15 per juta token output -- nisbah 5:1.

Question 3

Berapakah kos penggunaan API ChatGPT sebulan untuk startup di Malaysia?

Accepted Answer

Kos bulanan bergantung pada model dan jumlah penggunaan. Untuk projek ringan (100 permintaan/hari dengan GPT-4.1 mini), kos bulanan sekitar USD 1-5 (RM4-22). Untuk aplikasi produksi dengan GPT-4.1 (1,000 permintaan/hari), jangkakan USD 50-200/bulan (RM223-890). Untuk penggunaan intensif dengan model premium, kos boleh melebihi USD 1,000/bulan (RM4,450). Kalkulator kami membantu menganggarkan kos tepat berdasarkan parameter penggunaan anda.

Question 4

Model AI manakah yang paling murah untuk kegunaan API pada 2026?

Accepted Answer

Pada Mac 2026, pilihan API paling murah mengikut penyedia ialah: Amazon Nova Micro (USD 0.035/0.14 per 1J token), GPT-5 Nano (USD 0.05/0.40), Gemini 2.0 Flash-Lite (USD 0.075/0.30), Mistral Small (USD 0.10/0.30), GPT-4.1 Nano (USD 0.10/0.40), Llama 4 Scout melalui Groq (USD 0.11/0.34), dan DeepSeek V3.2 (USD 0.28/0.42). Untuk bajet pertengahan, pilihan kuat termasuk Gemini 2.5 Flash (USD 0.30/2.50), GPT-4.1 Mini (USD 0.40/1.60), dan Claude Haiku 4.5 (USD 1/5). Pilihan terbaik bergantung pada keperluan kualiti anda.

Question 5

Apa itu tetingkap konteks (context window) pada model AI?

Accepted Answer

Tetingkap konteks ialah bilangan maksimum token yang boleh diproses oleh model dalam satu permintaan, termasuk input dan output. GPT-4.1 menyokong sehingga 1 juta token, Claude Opus 4.6 dan Sonnet 4.6 sehingga 1 juta token, Gemini 2.5 Pro sehingga 1 juta token, Grok 4.1 Fast sehingga 2 juta token, dan DeepSeek V3.2 sehingga 128,000 token. Apabila perbualan melebihi tetingkap konteks, model kehilangan akses kepada mesej-mesej awal.

Question 6

Bagaimana prompt caching mengurangkan kos AI?

Accepted Answer

Prompt caching menyimpan vektor key-value bagi awalan prompt yang berulang (seperti prompt sistem) supaya ia tidak perlu dikira semula pada setiap permintaan. Token yang dicache dicaj pada kadar 10-50% daripada harga token input biasa. Untuk aplikasi yang menghantar prompt sistem yang sama dengan setiap permintaan -- chatbot, pembantu pengekodan, pemproses dokumen -- prompt caching boleh mengurangkan jumlah kos input sehingga 90%. OpenAI menggunakan prompt caching secara automatik, manakala Anthropic dan Google memerlukan konfigurasi yang jelas.

Question 7

Adakah harga API AI sama di Malaysia dengan negara lain?

Accepted Answer

Ya, harga API daripada OpenAI, Anthropic, Google, dan xAI ditetapkan dalam dolar AS (USD) dan dikenakan secara seragam di seluruh dunia. Tiada perbezaan harga serantau untuk API. Walau bagaimanapun, apabila menukar kepada Ringgit Malaysia, kadar pertukaran USD/MYR mempengaruhi kos efektif. Pada Mac 2026, USD 1 bersamaan lebih kurang RM4.45. Pembangun Malaysia perlu mengambil kira turun naik kadar pertukaran semasa merancang bajet jangka panjang.

Question 8

Apakah perbezaan antara token dan perkataan?

Accepted Answer

Perkataan ialah unit bahasa yang dipisahkan oleh ruang. Token ialah unit yang ditentukan oleh tokenizer model -- ia boleh berupa perkataan penuh, sebahagian perkataan, aksara tunggal, atau tanda baca. Perkataan biasa seperti 'the' atau 'is' biasanya satu token. Perkataan yang lebih panjang atau kurang biasa dipecah kepada beberapa token: 'unbelievable' mungkin menjadi 'un', 'believ', 'able' (3 token). Nombor, kod, dan teks bukan Inggeris biasanya memerlukan lebih banyak token per perkataan. Inilah sebab harga berasaskan token tidak berkadar langsung dengan bilangan perkataan.

Kalkulator token

$0.01

$1.05

$31.50

$383.25

Anggarkan token daripada teks