Jika anda seorang developer atau usahawan Malaysia yang sedang menilai model AI untuk projek anda, satu soalan paling penting adalah: berapa kosnya?
Pendedahan: Artikel ini mengandungi pautan affiliate. Jika anda mendaftar melalui pautan kami, kami mungkin menerima komisyen kecil — tanpa sebarang kos tambahan kepada anda. Ini membantu kami terus menghasilkan panduan percuma dalam Bahasa Melayu.
📖 Baca juga: Cara Guna Gemini Advanced: Panduan Google AI Ultra Malaysia 2025
📖 Baca juga: Cara Guna Cursor AI — Editor Kod Pintar untuk Developer 2026
📖 Baca juga: Gemini Personal Intelligence: Google AI yang Kenal Anda Secara Peribadi [2026]
📖 Baca juga: Cara Guna Gemini Live: Bercakap dengan AI Masa Nyata [2026]
📖 Baca juga: Cara Guna Claude API untuk Developer Malaysia — Panduan 2026
Google Gemini mempunyai antara harga API paling kompetitif dalam industri AI — bermula dari hampir percuma untuk projek kecil hingga harga enterprise untuk model terkuat mereka.
Tapi landskap ini berubah pantas. Mac 2026 membawa perubahan besar: Gemini 2.0 Pro Preview dilancarkan, Gemini 2.0 Flash-Lite didepresi (akan ditutup Jun 2026), dan Gemini 2.5 Flash-Lite kini menjadi pilihan paling murah untuk produksi.
Panduan ini mengupas semua harga terkini, menjelaskan mana model sesuai untuk kes penggunaan anda, dan mengira kos sebenar dalam Ringgit Malaysia.
Ringkasan Harga API Gemini (Mac 2026)
| Model | Input (per 1M token) | Output (per 1M token) | Harga dalam RM |
|-------|---------------------|----------------------|----------------|
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | ~RM0.47 / ~RM1.88 |
| Gemini 2.0 Flash | $0.10 | $0.40 | ~RM0.47 / ~RM1.88 |
| Gemini 2.5 Flash | $0.30 | $2.50 | ~RM1.41 / ~RM11.75 |
| Gemini 2.5 Pro | $1.25 | $10.00 | ~RM5.88 / ~RM47.00 |
| Gemini 2.0 Pro Preview | $2.00 | $8.00 | ~RM9.40 / ~RM37.60 |
Kadar penukaran: USD$1 ≈ RM4.70 (Mac 2026)
Tier percuma tersedia untuk semua model melalui Google AI Studio — sesuai untuk pembangunan dan ujian.
Perkembangan Terbesar Mac 2026: Apa Yang Berubah?
1. Gemini 2.0 Pro Preview Dilancarkan
Google melancarkan Gemini 2.0 Pro Preview pada Mac 2026 — menggantikan Gemini 3 Pro Preview yang telah ditutup pada 9 Mac 2026.
Model ini adalah:
- Model paling canggih Google setakat ini
- Cemerlang dalam penaakulan kompleks, pengekodan, dan matematik
- Menyokong window konteks 1 juta token (konteks ultra-panjang)
- Mempunyai "thinking budgets" — kawalan berapa banyak pemikiran mendalam yang dilakukan
Harga: $2.00/1M token input ($4.00 untuk prompt melebihi 200k token) — lebih murah daripada Gemini 3 Pro sebelumnya.
2. Gemini 2.0 Flash-Lite Akan Ditutup
⚠️ Amaran penting untuk developer: Gemini 2.0 Flash-Lite akan ditutup pada 1 Jun 2026.
Jika anda menggunakan model ini dalam aplikasi produksi, anda perlu migrasi ke Gemini 2.5 Flash-Lite sebelum tarikh tersebut. Harga 2.5 Flash-Lite sedikit lebih tinggi ($0.10 berbanding $0.075) tetapi prestasi lebih baik.
3. Gemini 2.5 Flash-Lite Kini Pilihan Paling Murah
Gemini 2.5 Flash-Lite kini adalah model produksi termurah Google — direka khusus untuk:
- Penggunaan berskala tinggi (high throughput)
- Kos paling rendah
- Kualiti masih lebih baik daripada 2.0 Flash-Lite
Panduan Pilih Model: Mana Yang Sesuai Untuk Anda?
Untuk Developer Indie dan Startup Malaysia
Pilihan terbaik: Gemini 2.5 Flash-Lite
Pada $0.10/1M token input (RM0.47), ini adalah model terbaik untuk:
- Chatbot pelanggan dengan trafik sederhana
- Analisis dokumen berskala kecil
- Aplikasi penjanaan kandungan
Kiraan kos sebenar:
- 1 juta token ≈ kira-kira 750,000 patah perkataan
- Chatbot biasa mungkin menggunakan 500-2,000 token per perbualan
- Dengan 10,000 perbualan sebulan: ~5-20 juta token = RM2.35 - RM9.40 sebulan
Untuk startup Malaysia dengan bajet ketat, ini adalah titik masuk yang sangat berpatutan.
Untuk Syarikat SME dan Aplikasi Produksi
Pilihan terbaik: Gemini 2.5 Flash
Pada $0.30/1M token input (RM1.41), Gemini 2.5 Flash menawarkan:
- Kualiti lebih tinggi untuk tugasan kompleks
- Keupayaan penaakulan yang lebih baik
- Sesuai untuk analisis dokumen panjang, penulisan profesional, dan sokongan pelanggan bertahap tinggi
- Konteks 1 juta token
Perbandingan dengan pesaing:
- GPT-4o mini: ~$0.15/1M input ($0.60/1M output)
- Claude 3.5 Haiku: $0.80/1M input ($4.00/1M output)
- Gemini 2.5 Flash lebih murah daripada kebanyakan pesaing setaraf
Untuk Enterprise dan Projek AI Kritikal
Pilihan terbaik: Gemini 2.5 Pro atau Gemini 2.0 Pro Preview
Gemini 2.5 Pro ($1.25/1M) adalah model "production-ready" terkuat Google:
- Prestasi terbaik dalam benchmark pengekodan
- Sesuai untuk analisis data kompleks, penyelidikan, dan penjanaan dokumen panjang
Gemini 2.0 Pro Preview ($2.00/1M) adalah model terbaru dan terkuat tapi masih dalam "Preview" — bermakna tidak disyorkan untuk aplikasi kritikal yang memerlukan kestabilan tinggi.
Tier Percuma Google AI Studio — Hadiah Untuk Developer Malaysia
Untuk developer yang baru bermula, Google AI Studio menawarkan tier percuma yang sangat pemurah:
| Model | Kadar Permintaan Percuma | Had Harian |
|-------|--------------------------|------------|
| Gemini 2.5 Flash-Lite | 30 RPM (requests/minute) | 1,500 RPD |
| Gemini 2.5 Flash | 10 RPM | 500 RPD |
| Gemini 2.5 Pro | 5 RPM | 25 RPD |
| Gemini 2.0 Pro Preview | Tidak tersedia | - |
RPM = requests per minute, RPD = requests per day
Untuk projek peribadi, pembelajaran, atau prototaip, tier percuma ini adalah lebih daripada mencukupi. Anda tidak perlu masukkan kad kredit untuk bermula.
Cara Mulakan: Tutorial Ringkas API Gemini Untuk Developer Malaysia
Langkah 1: Dapatkan API Key
- Pergi ke aistudio.google.com
- Log masuk dengan akaun Google
- Klik "Get API Key" → Create API Key
- Salin key anda (simpan dengan selamat — jangan commit ke GitHub!)
Langkah 2: Pasang SDK
Python:
pip install google-generativeaiNode.js:
npm install @google/generative-aiLangkah 3: Panggilan API Pertama
Python (Gemini 2.5 Flash-Lite):
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-2.5-flash-lite")
response = model.generate_content("Ringkaskan artikel ini dalam BM: [teks artikel]")
print(response.text)
Node.js:
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genai = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genai.getGenerativeModel({ model: "gemini-2.5-flash-lite" });
const result = await model.generateContent("Tulis email profesional dalam BM untuk...");
console.log(result.response.text());
Langkah 4: Pantau Penggunaan
Log masuk ke console.cloud.google.com → APIs & Services → Gemini API untuk melihat:
- Bilangan token digunakan
- Anggaran kos
- Tetapkan alertan bajet (sangat disyorkan!)
Perbandingan Gemini vs Pesaing: Nilai Terbaik 2026
Untuk Kos Paling Rendah
| Model | Input/1M | Output/1M | Nota |
|-------|----------|-----------|------|
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | Pilihan terbaik produksi |
| DeepSeek V3 | $0.14 | $0.28 | Murah tapi US data residency |
| GPT-4o mini | $0.15 | $0.60 | OpenAI ekosistem |
| Claude 3.5 Haiku | $0.80 | $4.00 | Lebih mahal |
Gemini 2.5 Flash-Lite menang dari segi kos mutlak untuk kebanyakan kes penggunaan.
Untuk Prestasi Terbaik
| Model | Input/1M | Kekuatan |
|-------|----------|----------|
| Gemini 2.0 Pro Preview | $2.00 | Terbaru, penaakulan terbaik Google |
| Gemini 2.5 Pro | $1.25 | Stabil, pengekodan cemerlang |
| Claude 3.7 Sonnet | $3.00 | Penulisan + analisis terbaik |
| GPT-4o | $2.50 | Nama paling dikenali |
| o3-mini | $1.10 (input) | Matematik + sains |
Untuk developer Malaysia yang ingin kualiti tinggi dengan kos berpatutan: Gemini 2.5 Pro pada RM5.88/1M token adalah nilai terbaik dalam kelasnya.
Kes Penggunaan Praktikal: Kiraan Kos Untuk Bisnes Malaysia
1. Chatbot Sokongan Pelanggan E-Dagang
Senario: 5,000 perbualan sehari, purata 800 token per perbualan
- Penggunaan bulanan: 5,000 × 800 × 30 = 120 juta token input
- Model: Gemini 2.5 Flash-Lite ($0.10/1M)
- Kos bulanan: $12 = RM56.40
Bandingkan dengan gaji seorang agen sokongan pelanggan: RM1,500-2,500/bulan. ROI yang jelas.
2. Alat Jana Kandungan Pemasaran
Senario: Jana 200 artikel/bulan, purata 2,000 token output setiap satu
- Output: 200 × 2,000 = 400,000 token output
- Input (prompt + konteks): ~200,000 token
- Model: Gemini 2.5 Flash ($0.30 input, $2.50 output)
- Kos bulanan: ($0.06 + $1.00) = $1.06 = RM4.98
Untuk agensi kandungan, ini adalah kos hampir sifar.
3. Sistem Analisis Dokumen Korporat
Senario: Analisis 500 dokumen PDF (purata 10,000 token) sebulan
- Input: 500 × 10,000 = 5 juta token
- Output: 500 × 500 = 250,000 token ringkasan
- Model: Gemini 2.5 Pro ($1.25 input, $10 output)
- Kos bulanan: ($6.25 + $2.50) = $8.75 = RM41.13
Untuk syarikat yang biasanya bayar pekerja untuk baca dan ringkaskan dokumen, penjimatan puluhan ribu ringgit setahun.
Soalan Lazim (FAQ)
Adakah API Gemini percuma?
Ya! Semua model utama Gemini ada tier percuma melalui Google AI Studio. Kadar adalah terhad (contoh: 30 permintaan/minit untuk Flash-Lite) tapi lebih dari cukup untuk pembangunan dan projek kecil. Tier berbayar dimulakan apabila anda melebihi had ini.
Apa itu "token" dalam konteks API AI?
Token adalah unit teks yang diproses oleh model AI. Secara kasar:
- 1 token ≈ 0.75 patah perkataan (dalam Bahasa Inggeris)
- 1 token ≈ 0.5-0.6 patah perkataan (dalam BM — lebih banyak token kerana BM menggunakan perkataan lebih panjang)
- 1,000 token ≈ 750 patah perkataan Inggeris atau 600 patah perkataan BM
Apakah perbezaan Gemini 2.5 Flash vs 2.5 Flash-Lite?
| Aspek | Gemini 2.5 Flash | Gemini 2.5 Flash-Lite |
|-------|-----------------|----------------------|
| Harga | $0.30/1M input | $0.10/1M input |
| Kualiti | Lebih tinggi | Baik |
| Kelajuan | Pantas | Lebih pantas |
| Sesuai untuk | Aplikasi produksi umum | Skala besar, kos kritikal |
Jika kos adalah keutamaan dan tugasan anda tidak memerlukan penaakulan mendalam, pilih Flash-Lite. Jika kualiti output penting, pilih Flash.
Adakah perlu migrate dari Gemini 2.0 Flash-Lite sekarang?
Ya, segera. Gemini 2.0 Flash-Lite akan ditutup pada 1 Jun 2026. Jika aplikasi anda menggunakan model ini, tukar ke gemini-2.5-flash-lite dalam kod anda — hanya satu perubahan ID model. Harga sedikit lebih tinggi ($0.075 → $0.10) tapi prestasi lebih baik.
Apakah Batch API dan bolehkah jimat wang?
Ya! Google menawarkan Batch API dengan diskaun 50% untuk semua model Gemini (tier berbayar). Ini bermakna jika anda tidak perlukan respons segera (contoh: proses dokumen dalam latar belakang), anda boleh hantar dalam kelompok dan bayar separuh harga.
Untuk analisis 500 dokumen dari contoh di atas: kos turun dari RM41.13 ke RM20.57 sebulan menggunakan Batch API.
Boleh guna API Gemini dalam BM (Bahasa Malaysia)?
Ya! Semua model Gemini menyokong BM dengan kualiti yang sangat baik. Walau bagaimanapun, perlu diingat:
- Teks BM menggunakan lebih banyak token berbanding Inggeris (kira-kira 1.3-1.5x lebih banyak)
- Kos sebenar untuk teks BM sedikit lebih tinggi dari anggaran asas
Penutup: Mana Yang Patut Dipilih?
Rumusan mudah untuk developer Malaysia:
| Situasi | Model Pilihan | Kos Anggaran |
|---------|---------------|-------------|
| Baru belajar / prototaip | Gemini 2.5 Flash-Lite (percuma) | RM0 |
| Startup / projek kecil | Gemini 2.5 Flash-Lite | RM0.47/1M token |
| Aplikasi produksi sederhana | Gemini 2.5 Flash | RM1.41/1M token |
| Enterprise / kualiti tinggi | Gemini 2.5 Pro | RM5.88/1M token |
| R&D / model terbaru | Gemini 2.0 Pro Preview | RM9.40/1M token |
Untuk majoriti projek Malaysia — terutama chatbot, analisis dokumen, dan jana kandungan — Gemini 2.5 Flash-Lite atau Gemini 2.5 Flash adalah titik mula terbaik.
Kos API AI kini bukan lagi penghalang. RM5 sebulan boleh janakan ribuan respons berkualiti tinggi.
Sumber:
- Google AI for Developers — Gemini API Pricing
- Google Cloud Vertex AI Pricing
- PricePerToken.com — Gemini 2.5 Flash-Lite
🔤 Rekomendasi: Grammarly
Sebelum hantar apa-apa tulisan dalam Bahasa Inggeris — semak dulu dengan Grammarly. Pelan percuma dah cukup untuk kegunaan harian. Premium (RM35/bulan) tambah cadangan gaya penulisan + penjana ayat AI.
Rujukan
- MDEC — Malaysia Digital Economy Corporation
- MIMOS — Institut Penyelidikan Teknologi Malaysia
- Digital Nasional Berhad — 5G Malaysia
Artikel Berkaitan
- Microsoft 365 Copilot Wave 3: AI Agentic Kini Dalam Excel, Word & Teams
- 100 App AI Paling Popular Dunia 2026 — Mana Yang Penting untuk Malaysia?
- Claude AI Masuk Pejabat Malaysia: Anthropic Labur RM470 Juta
- NVIDIA Vera Rubin NVL72: 5x Lebih Laju, 10x Lebih Murah Dari Blackwell
- Perang AI 2026: ChatGPT vs Gemini vs Claude vs Grok
- FDA Tukar AI ELSA Dari Claude ke Gemini — Bukan Soal Teknologi
