Harga API Gemini 2026: Dari RM0.35 Hingga RM9/Juta Token

Q: Adakah API Gemini percuma?

Ya! Semua model utama Gemini ada tier percuma melalui Google AI Studio. Kadar adalah terhad (contoh: 30 permintaan/minit untuk Flash-Lite) tapi lebih dari cukup untuk pembangunan dan projek kecil. Tier berbayar dimulakan apabila anda melebihi had ini.

Q: Adakah perlu migrate dari Gemini 2.0 Flash-Lite sekarang? Ya, segera. Gemini 2.0 Flash-Lite akan ditutup pada 1 Jun 2026. Jika aplikasi anda menggunakan model ini, tukar ke gemini-2.5-flash-lite dalam kod anda — hanya satu perubahan ID model. Harga sedikit lebih tinggi ($0.075 → $0.10) tapi prestasi lebih baik. Apakah Batch API dan bolehkah jimat wang?

Ya! Google menawarkan Batch API dengan diskaun 50% untuk semua model Gemini (tier berbayar). Ini bermakna jika anda tidak perlukan respons segera (contoh: proses dokumen dalam latar belakang), anda boleh hantar dalam kelompok dan bayar separuh harga.

⚠️ Pendedahan Afiliasi: Artikel ini mungkin mengandungi pautan afiliasi. Kami mungkin mendapat komisyen kecil jika anda membeli melalui pautan kami, tanpa kos tambahan kepada anda. Ini membantu kami terus menyediakan kandungan percuma berkualiti.

Jika anda seorang developer atau usahawan Malaysia yang sedang menilai model AI untuk projek anda, satu soalan paling penting adalah: berapa kosnya?

Pendedahan: Artikel ini mengandungi pautan affiliate. Jika anda mendaftar melalui pautan kami, kami mungkin menerima komisyen kecil — tanpa sebarang kos tambahan kepada anda. Ini membantu kami terus menghasilkan panduan percuma dalam Bahasa Melayu.
📖 Baca juga: Cara Guna Gemini Advanced: Panduan Google AI Ultra Malaysia 2025
📖 Baca juga: Cara Guna Cursor AI — Editor Kod Pintar untuk Developer 2026
📖 Baca juga: Gemini Personal Intelligence: Google AI yang Kenal Anda Secara Peribadi [2026]
📖 Baca juga: Cara Guna Gemini Live: Bercakap dengan AI Masa Nyata [2026]
📖 Baca juga: Cara Guna Claude API untuk Developer Malaysia — Panduan 2026

Google Gemini mempunyai antara harga API paling kompetitif dalam industri AI — bermula dari hampir percuma untuk projek kecil hingga harga enterprise untuk model terkuat mereka.

Tapi landskap ini berubah pantas. Mac 2026 membawa perubahan besar: Gemini 2.0 Pro Preview dilancarkan, Gemini 2.0 Flash-Lite didepresi (akan ditutup Jun 2026), dan Gemini 2.5 Flash-Lite kini menjadi pilihan paling murah untuk produksi.

Panduan ini mengupas semua harga terkini, menjelaskan mana model sesuai untuk kes penggunaan anda, dan mengira kos sebenar dalam Ringgit Malaysia.

Isi Kandungan

Ringkasan Harga API Gemini (Mac 2026)

|-------|---------------------|----------------------|----------------|

| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | ~RM0.47 / ~RM1.88 |

| Gemini 2.0 Flash | $0.10 | $0.40 | ~RM0.47 / ~RM1.88 |

| Gemini 2.5 Flash | $0.30 | $2.50 | ~RM1.41 / ~RM11.75 |

| Gemini 2.5 Pro | $1.25 | $10.00 | ~RM5.88 / ~RM47.00 |

| Gemini 2.0 Pro Preview | $2.00 | $8.00 | ~RM9.40 / ~RM37.60 |

Kadar penukaran: USD$1 ≈ RM4.70 (Mac 2026)

Tier percuma tersedia untuk semua model melalui Google AI Studio — sesuai untuk pembangunan dan ujian.

Perkembangan Terbesar Mac 2026: Apa Yang Berubah?

1. Gemini 2.0 Pro Preview Dilancarkan

Google melancarkan Gemini 2.0 Pro Preview pada Mac 2026 — menggantikan Gemini 3 Pro Preview yang telah ditutup pada 9 Mac 2026.

Model ini adalah:

Model paling canggih Google setakat ini
Cemerlang dalam penaakulan kompleks, pengekodan, dan matematik
Menyokong window konteks 1 juta token (konteks ultra-panjang)
Mempunyai "thinking budgets" — kawalan berapa banyak pemikiran mendalam yang dilakukan

Harga: $2.00/1M token input ($4.00 untuk prompt melebihi 200k token) — lebih murah daripada Gemini 3 Pro sebelumnya.

2. Gemini 2.0 Flash-Lite Akan Ditutup

⚠️ Amaran penting untuk developer: Gemini 2.0 Flash-Lite akan ditutup pada 1 Jun 2026.

Jika anda menggunakan model ini dalam aplikasi produksi, anda perlu migrasi ke Gemini 2.5 Flash-Lite sebelum tarikh tersebut. Harga 2.5 Flash-Lite sedikit lebih tinggi ($0.10 berbanding $0.075) tetapi prestasi lebih baik.

3. Gemini 2.5 Flash-Lite Kini Pilihan Paling Murah

Gemini 2.5 Flash-Lite kini adalah model produksi termurah Google — direka khusus untuk:

Penggunaan berskala tinggi (high throughput)
Kos paling rendah
Kualiti masih lebih baik daripada 2.0 Flash-Lite

Panduan Pilih Model: Mana Yang Sesuai Untuk Anda?

Untuk Developer Indie dan Startup Malaysia

Pilihan terbaik: Gemini 2.5 Flash-Lite

Pada $0.10/1M token input (RM0.47), ini adalah model terbaik untuk:

Chatbot pelanggan dengan trafik sederhana
Analisis dokumen berskala kecil
Aplikasi penjanaan kandungan

Kiraan kos sebenar:

1 juta token ≈ kira-kira 750,000 patah perkataan
Chatbot biasa mungkin menggunakan 500-2,000 token per perbualan
Dengan 10,000 perbualan sebulan: ~5-20 juta token = RM2.35 - RM9.40 sebulan

Untuk startup Malaysia dengan bajet ketat, ini adalah titik masuk yang sangat berpatutan.

Untuk Syarikat SME dan Aplikasi Produksi

Pilihan terbaik: Gemini 2.5 Flash

Pada $0.30/1M token input (RM1.41), Gemini 2.5 Flash menawarkan:

Kualiti lebih tinggi untuk tugasan kompleks
Keupayaan penaakulan yang lebih baik
Sesuai untuk analisis dokumen panjang, penulisan profesional, dan sokongan pelanggan bertahap tinggi
Konteks 1 juta token

Perbandingan dengan pesaing:

GPT-4o mini: ~$0.15/1M input ($0.60/1M output)
Claude 3.5 Haiku: $0.80/1M input ($4.00/1M output)
Gemini 2.5 Flash lebih murah daripada kebanyakan pesaing setaraf

Untuk Enterprise dan Projek AI Kritikal

Pilihan terbaik: Gemini 2.5 Pro atau Gemini 2.0 Pro Preview

Gemini 2.5 Pro ($1.25/1M) adalah model "production-ready" terkuat Google:

Prestasi terbaik dalam benchmark pengekodan
Sesuai untuk analisis data kompleks, penyelidikan, dan penjanaan dokumen panjang

Gemini 2.0 Pro Preview ($2.00/1M) adalah model terbaru dan terkuat tapi masih dalam "Preview" — bermakna tidak disyorkan untuk aplikasi kritikal yang memerlukan kestabilan tinggi.

Tier Percuma Google AI Studio — Hadiah Untuk Developer Malaysia

Untuk developer yang baru bermula, Google AI Studio menawarkan tier percuma yang sangat pemurah:

| Model | Kadar Permintaan Percuma | Had Harian |

|-------|--------------------------|------------|

| Gemini 2.5 Flash-Lite | 30 RPM (requests/minute) | 1,500 RPD |

| Gemini 2.5 Flash | 10 RPM | 500 RPD |

| Gemini 2.5 Pro | 5 RPM | 25 RPD |

| Gemini 2.0 Pro Preview | Tidak tersedia | - |

RPM = requests per minute, RPD = requests per day

Untuk projek peribadi, pembelajaran, atau prototaip, tier percuma ini adalah lebih daripada mencukupi. Anda tidak perlu masukkan kad kredit untuk bermula.

Cara Mulakan: Tutorial Ringkas API Gemini Untuk Developer Malaysia

Langkah 1: Dapatkan API Key

Pergi ke aistudio.google.com
Log masuk dengan akaun Google
Klik "Get API Key" → Create API Key
Salin key anda (simpan dengan selamat — jangan commit ke GitHub!)

Langkah 2: Pasang SDK

Python:

pip install google-generativeai

Node.js:

npm install @google/generative-ai

Langkah 3: Panggilan API Pertama

Python (Gemini 2.5 Flash-Lite):

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel("gemini-2.5-flash-lite")
response = model.generate_content("Ringkaskan artikel ini dalam BM: [teks artikel]")
print(response.text)

Node.js:

const { GoogleGenerativeAI } = require("@google/generative-ai");

const genai = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genai.getGenerativeModel({ model: "gemini-2.5-flash-lite" });

const result = await model.generateContent("Tulis email profesional dalam BM untuk...");

console.log(result.response.text());

Langkah 4: Pantau Penggunaan

Log masuk ke console.cloud.google.com → APIs & Services → Gemini API untuk melihat:

Bilangan token digunakan
Anggaran kos
Tetapkan alertan bajet (sangat disyorkan!)

Perbandingan Gemini vs Pesaing: Nilai Terbaik 2026

Untuk Kos Paling Rendah

|-------|----------|-----------|------|

| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | Pilihan terbaik produksi |

| DeepSeek V3 | $0.14 | $0.28 | Murah tapi US data residency |

| GPT-4o mini | $0.15 | $0.60 | OpenAI ekosistem |

| Claude 3.5 Haiku | $0.80 | $4.00 | Lebih mahal |

Gemini 2.5 Flash-Lite menang dari segi kos mutlak untuk kebanyakan kes penggunaan.

Untuk Prestasi Terbaik

| Model | Input/1M | Kekuatan |

|-------|----------|----------|

| Gemini 2.0 Pro Preview | $2.00 | Terbaru, penaakulan terbaik Google |

| Gemini 2.5 Pro | $1.25 | Stabil, pengekodan cemerlang |

| Claude 3.7 Sonnet | $3.00 | Penulisan + analisis terbaik |

| GPT-4o | $2.50 | Nama paling dikenali |

| o3-mini | $1.10 (input) | Matematik + sains |

Untuk developer Malaysia yang ingin kualiti tinggi dengan kos berpatutan: Gemini 2.5 Pro pada RM5.88/1M token adalah nilai terbaik dalam kelasnya.

Kes Penggunaan Praktikal: Kiraan Kos Untuk Bisnes Malaysia

1. Chatbot Sokongan Pelanggan E-Dagang

Senario: 5,000 perbualan sehari, purata 800 token per perbualan

Penggunaan bulanan: 5,000 × 800 × 30 = 120 juta token input
Model: Gemini 2.5 Flash-Lite ($0.10/1M)
Kos bulanan: $12 = RM56.40

Bandingkan dengan gaji seorang agen sokongan pelanggan: RM1,500-2,500/bulan. ROI yang jelas.

2. Alat Jana Kandungan Pemasaran

Senario: Jana 200 artikel/bulan, purata 2,000 token output setiap satu

Output: 200 × 2,000 = 400,000 token output
Input (prompt + konteks): ~200,000 token
Model: Gemini 2.5 Flash ($0.30 input, $2.50 output)
Kos bulanan: ($0.06 + $1.00) = $1.06 = RM4.98

Untuk agensi kandungan, ini adalah kos hampir sifar.

3. Sistem Analisis Dokumen Korporat

Senario: Analisis 500 dokumen PDF (purata 10,000 token) sebulan

Input: 500 × 10,000 = 5 juta token
Output: 500 × 500 = 250,000 token ringkasan
Model: Gemini 2.5 Pro ($1.25 input, $10 output)
Kos bulanan: ($6.25 + $2.50) = $8.75 = RM41.13

Untuk syarikat yang biasanya bayar pekerja untuk baca dan ringkaskan dokumen, penjimatan puluhan ribu ringgit setahun.

Soalan Lazim (FAQ)

Adakah API Gemini percuma?

Ya! Semua model utama Gemini ada tier percuma melalui Google AI Studio. Kadar adalah terhad (contoh: 30 permintaan/minit untuk Flash-Lite) tapi lebih dari cukup untuk pembangunan dan projek kecil. Tier berbayar dimulakan apabila anda melebihi had ini.

Apa itu "token" dalam konteks API AI?

Token adalah unit teks yang diproses oleh model AI. Secara kasar:

1 token ≈ 0.75 patah perkataan (dalam Bahasa Inggeris)
1 token ≈ 0.5-0.6 patah perkataan (dalam BM — lebih banyak token kerana BM menggunakan perkataan lebih panjang)
1,000 token ≈ 750 patah perkataan Inggeris atau 600 patah perkataan BM

Apakah perbezaan Gemini 2.5 Flash vs 2.5 Flash-Lite?

| Aspek | Gemini 2.5 Flash | Gemini 2.5 Flash-Lite |

|-------|-----------------|----------------------|

| Harga | $0.30/1M input | $0.10/1M input |

| Kualiti | Lebih tinggi | Baik |

| Kelajuan | Pantas | Lebih pantas |

| Sesuai untuk | Aplikasi produksi umum | Skala besar, kos kritikal |

Jika kos adalah keutamaan dan tugasan anda tidak memerlukan penaakulan mendalam, pilih Flash-Lite. Jika kualiti output penting, pilih Flash.

Adakah perlu migrate dari Gemini 2.0 Flash-Lite sekarang?

Ya, segera. Gemini 2.0 Flash-Lite akan ditutup pada 1 Jun 2026. Jika aplikasi anda menggunakan model ini, tukar ke gemini-2.5-flash-lite dalam kod anda — hanya satu perubahan ID model. Harga sedikit lebih tinggi ($0.075 → $0.10) tapi prestasi lebih baik.

Apakah Batch API dan bolehkah jimat wang?

Ya! Google menawarkan Batch API dengan diskaun 50% untuk semua model Gemini (tier berbayar). Ini bermakna jika anda tidak perlukan respons segera (contoh: proses dokumen dalam latar belakang), anda boleh hantar dalam kelompok dan bayar separuh harga.

Untuk analisis 500 dokumen dari contoh di atas: kos turun dari RM41.13 ke RM20.57 sebulan menggunakan Batch API.

Boleh guna API Gemini dalam BM (Bahasa Malaysia)?

Ya! Semua model Gemini menyokong BM dengan kualiti yang sangat baik. Walau bagaimanapun, perlu diingat:

Teks BM menggunakan lebih banyak token berbanding Inggeris (kira-kira 1.3-1.5x lebih banyak)
Kos sebenar untuk teks BM sedikit lebih tinggi dari anggaran asas

Penutup: Mana Yang Patut Dipilih?

Rumusan mudah untuk developer Malaysia:

| Situasi | Model Pilihan | Kos Anggaran |

|---------|---------------|-------------|

| Baru belajar / prototaip | Gemini 2.5 Flash-Lite (percuma) | RM0 |

| Startup / projek kecil | Gemini 2.5 Flash-Lite | RM0.47/1M token |

| Aplikasi produksi sederhana | Gemini 2.5 Flash | RM1.41/1M token |

| Enterprise / kualiti tinggi | Gemini 2.5 Pro | RM5.88/1M token |

| R&D / model terbaru | Gemini 2.0 Pro Preview | RM9.40/1M token |

Untuk majoriti projek Malaysia — terutama chatbot, analisis dokumen, dan jana kandungan — Gemini 2.5 Flash-Lite atau Gemini 2.5 Flash adalah titik mula terbaik.

Kos API AI kini bukan lagi penghalang. RM5 sebulan boleh janakan ribuan respons berkualiti tinggi.

Sumber:

🔤 Rekomendasi: Grammarly

Sebelum hantar apa-apa tulisan dalam Bahasa Inggeris — semak dulu dengan Grammarly. Pelan percuma dah cukup untuk kegunaan harian. Premium (RM35/bulan) tambah cadangan gaya penulisan + penjana ayat AI.

→ Cuba Grammarly Percuma