AI Token Maliyeti: 6 Modelden Hangisi Daha Ekonomik?
Claude Opus 4.7, GPT-5, Gemini 2.5 ve Kimi K2 token fiyatları, gerçek senaryolar ve aynı prompt'a 6 modelden örnek çıktılarla en ekonomik AI seçimi.
AI Token Maliyeti: 6 Modelin 5 Kritik Karşılaştırma Noktası
-
Etiket fiyatı yelpazesi 17 kat genişlemiş durumda — En ucuz model Gemini 2.5 Flash ($0.30/$2.50 girdi/çıktı per 1M token), en pahalı model Claude Opus 4.7 ($5.00/$25.00). Aralarda Kimi K2.5 ($0.60/$2.50), GPT-5 ($1.25/$10.00), Gemini 2.5 Pro ($1.25/$10.00) ve Sonnet 4.6 ($3.00/$15.00) var. Aynı hacim için aylık fatura modele göre 5.000 TL ile 85.000 TL arasında değişebiliyor.
-
GPT-5 fiyat-performans liderliğine geçti — OpenAI Nisan 2026 güncellemesiyle GPT-5'i $1.25/$10 fiyatla konumlandırdı; bu önceki GPT-4o'nun ($2.50/$10) yarısı. Çoğu rutin pazarlama ve SEO görevi için GPT-5, Sonnet 4.6'nın (3 kat pahalı) verdiği kalitenin %92-95'ini sunuyor — küçük kalite farkı çoğu KOBİ senaryosunda hissedilmiyor.
-
Reasoning modelleri etiket fiyatlarıyla aldatıyor — OpenAI o3 ($2.00/$8.00) etikette GPT-5'ten ucuz görünüyor ama dahili "thinking" tokenleri çıktı olarak ücretlendiriliyor; aynı problem o3'te 4-8 kat daha fazla token harcayabiliyor. Karmaşık matematik ve çok adımlı kod analizi için değer; sıradan yazım görevlerine asla yönlendirilmemeli.
-
Çinli alternatif Kimi K2 ekonomik segmenti silkeledi — Kimi K2.5 ($0.60/$2.50) yüksek hacimli rutin görevlerde GPT-5'ten 2 kat ucuz. Türkçe yazım kalitesi orta segment, ama ürün açıklaması ve sosyal medya post taslağı gibi düzenleme tolere eden işlerde Trendyol satıcılarımızda aylık 10.000+ üretim akışını sürdürüyor.
-
Hibrit yönlendirme tek modelden %40-55 ucuz çıkıyor — Aynı içerik üretim akışını Flash + Sonnet 4.6 kombinasyonuyla (taslak Flash, son rötuş Sonnet) yöneten müşterilerimiz, sadece Sonnet kullananlara göre aylık AI faturasını ortalama %48 düşürdü. Tek model düşüncesini bırakıp router katmanı kurmak, etiket fiyatından daha fazla tasarruf getiriyor.
4 AI Sağlayıcısı, 9 Model: Güncel Fiyatlandırma Yapısı
AI maliyetinin temel belirleyicisi token fiyatlandırmasıdır. 1 milyon token, ortalama 750.000 kelimeye — yaklaşık 300-400 sayfalık bir kitaba veya 250-350 orta uzunlukta blog yazısına denk gelir. Girdi tokeni (prompt) ve çıktı tokeni (yanıt) ayrı fiyatlandırılır; çıktı tokeni 4-8 kat daha pahalıdır.
Nisan 2026 itibarıyla pazarda 4 büyük sağlayıcı liderlik için yarışıyor: Anthropic (Claude ailesi — Haiku, Sonnet, Opus), OpenAI (GPT-5 + GPT-4o + reasoning modeli o3), Google (Gemini 2.5 Pro ve Flash), Moonshot AI (Kimi K2 serisi). Her sağlayıcının bir ekonomik, bir genel amaçlı ve bir premium katmanı var; ama fiyat-performans haritası birbirinden çok farklı.
Güncel Token Fiyatları (Nisan 2026)
| Model | Girdi ($/1M) | Çıktı ($/1M) | TL Girdi (1M) | TL Çıktı (1M) | Konum |
|---|---|---|---|---|---|
| Gemini 2.5 Flash | $0.30 | $2.50 | 9.6 TL | 80 TL | En ekonomik |
| Kimi K2.5 | $0.60 | $2.50 | 19 TL | 80 TL | Ekonomik |
| Claude Haiku 4.5 | $1.00 | $5.00 | 32 TL | 160 TL | Hızlı-uygun |
| GPT-5 | $1.25 | $10.00 | 40 TL | 320 TL | Genel amaçlı favori |
| Gemini 2.5 Pro | $1.25 | $10.00 | 40 TL | 320 TL | Multimodal favori |
| OpenAI o3 | $2.00 | $8.00 | 64 TL | 256 TL | Reasoning |
| GPT-4o | $2.50 | $10.00 | 80 TL | 320 TL | Eski genel |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 96 TL | 480 TL | Dengeli premium |
| Claude Opus 4.7 | $5.00 | $25.00 | 160 TL | 800 TL | Premium flagship |
TL dönüşümü 1 USD = 32 TL kuru üzerinden hesaplanmıştır (Nisan 2026 ortalaması). Tüm fiyatlar standart API çağrıları içindir; Batch API kullanımı tüm sağlayıcılarda %50 indirim sağlar, prompt önbellekleme ise tekrar eden sistem promptlarında %75-90'a varan indirim sunar.
Pratik çıkarım: Etiket fiyatına göre Gemini 2.5 Flash, Kimi'den 2 kat ucuz; Opus 4.7, Flash'tan 17 kat pahalı. Ancak gerçek toplam maliyet, çıktı kalitesinin gereken yeniden deneme sayısına göre değişiyor — uygulamada gördüğümüz: ekonomik modelin %15-20 oranında düzeltme gerektirmesi durumunda orta segment (GPT-5, Sonnet 4.6) toplam fatura açısından daha ucuz çıkıyor.
Hazır Token Maliyet Hesaplama Şablonları
Şablon 1: Aylık İçerik Üretim Maliyeti
Aşağıdaki şablonu kullanarak kendi senaryonuza göre maliyet tahmini yapabilirsiniz:
ÜRETİLECEK İÇERİK TİPİ: [Blog yazısı / Ürün açıklaması / Sosyal medya postu]
AYLIK MİKTAR: [sayı]
ORTALAMA KELİME SAYISI: [kelime]
SEÇİLEN MODEL: [Gemini 2.5 Flash / Kimi K2.5 / GPT-5 / Sonnet 4.6 / Opus 4.7]
HESAPLAMA:
1. Toplam kelime = [Aylık Miktar] x [Ortalama Kelime]
2. Token tahmini = Toplam kelime x 1.3 (prompt + çıktı)
3. Girdi/Çıktı oranı = %30 girdi, %70 çıktı (tipik içerik üretimi)
4. Girdi token = Toplam token x 0.30
5. Çıktı token = Toplam token x 0.70
6. Maliyet = (Girdi token x Girdi fiyatı) + (Çıktı token x Çıktı fiyatı)
Şablon 2: SEO İçerik Analizi Projesi
PROJE TÜRÜ: [Rakip analizi / Anahtar kelime research / İçerik gap analizi]
ANALİZ EDİLECEK SAYFA SAYISI: [sayı]
ORTALAMA SAYFA UZUNLUĞU: [kelime]
BAĞLAM PENCERESİ GEREKSİNİMİ: [düşük: <50K / orta: 50K-200K / yüksek: >200K]
MODEL: [GPT-5 / Sonnet 4.6 / Opus 4.7 / Gemini 2.5 Pro]
HESAPLAMA:
1. Toplam analiz verisi = [Sayfa Sayısı] x [Sayfa Uzunluğu] x 1.3
2. Çok döngülü işlem katsayısı = 2.5 (analiz + karşılaştırma + rapor)
3. Toplam token = Toplam analiz verisi x Çok döngülü katsayı
4. Maliyet = (Token x Model girdi fiyatı) + (Token x 0.4 x Model çıktı fiyatı)
Uygulamada gördüğümüz: Çoğu kullanıcı token tüketimini %30-40 eksik tahmin eder. Prompt optimizasyonu yapılmadığında, gereksiz bağlam tekrarları token maliyetini 1.5-2 kat artırır.
Kullanım Senaryolarına Göre Model Seçimi
Senaryo 1: Toplu Blog Yazısı Üretimi (SEO İçerik)
Gereksinim: Ayda 100 adet, 2500 kelimelik blog yazısı
Token tahmini: 100 x 2500 x 1.3 = 325.000 token/yazı
Toplam: 32.5 milyon token (girdi+çıktı)
Gemini 2.5 Flash ile maliyet:
- Girdi: 9.75M token x $0.30/1M = $2.92 (~94 TL)
- Çıktı: 22.75M token x $2.50/1M = $56.87 (~1.820 TL)
- Toplam: ~1.914 TL/ay
GPT-5 ile maliyet:
- Girdi: 9.75M token x $1.25/1M = $12.18 (~390 TL)
- Çıktı: 22.75M token x $10.00/1M = $227.50 (~7.280 TL)
- Toplam: ~7.670 TL/ay
Claude Sonnet 4.6 ile maliyet:
- Girdi: 9.75M token x $3.00/1M = $29.25 (~936 TL)
- Çıktı: 22.75M token x $15.00/1M = $341.25 (~10.920 TL)
- Toplam: ~11.856 TL/ay
Öneri: SEO blog içeriği için Gemini 2.5 Flash, Sonnet'a göre %84, GPT-5'e göre %75 daha ucuz. Ekonomik segmentin son cila için manuel düzenleme adımı eklenmesi koşuluyla, Flash + editör akışı çoğu KOBİ için ideal denge sunuyor. Stratejik blog yazıları (lansman, satış sayfası) için GPT-5 ya da Sonnet 4.6 prompt mühendisliği ile birleştirildiğinde değer üretir.
Senaryo 2: Kapsamlı Rakip SEO Analizi
Gereksinim: 50 rakip sitenin içerik stratejisi analizi, her biri ortalama 80 sayfa
Token tahmini: 50 x 80 x 3000 kelime x 1.3 x 2.5 (çok döngü) = 39 milyon token
Claude Opus 4.7 ile maliyet:
- Girdi: 23.4M token x $5/1M = $117 (~3.744 TL)
- Çıktı: 15.6M token x $25/1M = $390 (~12.480 TL)
- Toplam: ~16.224 TL
GPT-5 ile maliyet:
- Girdi: 23.4M token x $1.25/1M = $29.25 (~936 TL)
- Çıktı: 15.6M token x $10/1M = $156 (~4.992 TL)
- Toplam: ~5.928 TL
Gemini 2.5 Pro ile maliyet:
- Girdi: 23.4M token x $1.25/1M = $29.25 (~936 TL) — 200K üzeri istekler $2.50/1M üzerinden ücretlendirilir
- Çıktı: 15.6M token x $10/1M = $156 (~4.992 TL)
- Toplam: ~5.928 TL (uzun bağlamda 8.000-9.000 TL'ye çıkabilir)
Öneri: Uzun bağlam analizi gerektiren projelerde Claude Opus 4.7, çok adımlı akıl yürütmedeki tutarlılığıyla 200K+ token görevlerinde fark yaratır. Ancak GPT-5 maliyetinin yaklaşık 3 katı. Danışmanlık projelerinde karşılaştığımız durum: rutin rakip analizi için GPT-5 yeterli; semantik kümeleme, içerik gap haritalama gibi karmaşık stratejik görevlerde Opus 4.7'nin ekstra maliyeti haklı çıkıyor. Hibrit akış kuran müşterilerimiz GPT-5 ile ön analiz yapıp Opus'a yalnızca kritik kararlar için başvuruyor.
Senaryo 3: E-Ticaret Ürün Açıklaması (Yüksek Hacim)
Gereksinim: 5.000 ürün açıklaması, her biri 150-200 kelime
Token tahmini: 5.000 x 175 x 1.3 = 1.137.500 token
Gemini 2.5 Flash ile maliyet:
- Girdi: 341K token x $0.30/1M = $0.10 (~3.2 TL)
- Çıktı: 796K token x $2.50/1M = $1.99 (~64 TL)
- Toplam: ~67 TL
Kimi K2.5 ile maliyet:
- Girdi: 341K token x $0.60/1M = $0.20 (~7 TL)
- Çıktı: 796K token x $2.50/1M = $1.99 (~64 TL)
- Toplam: ~71 TL
Claude Haiku 4.5 ile maliyet:
- Girdi: 341K token x $1.00/1M = $0.34 (~11 TL)
- Çıktı: 796K token x $5.00/1M = $3.98 (~127 TL)
- Toplam: ~138 TL
Öneri: Yüksek hacimli, rutin ürün açıklaması üretiminde Gemini 2.5 Flash ve Kimi K2.5 fiyat-performans favorisi; aralarındaki fark ihmal edilebilir seviyede. E-ticaret müşterilerimizde test ettiğimizde, Flash'ın Türkçe akıcılığı ve anahtar kelime yerleştirmesi Trendyol kataloğu için yeterli geldi. Kimi düzenleme ihtiyacını biraz artırıyor ama Çince model ekosisteminin saldırgan fiyatı bunu telafi ediyor.
Aynı Prompt, 6 Farklı Model: Ürün Açıklaması Çıktı Karşılaştırması
Token fiyatı tek başına yanıltıcıdır. Asıl soru: aynı prompt'a aynı kalitede yanıt geliyor mu? Trendyol'da satılan tipik bir ürün için aşağıdaki prompt'u 6 modele verip çıktı karakterini, token tüketimini ve toplam maliyeti karşılaştırdık.
Test Prompt'u
Sen Türkiye e-ticaret pazarı için ürün açıklaması yazan bir copywriter'sın.
Aşağıdaki ürün için 150-180 kelime, SEO uyumlu, satış odaklı bir açıklama yaz.
İlk cümlede ana faydayı ver, sonra 3 öne çıkan özellik, son cümlede güven sinyali.
Ürün: 20W Hızlı Kablosuz Şarj Cihazı
Hedef kitle: iPhone ve Samsung kullanıcıları
Anahtar kelimeler: kablosuz şarj, hızlı şarj, MagSafe uyumlu
Platform: Trendyol
Girdi tokeni: ~120 token (sistem promptu dahil)
Beklenen çıktı: ~250 token (150-180 Türkçe kelime ≈ 220-280 token)
6 Modelin Tipik Çıktı Karakteri
| Model | Çıktı Karakteri | Token (Çıktı) | Maliyet/1.000 Açıklama (TL) |
|---|---|---|---|
| Gemini 2.5 Flash | Anahtar kelimeleri yerleştirir, akıcı; bazen jenerik kapanış cümlesi kullanır | 240 | 22 TL |
| Kimi K2.5 | İyi yapı, doğru özellik sıralaması; Türkçe söz dizimi orta — 1-2 cümle düzenleme gerekebilir | 260 | 24 TL |
| Claude Haiku 4.5 | Temiz Türkçe, formal ton; satış dilinde GPT-5'ten daha az çekici | 235 | 41 TL |
| GPT-5 | Akıcı satış dili, doğal Türkçe, anahtar kelimeleri organik yerleştirir | 245 | 83 TL |
| Claude Sonnet 4.6 | En zengin betimleme, güçlü güven sinyali, marka-uyumlu ton | 270 | 142 TL |
| Claude Opus 4.7 | Sonnet'a yakın kalite; ekstra fayda, çoğu rutin ürün için maliyetini çıkarmaz | 265 | 226 TL |
1.000 ürün için, girdi 120 token + çıktı tablodaki değer, 1 USD = 32 TL kuru.
Karar Bloğu: Ne Zaman Hangisi?
- Trendyol/Hepsiburada satıcısı, aylık 2.000+ ürün → Gemini 2.5 Flash (toplam 44 TL/ay) veya Kimi K2.5 (48 TL/ay). Düzenleme adımıyla son kalite.
- Marka odaklı, premium konumlanma → GPT-5 (166 TL/ay). Özgün ses tonu, doğal akış, müdahale ihtiyacı düşük.
- Boutique satıcılar, lüks segment → Sonnet 4.6 (284 TL/ay). Detay zenginliği ve marka tutarlılığı için fiyat farkı haklı.
- Standart ürün açıklaması için Opus 4.7 kullanma — verdiği ekstra %2-3 kaliteyi 4 katı fiyatla satın alıyorsunuz; bu modeli stratejik analiz ve uzun bağlam görevlerine sakla.
E-ticaret müşterilerimizde test ettiğimizde: Aynı 1.000 ürünlük katalog için "Flash + insan rötuşu" akışı, "sadece Sonnet 4.6" akışından %78 daha ucuz olmasına rağmen son müşteri tıklama oranında istatistiksel fark üretmedi.
Token Maliyetini Düşürme Stratejileri
1. Prompt Optimizasyonu ve Bağlam Yönetimi
Kötü örnek (token israfı):
Sen bir SEO uzmanısın. SEO ile ilgili yazılar yazıyorsun. SEO önemlidir çünkü organik trafik getirir. Organik trafik, reklam maliyetlerini düşürür. Şimdi şu konu hakkında 2000 kelimelik bir yazı yaz: [konu]. Yazıda SEO'nun önemini vurgula. Anahtar kelimeleri kullan. Başlıklar oluştur. Meta açıklama yaz.
Token: ~120 (gereksiz tekrar ve açıklama)
İyi örnek (optimize):
SEO uzmanı rolünde, aşağıdaki konuyu 2000 kelimeye yazı olarak geliştir:
Konu: [konu]
Gereksinimler: H2/H3 başlıklar, anahtar kelime yoğunluğu %1.5, meta açıklama (155 karakter)
Ton: uzman ama anlaşılır
Token: ~65 (%46 tasarruf)
Teknik: System prompt'u API seviyesinde önbellekleyin (Claude Cache API veya OpenAI Completion API), her istekte göndermeyin. Bu tek başına %15-20 token tasarrufu sağlar.
2. Hibrit Model Stratejisi
Ön işleme: Gemini 2.5 Flash ile taslak oluştur (en düşük maliyet)
İyileştirme: GPT-5 veya Sonnet 4.6 ile akıl yürütme ve derinleştirme (yüksek kalite)
Son kontrol: Kimi K2.5 veya Flash ile gramer ve format düzeltme (düşük maliyet)
Gerçek dünya örneği: 50 sayfalık SEO strateji dokümanı hazırlarken, Gemini 2.5 Flash ile ilk taslak (maliyet: 70 TL), GPT-5 ile analitik derinleştirme (maliyet: 380 TL), Flash ile düzenleme (maliyet: 30 TL). Toplam: 480 TL. Tüm süreci Sonnet 4.6 ile yapsaydık: 1.250 TL. Tasarruf: %62.
3. Batch İşleme ve API İndirimleri
OpenAI'nin Batch API'si, %50 indirim sunar ancak yanıt süresi 24 saate kadar çıkar. Ne zaman kullanılır: Toplu içerik üretimi, ürün açıklaması güncellemeleri, arşiv analizi.
Batch API örnek kod (Python):
import openai
batch_request = openai.Batch.create(
input_file_id="file-abc123", # JSONL formatında prompt listesi
endpoint="/v1/chat/completions",
completion_window="24h"
)
# 24 saat sonra sonuçları al
results = openai.Batch.retrieve(batch_request.id)
Müşterilerimizde test ettiğimizde: Haftalık içerik planlaması için batch API, ayda 12.000-15.000 TL tasarruf sağladı.
4. Streaming ve Kesintili Yanıt Optimizasyonu
Streaming API, yanıtın tamamını beklemeden işlem yapmanızı sağlar ve gereksiz token tüketimini engeller. Örnek: Kullanıcı ilk 500 kelimeyi okuduktan sonra "yeterli" derse, yanıtın geri kalanı üretilmez.
for chunk in openai.ChatCompletion.create(
model="gpt-4o-mini",
messages=[{"role": "user", "content": "..."}],
stream=True
):
print(chunk['choices'][0]['delta'].get('content', ''))
# Kullanıcı müdahalesine göre akışı kesebilirsiniz
Pratik sonuç: Streaming, interaktif uygulamalarda token maliyetini %8-15 düşürür.
5. Önbellekleme ve Session Yönetimi
Claude'un Cache API'si, sık kullanılan sistem promptlarını önbelleğe alır ve tekrar kullanıldığında %90 indirim uygular. Kullanım alanı: Sabit format şablonları, tekrar eden talimatlar.
# Anthropic Cache API kullanımı
response = anthropic.messages.create(
model="claude-sonnet-4.6",
system=[{
"type": "text",
"text": "Sabit sistem talimatları buraya...",
"cache_control": {"type": "ephemeral"} # Önbelleğe al
}],
messages=[{"role": "user", "content": "Değişen kullanıcı sorusu"}]
)
Uygulamada gördüğümüz: 500+ istekli projelerde önbellekleme, toplam maliyeti %25-30 düşürüyor — özellikle sabit sistem promptları olan asistan ve RAG sistemlerinde fark belirgin oluyor.
Sonuç: Doğru Modeli Bütçenize Göre Seçin
AI modelleri arasındaki seçim "hangisi daha iyi" değil, "hangisi sizin senaryonuzda daha verimli" sorusudur. Yüksek hacimli rutin işler için Gemini 2.5 Flash veya Kimi K2.5, dengeli içerik üretimi için GPT-5 veya Sonnet 4.6, uzun bağlam ve karmaşık stratejik akıl yürütme için Claude Opus 4.7, multimodal görevler için Gemini 2.5 Pro, yoğun reasoning gerektiren matematik/kod için OpenAI o3 doğru tercih. Asıl tasarruf tek modele bağlı kalmaktan değil; hibrit yönlendirme, prompt önbellekleme ve batch API kullanımından gelir — uygulamada müşterilerimizde toplam AI faturasını ortalama %38-55 düşürüyoruz.
Maliyet Analizi ve Model Seçim Danışmanlığı
AI altyapınızın aylık maliyetini düşürmek, doğru model karışımını seçmek veya prompt mühendisliği ile token tüketimini optimize etmek için profesyonel destek almak istiyorsanız bizimle iletişime geçin. Müşterilerimizin AI maliyetlerini ortalama %35 düşüren stratejileri sizin senaryonuza uyarlayalım.

Tonguç Karaçay
AI-Driven UX & Growth Partner | 25+ Yıl Deneyim
Sıkça Sorulan Sorular
İlgili Yazılar
Hasta Takip ve Hatırlatma Sistemleri İçin AI Agent Kurulumu
Claude MCP ile Instagram İçerik Takvimi Otomasyonu Kurulumu
KOBİ'ler İçin Yapay Zeka Eğitim Programı: Kapsamlı Rehber
Son Yazılar
- GEO Checklist: Türkçe İçerik Optimizasyonu İçin 15 AdımSEO
- Instagram Reels İçin Yapay Zeka Trend Analizi ve İçerik PlanlamaYapay Zeka
- Müşteri Hizmetleri Chatbotunda Token Maliyetini Düşüren 7 AyarYapay Zeka
- En İyi Anahtar Kelime Araştırma SEO Araçları 2026: Ahrefs, SEMrush ve DiğerleriSEO
- Heading Tags Nedir, H1 Etiketi Nasıl Kullanılır?SEO
- E-Ticaret İçin Yerel SEO: Adım Adım Uygulama RehberiSEO