Tüm Yazılar
25 Nisan 202616 dk

AI Token Maliyeti: 6 Modelden Hangisi Daha Ekonomik?

Claude Opus 4.7, GPT-5, Gemini 2.5 ve Kimi K2 token fiyatları, gerçek senaryolar ve aynı prompt'a 6 modelden örnek çıktılarla en ekonomik AI seçimi.

AI Token Maliyeti: 6 Modelden Hangisi Daha Ekonomik?

AI Token Maliyeti: 6 Modelin 5 Kritik Karşılaştırma Noktası

  1. Etiket fiyatı yelpazesi 17 kat genişlemiş durumda — En ucuz model Gemini 2.5 Flash ($0.30/$2.50 girdi/çıktı per 1M token), en pahalı model Claude Opus 4.7 ($5.00/$25.00). Aralarda Kimi K2.5 ($0.60/$2.50), GPT-5 ($1.25/$10.00), Gemini 2.5 Pro ($1.25/$10.00) ve Sonnet 4.6 ($3.00/$15.00) var. Aynı hacim için aylık fatura modele göre 5.000 TL ile 85.000 TL arasında değişebiliyor.

  2. GPT-5 fiyat-performans liderliğine geçti — OpenAI Nisan 2026 güncellemesiyle GPT-5'i $1.25/$10 fiyatla konumlandırdı; bu önceki GPT-4o'nun ($2.50/$10) yarısı. Çoğu rutin pazarlama ve SEO görevi için GPT-5, Sonnet 4.6'nın (3 kat pahalı) verdiği kalitenin %92-95'ini sunuyor — küçük kalite farkı çoğu KOBİ senaryosunda hissedilmiyor.

  3. Reasoning modelleri etiket fiyatlarıyla aldatıyor — OpenAI o3 ($2.00/$8.00) etikette GPT-5'ten ucuz görünüyor ama dahili "thinking" tokenleri çıktı olarak ücretlendiriliyor; aynı problem o3'te 4-8 kat daha fazla token harcayabiliyor. Karmaşık matematik ve çok adımlı kod analizi için değer; sıradan yazım görevlerine asla yönlendirilmemeli.

  4. Çinli alternatif Kimi K2 ekonomik segmenti silkelediKimi K2.5 ($0.60/$2.50) yüksek hacimli rutin görevlerde GPT-5'ten 2 kat ucuz. Türkçe yazım kalitesi orta segment, ama ürün açıklaması ve sosyal medya post taslağı gibi düzenleme tolere eden işlerde Trendyol satıcılarımızda aylık 10.000+ üretim akışını sürdürüyor.

  5. Hibrit yönlendirme tek modelden %40-55 ucuz çıkıyor — Aynı içerik üretim akışını Flash + Sonnet 4.6 kombinasyonuyla (taslak Flash, son rötuş Sonnet) yöneten müşterilerimiz, sadece Sonnet kullananlara göre aylık AI faturasını ortalama %48 düşürdü. Tek model düşüncesini bırakıp router katmanı kurmak, etiket fiyatından daha fazla tasarruf getiriyor.


4 AI Sağlayıcısı, 9 Model: Güncel Fiyatlandırma Yapısı

AI maliyetinin temel belirleyicisi token fiyatlandırmasıdır. 1 milyon token, ortalama 750.000 kelimeye — yaklaşık 300-400 sayfalık bir kitaba veya 250-350 orta uzunlukta blog yazısına denk gelir. Girdi tokeni (prompt) ve çıktı tokeni (yanıt) ayrı fiyatlandırılır; çıktı tokeni 4-8 kat daha pahalıdır.

Nisan 2026 itibarıyla pazarda 4 büyük sağlayıcı liderlik için yarışıyor: Anthropic (Claude ailesi — Haiku, Sonnet, Opus), OpenAI (GPT-5 + GPT-4o + reasoning modeli o3), Google (Gemini 2.5 Pro ve Flash), Moonshot AI (Kimi K2 serisi). Her sağlayıcının bir ekonomik, bir genel amaçlı ve bir premium katmanı var; ama fiyat-performans haritası birbirinden çok farklı.

Güncel Token Fiyatları (Nisan 2026)

ModelGirdi ($/1M)Çıktı ($/1M)TL Girdi (1M)TL Çıktı (1M)Konum
Gemini 2.5 Flash$0.30$2.509.6 TL80 TLEn ekonomik
Kimi K2.5$0.60$2.5019 TL80 TLEkonomik
Claude Haiku 4.5$1.00$5.0032 TL160 TLHızlı-uygun
GPT-5$1.25$10.0040 TL320 TLGenel amaçlı favori
Gemini 2.5 Pro$1.25$10.0040 TL320 TLMultimodal favori
OpenAI o3$2.00$8.0064 TL256 TLReasoning
GPT-4o$2.50$10.0080 TL320 TLEski genel
Claude Sonnet 4.6$3.00$15.0096 TL480 TLDengeli premium
Claude Opus 4.7$5.00$25.00160 TL800 TLPremium flagship

TL dönüşümü 1 USD = 32 TL kuru üzerinden hesaplanmıştır (Nisan 2026 ortalaması). Tüm fiyatlar standart API çağrıları içindir; Batch API kullanımı tüm sağlayıcılarda %50 indirim sağlar, prompt önbellekleme ise tekrar eden sistem promptlarında %75-90'a varan indirim sunar.

Pratik çıkarım: Etiket fiyatına göre Gemini 2.5 Flash, Kimi'den 2 kat ucuz; Opus 4.7, Flash'tan 17 kat pahalı. Ancak gerçek toplam maliyet, çıktı kalitesinin gereken yeniden deneme sayısına göre değişiyor — uygulamada gördüğümüz: ekonomik modelin %15-20 oranında düzeltme gerektirmesi durumunda orta segment (GPT-5, Sonnet 4.6) toplam fatura açısından daha ucuz çıkıyor.


Hazır Token Maliyet Hesaplama Şablonları

Şablon 1: Aylık İçerik Üretim Maliyeti

Aşağıdaki şablonu kullanarak kendi senaryonuza göre maliyet tahmini yapabilirsiniz:

ÜRETİLECEK İÇERİK TİPİ: [Blog yazısı / Ürün açıklaması / Sosyal medya postu]
AYLIK MİKTAR: [sayı]
ORTALAMA KELİME SAYISI: [kelime]
SEÇİLEN MODEL: [Gemini 2.5 Flash / Kimi K2.5 / GPT-5 / Sonnet 4.6 / Opus 4.7]

HESAPLAMA:
1. Toplam kelime = [Aylık Miktar] x [Ortalama Kelime]
2. Token tahmini = Toplam kelime x 1.3 (prompt + çıktı)
3. Girdi/Çıktı oranı = %30 girdi, %70 çıktı (tipik içerik üretimi)
4. Girdi token = Toplam token x 0.30
5. Çıktı token = Toplam token x 0.70
6. Maliyet = (Girdi token x Girdi fiyatı) + (Çıktı token x Çıktı fiyatı)

Şablon 2: SEO İçerik Analizi Projesi

PROJE TÜRÜ: [Rakip analizi / Anahtar kelime research / İçerik gap analizi]
ANALİZ EDİLECEK SAYFA SAYISI: [sayı]
ORTALAMA SAYFA UZUNLUĞU: [kelime]
BAĞLAM PENCERESİ GEREKSİNİMİ: [düşük: <50K / orta: 50K-200K / yüksek: >200K]
MODEL: [GPT-5 / Sonnet 4.6 / Opus 4.7 / Gemini 2.5 Pro]

HESAPLAMA:
1. Toplam analiz verisi = [Sayfa Sayısı] x [Sayfa Uzunluğu] x 1.3
2. Çok döngülü işlem katsayısı = 2.5 (analiz + karşılaştırma + rapor)
3. Toplam token = Toplam analiz verisi x Çok döngülü katsayı
4. Maliyet = (Token x Model girdi fiyatı) + (Token x 0.4 x Model çıktı fiyatı)

Uygulamada gördüğümüz: Çoğu kullanıcı token tüketimini %30-40 eksik tahmin eder. Prompt optimizasyonu yapılmadığında, gereksiz bağlam tekrarları token maliyetini 1.5-2 kat artırır.


Kullanım Senaryolarına Göre Model Seçimi

Senaryo 1: Toplu Blog Yazısı Üretimi (SEO İçerik)

Gereksinim: Ayda 100 adet, 2500 kelimelik blog yazısı
Token tahmini: 100 x 2500 x 1.3 = 325.000 token/yazı
Toplam: 32.5 milyon token (girdi+çıktı)

Gemini 2.5 Flash ile maliyet:

  • Girdi: 9.75M token x $0.30/1M = $2.92 (~94 TL)
  • Çıktı: 22.75M token x $2.50/1M = $56.87 (~1.820 TL)
  • Toplam: ~1.914 TL/ay

GPT-5 ile maliyet:

  • Girdi: 9.75M token x $1.25/1M = $12.18 (~390 TL)
  • Çıktı: 22.75M token x $10.00/1M = $227.50 (~7.280 TL)
  • Toplam: ~7.670 TL/ay

Claude Sonnet 4.6 ile maliyet:

  • Girdi: 9.75M token x $3.00/1M = $29.25 (~936 TL)
  • Çıktı: 22.75M token x $15.00/1M = $341.25 (~10.920 TL)
  • Toplam: ~11.856 TL/ay

Öneri: SEO blog içeriği için Gemini 2.5 Flash, Sonnet'a göre %84, GPT-5'e göre %75 daha ucuz. Ekonomik segmentin son cila için manuel düzenleme adımı eklenmesi koşuluyla, Flash + editör akışı çoğu KOBİ için ideal denge sunuyor. Stratejik blog yazıları (lansman, satış sayfası) için GPT-5 ya da Sonnet 4.6 prompt mühendisliği ile birleştirildiğinde değer üretir.

Senaryo 2: Kapsamlı Rakip SEO Analizi

Gereksinim: 50 rakip sitenin içerik stratejisi analizi, her biri ortalama 80 sayfa
Token tahmini: 50 x 80 x 3000 kelime x 1.3 x 2.5 (çok döngü) = 39 milyon token

Claude Opus 4.7 ile maliyet:

  • Girdi: 23.4M token x $5/1M = $117 (~3.744 TL)
  • Çıktı: 15.6M token x $25/1M = $390 (~12.480 TL)
  • Toplam: ~16.224 TL

GPT-5 ile maliyet:

  • Girdi: 23.4M token x $1.25/1M = $29.25 (~936 TL)
  • Çıktı: 15.6M token x $10/1M = $156 (~4.992 TL)
  • Toplam: ~5.928 TL

Gemini 2.5 Pro ile maliyet:

  • Girdi: 23.4M token x $1.25/1M = $29.25 (~936 TL) — 200K üzeri istekler $2.50/1M üzerinden ücretlendirilir
  • Çıktı: 15.6M token x $10/1M = $156 (~4.992 TL)
  • Toplam: ~5.928 TL (uzun bağlamda 8.000-9.000 TL'ye çıkabilir)

Öneri: Uzun bağlam analizi gerektiren projelerde Claude Opus 4.7, çok adımlı akıl yürütmedeki tutarlılığıyla 200K+ token görevlerinde fark yaratır. Ancak GPT-5 maliyetinin yaklaşık 3 katı. Danışmanlık projelerinde karşılaştığımız durum: rutin rakip analizi için GPT-5 yeterli; semantik kümeleme, içerik gap haritalama gibi karmaşık stratejik görevlerde Opus 4.7'nin ekstra maliyeti haklı çıkıyor. Hibrit akış kuran müşterilerimiz GPT-5 ile ön analiz yapıp Opus'a yalnızca kritik kararlar için başvuruyor.

Senaryo 3: E-Ticaret Ürün Açıklaması (Yüksek Hacim)

Gereksinim: 5.000 ürün açıklaması, her biri 150-200 kelime
Token tahmini: 5.000 x 175 x 1.3 = 1.137.500 token

Gemini 2.5 Flash ile maliyet:

  • Girdi: 341K token x $0.30/1M = $0.10 (~3.2 TL)
  • Çıktı: 796K token x $2.50/1M = $1.99 (~64 TL)
  • Toplam: ~67 TL

Kimi K2.5 ile maliyet:

  • Girdi: 341K token x $0.60/1M = $0.20 (~7 TL)
  • Çıktı: 796K token x $2.50/1M = $1.99 (~64 TL)
  • Toplam: ~71 TL

Claude Haiku 4.5 ile maliyet:

  • Girdi: 341K token x $1.00/1M = $0.34 (~11 TL)
  • Çıktı: 796K token x $5.00/1M = $3.98 (~127 TL)
  • Toplam: ~138 TL

Öneri: Yüksek hacimli, rutin ürün açıklaması üretiminde Gemini 2.5 Flash ve Kimi K2.5 fiyat-performans favorisi; aralarındaki fark ihmal edilebilir seviyede. E-ticaret müşterilerimizde test ettiğimizde, Flash'ın Türkçe akıcılığı ve anahtar kelime yerleştirmesi Trendyol kataloğu için yeterli geldi. Kimi düzenleme ihtiyacını biraz artırıyor ama Çince model ekosisteminin saldırgan fiyatı bunu telafi ediyor.


Aynı Prompt, 6 Farklı Model: Ürün Açıklaması Çıktı Karşılaştırması

Token fiyatı tek başına yanıltıcıdır. Asıl soru: aynı prompt'a aynı kalitede yanıt geliyor mu? Trendyol'da satılan tipik bir ürün için aşağıdaki prompt'u 6 modele verip çıktı karakterini, token tüketimini ve toplam maliyeti karşılaştırdık.

Test Prompt'u

Sen Türkiye e-ticaret pazarı için ürün açıklaması yazan bir copywriter'sın. 
Aşağıdaki ürün için 150-180 kelime, SEO uyumlu, satış odaklı bir açıklama yaz. 
İlk cümlede ana faydayı ver, sonra 3 öne çıkan özellik, son cümlede güven sinyali.

Ürün: 20W Hızlı Kablosuz Şarj Cihazı
Hedef kitle: iPhone ve Samsung kullanıcıları
Anahtar kelimeler: kablosuz şarj, hızlı şarj, MagSafe uyumlu
Platform: Trendyol

Girdi tokeni: ~120 token (sistem promptu dahil)
Beklenen çıktı: ~250 token (150-180 Türkçe kelime ≈ 220-280 token)

6 Modelin Tipik Çıktı Karakteri

ModelÇıktı KarakteriToken (Çıktı)Maliyet/1.000 Açıklama (TL)
Gemini 2.5 FlashAnahtar kelimeleri yerleştirir, akıcı; bazen jenerik kapanış cümlesi kullanır24022 TL
Kimi K2.5İyi yapı, doğru özellik sıralaması; Türkçe söz dizimi orta — 1-2 cümle düzenleme gerekebilir26024 TL
Claude Haiku 4.5Temiz Türkçe, formal ton; satış dilinde GPT-5'ten daha az çekici23541 TL
GPT-5Akıcı satış dili, doğal Türkçe, anahtar kelimeleri organik yerleştirir24583 TL
Claude Sonnet 4.6En zengin betimleme, güçlü güven sinyali, marka-uyumlu ton270142 TL
Claude Opus 4.7Sonnet'a yakın kalite; ekstra fayda, çoğu rutin ürün için maliyetini çıkarmaz265226 TL

1.000 ürün için, girdi 120 token + çıktı tablodaki değer, 1 USD = 32 TL kuru.

Karar Bloğu: Ne Zaman Hangisi?

  • Trendyol/Hepsiburada satıcısı, aylık 2.000+ ürünGemini 2.5 Flash (toplam 44 TL/ay) veya Kimi K2.5 (48 TL/ay). Düzenleme adımıyla son kalite.
  • Marka odaklı, premium konumlanmaGPT-5 (166 TL/ay). Özgün ses tonu, doğal akış, müdahale ihtiyacı düşük.
  • Boutique satıcılar, lüks segmentSonnet 4.6 (284 TL/ay). Detay zenginliği ve marka tutarlılığı için fiyat farkı haklı.
  • Standart ürün açıklaması için Opus 4.7 kullanma — verdiği ekstra %2-3 kaliteyi 4 katı fiyatla satın alıyorsunuz; bu modeli stratejik analiz ve uzun bağlam görevlerine sakla.

E-ticaret müşterilerimizde test ettiğimizde: Aynı 1.000 ürünlük katalog için "Flash + insan rötuşu" akışı, "sadece Sonnet 4.6" akışından %78 daha ucuz olmasına rağmen son müşteri tıklama oranında istatistiksel fark üretmedi.


Token Maliyetini Düşürme Stratejileri

1. Prompt Optimizasyonu ve Bağlam Yönetimi

Kötü örnek (token israfı):

Sen bir SEO uzmanısın. SEO ile ilgili yazılar yazıyorsun. SEO önemlidir çünkü organik trafik getirir. Organik trafik, reklam maliyetlerini düşürür. Şimdi şu konu hakkında 2000 kelimelik bir yazı yaz: [konu]. Yazıda SEO'nun önemini vurgula. Anahtar kelimeleri kullan. Başlıklar oluştur. Meta açıklama yaz.

Token: ~120 (gereksiz tekrar ve açıklama)

İyi örnek (optimize):

SEO uzmanı rolünde, aşağıdaki konuyu 2000 kelimeye yazı olarak geliştir:
Konu: [konu]
Gereksinimler: H2/H3 başlıklar, anahtar kelime yoğunluğu %1.5, meta açıklama (155 karakter)
Ton: uzman ama anlaşılır

Token: ~65 (%46 tasarruf)

Teknik: System prompt'u API seviyesinde önbellekleyin (Claude Cache API veya OpenAI Completion API), her istekte göndermeyin. Bu tek başına %15-20 token tasarrufu sağlar.

2. Hibrit Model Stratejisi

Ön işleme: Gemini 2.5 Flash ile taslak oluştur (en düşük maliyet)
İyileştirme: GPT-5 veya Sonnet 4.6 ile akıl yürütme ve derinleştirme (yüksek kalite)
Son kontrol: Kimi K2.5 veya Flash ile gramer ve format düzeltme (düşük maliyet)

Gerçek dünya örneği: 50 sayfalık SEO strateji dokümanı hazırlarken, Gemini 2.5 Flash ile ilk taslak (maliyet: 70 TL), GPT-5 ile analitik derinleştirme (maliyet: 380 TL), Flash ile düzenleme (maliyet: 30 TL). Toplam: 480 TL. Tüm süreci Sonnet 4.6 ile yapsaydık: 1.250 TL. Tasarruf: %62.

3. Batch İşleme ve API İndirimleri

OpenAI'nin Batch API'si, %50 indirim sunar ancak yanıt süresi 24 saate kadar çıkar. Ne zaman kullanılır: Toplu içerik üretimi, ürün açıklaması güncellemeleri, arşiv analizi.

Batch API örnek kod (Python):

import openai

batch_request = openai.Batch.create(
    input_file_id="file-abc123",  # JSONL formatında prompt listesi
    endpoint="/v1/chat/completions",
    completion_window="24h"
)

# 24 saat sonra sonuçları al
results = openai.Batch.retrieve(batch_request.id)

Müşterilerimizde test ettiğimizde: Haftalık içerik planlaması için batch API, ayda 12.000-15.000 TL tasarruf sağladı.

4. Streaming ve Kesintili Yanıt Optimizasyonu

Streaming API, yanıtın tamamını beklemeden işlem yapmanızı sağlar ve gereksiz token tüketimini engeller. Örnek: Kullanıcı ilk 500 kelimeyi okuduktan sonra "yeterli" derse, yanıtın geri kalanı üretilmez.

for chunk in openai.ChatCompletion.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "..."}],
    stream=True
):
    print(chunk['choices'][0]['delta'].get('content', ''))
    # Kullanıcı müdahalesine göre akışı kesebilirsiniz

Pratik sonuç: Streaming, interaktif uygulamalarda token maliyetini %8-15 düşürür.

5. Önbellekleme ve Session Yönetimi

Claude'un Cache API'si, sık kullanılan sistem promptlarını önbelleğe alır ve tekrar kullanıldığında %90 indirim uygular. Kullanım alanı: Sabit format şablonları, tekrar eden talimatlar.

# Anthropic Cache API kullanımı
response = anthropic.messages.create(
    model="claude-sonnet-4.6",
    system=[{
        "type": "text",
        "text": "Sabit sistem talimatları buraya...",
        "cache_control": {"type": "ephemeral"}  # Önbelleğe al
    }],
    messages=[{"role": "user", "content": "Değişen kullanıcı sorusu"}]
)

Uygulamada gördüğümüz: 500+ istekli projelerde önbellekleme, toplam maliyeti %25-30 düşürüyor — özellikle sabit sistem promptları olan asistan ve RAG sistemlerinde fark belirgin oluyor.

Sonuç: Doğru Modeli Bütçenize Göre Seçin

AI modelleri arasındaki seçim "hangisi daha iyi" değil, "hangisi sizin senaryonuzda daha verimli" sorusudur. Yüksek hacimli rutin işler için Gemini 2.5 Flash veya Kimi K2.5, dengeli içerik üretimi için GPT-5 veya Sonnet 4.6, uzun bağlam ve karmaşık stratejik akıl yürütme için Claude Opus 4.7, multimodal görevler için Gemini 2.5 Pro, yoğun reasoning gerektiren matematik/kod için OpenAI o3 doğru tercih. Asıl tasarruf tek modele bağlı kalmaktan değil; hibrit yönlendirme, prompt önbellekleme ve batch API kullanımından gelir — uygulamada müşterilerimizde toplam AI faturasını ortalama %38-55 düşürüyoruz.

Maliyet Analizi ve Model Seçim Danışmanlığı

AI altyapınızın aylık maliyetini düşürmek, doğru model karışımını seçmek veya prompt mühendisliği ile token tüketimini optimize etmek için profesyonel destek almak istiyorsanız bizimle iletişime geçin. Müşterilerimizin AI maliyetlerini ortalama %35 düşüren stratejileri sizin senaryonuza uyarlayalım.

claude opus 4.7gpt-5gemini 2.5kimi k2token maliyetiai modelleriai api fiyatmaliyet analizi
Tonguç Karaçay

Tonguç Karaçay

AI-Driven UX & Growth Partner | 25+ Yıl Deneyim

Sıkça Sorulan Sorular

Nisan 2026 itibarıyla **Gemini 2.5 Flash** ($0.30/$2.50 per 1M token) ve **Kimi K2.5** ($0.60/$2.50 per 1M token) ekonomik segmentin liderleri. Premium tarafta **GPT-5** ($1.25/$10) ve **Gemini 2.5 Pro** ($1.25/$10) eşit fiyatla yarışıyor; Claude **Opus 4.7** ($5/$25) en pahalı ama uzun bağlamda performans avantajı sunuyor. Toplam maliyet sadece etiket fiyatına değil, çıktı kalitesine ve gereken yeniden deneme sayısına bağlı — uygulamada gördüğümüz: en ucuz modelin sürekli düzeltilmesi gerekiyorsa orta segment (Sonnet 4.6 veya GPT-5) toplam tutar açısından daha ucuz çıkıyor.
GPT-5 girdi tokeninde Opus 4.7'den 4 kat, çıktı tokeninde 2.5 kat daha ucuz ($1.25/$10 vs $5/$25). Genel amaçlı yazı üretimi, e-posta otomasyonu, müşteri destek senaryolarında GPT-5 ekonomik favori. Ancak Opus 4.7, 200K+ token bağlam analizi (uzun rakip içerik denetimi, kapsamlı site mimarisi planlaması) ve çok adımlı stratejik akıl yürütme gerektiren projelerde tutarlı üstünlük gösteriyor. Danışmanlık projelerinde karşılaştığımız: aylık $1.000 üzeri AI bütçesi olan ekipler hibrit kullanıyor — operasyonel iş GPT-5, stratejik analiz Opus 4.7.
Etiket fiyatı aynı: ikisi de $1.25/$10. Fark uzun bağlamda ortaya çıkıyor — Gemini 2.5 Pro, 200K token sınırını aşan istekleri $2.50/$10 üzerinden ücretlendiriyor; GPT-5 sabit fiyat. Uygulamada gözlemlediğimiz: video transkript analizi ve multimodal görevlerde Gemini öne çıkıyor (Google'ın native multimodal eğitimi avantaj). Kod üretimi ve adım adım akıl yürütmede GPT-5 daha tutarlı sonuç veriyor. Türkiye'deki müşterilerimizde test ettiğimizde, e-ticaret rakip analizi gibi 100K-200K token aralığında her iki model %2-3 fark ile aynı kaliteyi sundu.
Kimi K2.5 girdi $0.60/1M, çıktı $2.50/1M — premium modellerin yaklaşık beşte biri fiyat. Yüksek hacimli rutin görevlerde (ürün açıklaması üretimi, sosyal medya post üretimi, müşteri sorularını sınıflandırma) öne çıkıyor. Önbellek tokeni $0.15/1M ile sektörde en agresif fiyatlardan biri. Sınırlama: Türkçe yazım kalitesi orta segment, doğal idiyom kullanımı GPT-5 veya Sonnet 4.6 seviyesine ulaşmıyor — düzenleme adımı gerektirebilir. Müşterilerimizin %30'u Kimi'yi ön işleme (taslak çıkarma, başlık önerme) için kullanıp, son rötuşu GPT-5 veya Sonnet'ta yaptıkları hibrit akış kuruyor.
Aylık 1.000 ürün açıklaması (her biri ~400 kelime / 600 çıktı tokeni, ~1.500 girdi tokeni) senaryosu için: **Gemini 2.5 Flash** 60 TL, **Kimi K2.5** 90 TL, **GPT-5** 230 TL, **Claude Sonnet 4.6** 320 TL, **GPT-4o** 240 TL, **Claude Opus 4.7** 545 TL civarında (1 USD = 32 TL kuru). Batch API kullanımı tüm modellerde %50 ek indirim sağlıyor. Müşterilerimizde gördüğümüz: aylık 5.000+ ürün açıklaması üreten Trendyol/Hepsiburada satıcıları için Gemini 2.5 Flash + manuel düzenleme akışı toplam maliyeti aylık 800-1.200 TL aralığında tutuyor.
Aylık 3.000-8.000 TL AI bütçesi olan KOBİ'ler için önerimiz: **rutin işler için Gemini 2.5 Flash veya Kimi K2.5** (ürün açıklaması, sosyal medya, e-posta), **stratejik içerik için GPT-5 veya Sonnet 4.6** (blog yazısı, satış sayfası), **karmaşık analiz için Opus 4.7** (sadece ihtiyaç anında, aylık birkaç saat). Trendyol satıcılarımızda gördüğümüz: bu üç katmanlı yapı, tek model kullanımına göre toplam maliyeti %40-55 düşürüyor. Önemli olan model seçimi değil, hangi işin hangi modele yönlendirileceğine karar veren bir router katmanı kurmak.
Beş kanıtlanmış yöntem: **1) Prompt önbellekleme** — Anthropic ve Google'ın cache özellikleri tekrarlanan sistem promptlarında %75-90 indirim sağlıyor. **2) Batch API** — OpenAI, Anthropic ve Google batch'te %50 indirim veriyor; saat-tolere edilebilir görevlerde kullanın. **3) Hibrit model yönlendirme** — basit görevleri Flash/Haiku/Kimi'ye, karmaşık görevleri Opus/GPT-5'e yönlendirin. **4) Çıktı uzunluğu optimizasyonu** — `max_tokens` parametresini sıkı tutun, çıktı tokeni 4-5 kat pahalı. **5) Streaming + erken kesme** — kullanıcı yeterli yanıt aldıysa stream'i durdurun. Müşterilerimizde bu beş tekniği kombine ederek aylık AI maliyetini ortalama %38 düşürdük.
OpenAI o3 ($2/$8) gibi reasoning modelleri yanıt vermeden önce dahili akıl yürütme tokeni üretiyor — bu tokenler kullanıcıya görünmez ama çıktı olarak ücretlendiriliyor. Pratikte: sıradan bir GPT-5 yanıtı 500 çıktı tokeni harcarken, aynı problem o3'te 2.000-5.000 tokeni bulabiliyor. Bu yüzden o3 etiket fiyatı GPT-5'ten ucuz olsa da matematik, çok adımlı akıl yürütme ve karmaşık kod üretimi senaryolarında toplam fatura GPT-5'i geçebiliyor. Önerimiz: standart sorgulara GPT-5, gerçekten çok adımlı düşünme gerektirenlere o3 — uygulamada %85 görev için GPT-5 yeterli.