Ulaşım
- Adres: 2342 Sk, İpekyol, İpek Ap 49A, 63250 Haliliye/Şanlıurfa
- Telefon:
0505 532 36 38 - eMail: admin@alestaweb.com
Claude Sonnet 4.7 (claude-sonnet-4-6 ardılı, Anthropic API'de claude-sonnet-4-7 model ID'siyle çağrılır), Anthropic'in 2026 yılında piyasaya sürdüğü en güncel orta seviye büyük dil modelidir. Prompt caching, extended thinking ve gelişmiş tool use özellikleriyle 1 milyon token bağlam destekli üretim hatlarında token maliyetini düşürür. Bu rehberde Alesta Web olarak Anthropic Python SDK kurulumunu, cache breakpoint stratejisini ve gerçek üretim ortamlarında karşılaştığımız cache hit rate optimizasyonlarını adım adım gösteriyoruz.
Python 3.10 ve üzeri bir ortamda Anthropic SDK tek komutla kurulur. Üretim sunucularımızda venv veya uv ile izole ortam tercih ediyoruz; küresel kurulum, bağımlılık çakışmalarına yol açabilir.
python3 -m venv .venv source .venv/bin/activate pip install -U anthropic
API anahtarı console.anthropic.com üzerinden alınır. Anahtarı asla kaynak koda gömme, .env dosyasında tut:
export ANTHROPIC_API_KEY="sk-ant-..."
API anahtarını Git'e commit etme. .gitignore içine .env ekle ve commit öncesi git-secrets veya truffleHog ile tarama yap.
Claude Sonnet 4.7 ile temel bir mesaj çağrısı şu şekildedir. messages.create endpoint'i 2026 itibarıyla tüm yeni özelliklerin (caching, thinking, tools) ortak giriş noktasıdır.
from anthropic import Anthropic
client = Anthropic()
response = client.messages.create(
model="claude-sonnet-4-7",
max_tokens=1024,
messages=[
{"role": "user", "content": "Alesta Web e-ticaret yazılımı nedir?"}
]
)
print(response.content[0].text)
print("Input tokens:", response.usage.input_tokens)
print("Output tokens:", response.usage.output_tokens)
Yanıt nesnesinin usage alanı her çağrıda token sayılarını döndürür. Bu sayılar üretim maliyet izlemesinde kritiktir.
Prompt caching, sistem prompt'u veya sabit bağlam bölümlerini Anthropic sunucularında 5 dakikaya kadar (genişletilebilir 1 saat) saklayan özelliktir. Cache hit durumunda input token maliyeti %90 oranında düşer.
response = client.messages.create(
model="claude-sonnet-4-7",
max_tokens=1024,
system=[
{
"type": "text",
"text": "Sen Alesta Web ekibinin Türkçe konuşan yazılım asistanısın..." * 500,
"cache_control": {"type": "ephemeral"}
}
],
messages=[{"role": "user", "content": "Vue 3.6 nasıl kurulur?"}]
)
print("Cache creation tokens:", response.usage.cache_creation_input_tokens)
print("Cache read tokens:", response.usage.cache_read_input_tokens)
İlk çağrıda cache_creation_input_tokens dolu, sonraki çağrılarda cache_read_input_tokens dolu olmalı. Cache miss oranı yüksek görünüyorsa breakpoint'lerin sırasını ve içeriğin değişkenliğini kontrol et.
cache_control kullanılabilir.Extended thinking, modelin yanıt üretmeden önce iç düşünme adımları çalıştırmasına izin verir. Karmaşık matematik, kod inceleme veya çok adımlı planlama için cevap kalitesi belirgin artar.
response = client.messages.create(
model="claude-sonnet-4-7",
max_tokens=8192,
thinking={
"type": "enabled",
"budget_tokens": 4096
},
messages=[{"role": "user", "content": "Bu fonksiyondaki güvenlik açığını bul..."}]
)
for block in response.content:
if block.type == "thinking":
print("Düşünme:", block.thinking)
elif block.type == "text":
print("Yanıt:", block.text)
Düşünme blokları kullanıcıya gösterilebilir veya gizlenebilir; Alesta Web dahili araçlarımızda thinking bloklarını sadece debug modunda gösteriyoruz.
Tool use, modelin harici fonksiyonları çağırmasına izin verir. 2026 itibarıyla Anthropic SDK paralel araç çağrılarını otomatik destekler.
tools = [{
"name": "get_weather",
"description": "Şehir için anlık hava durumunu döndürür",
"input_schema": {
"type": "object",
"properties": {
"city": {"type": "string"}
},
"required": ["city"]
}
}]
response = client.messages.create(
model="claude-sonnet-4-7",
max_tokens=1024,
tools=tools,
messages=[{"role": "user", "content": "İstanbul'da hava nasıl?"}]
)
if response.stop_reason == "tool_use":
for block in response.content:
if block.type == "tool_use":
print(f"Çağrılan araç: {block.name}, input: {block.input}")
Tool use ile SQL sorgu üretimi, Git operasyonları, e-ticaret sipariş arama gibi fonksiyon çağırma akışları kurabilirsin. alestaweb.com destek panelinde kullandığımız asistan aynı yapıyı temel alır.
Claude Sonnet 4.7, 1 milyon token bağlam destekli sürümüyle (claude-sonnet-4-7[1m]) tüm bir kod tabanını veya yüzlerce sayfalık PDF'i tek istekte işleyebilir. Standart 200K bağlam yerine 1M kullanmak için model ID'ye [1m] eki gerekir.
| Özellik / Feature | 200K Sürümü | 1M Sürümü |
|---|---|---|
| Max input | 200.000 token | 1.000.000 token |
| Maliyet (input) | Standart fiyat | 200K üstü 2x |
| Tipik kullanım | Sohbet, kod yazımı | Kod tabanı analizi, doküman özetleme |
429 Too Many Requests hatasında SDK'nın yerleşik exponential backoff mekanizması var. Yüksek hacimli iş yüklerinde anthropic.RateLimitError yakalanıp retry-after header'ı beklenmelidir.
529 Overloaded, Anthropic altyapısının geçici yoğunluk yanıtıdır. Cache breakpoint kullanan istekler bu hatadan daha az etkilenir.
Çağrıdan önce token sayımı için client.messages.count_tokens(...) endpoint'i kullanılabilir; üretimde fatura sürpriziyle karşılaşmamak için aktif iş yüklerinde token tahmini bağlamayı öneririz.
Claude Sonnet 4.7 ile prompt caching, extended thinking ve tool use'u bir araya getirmek üretim maliyetini ciddi şekilde düşürür. Alesta Web ekibi olarak yaptığımız ölçümlerde, doğru cache breakpoint stratejisiyle aylık API maliyetinin %60-80 düştüğünü gözlemledik.
Faydalı Linkler / Useful Links:
© 2026 AlestaWeb - Tüm hakları saklıdır.