Reasoning Effort

Reasoning destekli modellerde (örn. GPT-5 Codex serisi) gateway, akıl yürütme seviyesini iki yoldan ayarlamanıza izin verir:

Model slug suffix — openai/gpt-5.1-codex:high
Body alanı — { "reasoning": { "effort": "high" } }

İki yöntem birlikte verilirse body alanı önceliklidir.

Desteklenen seviyeler

Seviye	Suffix alias	Açıklama
`minimal`	`:min`	Akıl yürütme neredeyse devre dışı, en hızlı yanıt
`low`	`:low`	Düşük seviye, hızlı
`medium`	`:medium`, `:med`	Default, dengeli
`high`	`:high`	Yüksek seviye, daha derin analiz
`xhigh`	`:max`, `:xhigh`	En yüksek (yalnızca destekleyen modellerde)

Desteklenen seviyeler modele göre değişir. Desteklenmeyen bir seviye gönderilirse gateway 400 unsupported_capability döner.

Bilinmeyen suffix (:turbo, :fast gibi) 400 invalid_request_error döner.

Slug suffix örneği

curl https://llmtr.com/v1/responses \
  -H "Authorization: Bearer llmtr-your_key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-5.3-codex:max",
    "messages": [
      {"role": "user", "content": "Bu algoritmayı O(n) yap"}
    ]
  }'

:max, xhigh için bir alias’tır.

Body alanı örneği

curl https://llmtr.com/v1/responses \
  -H "Authorization: Bearer llmtr-your_key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "openai/gpt-5.1-codex",
    "reasoning": { "effort": "low", "summary": "concise" },
    "messages": [
      {"role": "user", "content": "Hızlı tek satır cevap"}
    ]
  }'

summary opsiyoneldir. Kısa veya detaylı reasoning özeti almak istediğinizde kullanabilirsiniz.

Python (OpenAI SDK)

from openai import OpenAI

client = OpenAI(
    base_url="https://llmtr.com/v1",
    api_key="llmtr-your_key",
)

response = client.responses.create(
    model="openai/gpt-5.1-codex",
    input="Refaktör et: bu fonksiyonu pure yap",
    reasoning={"effort": "high"},
)

print(response.output_text)

JavaScript (OpenAI SDK)

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://llmtr.com/v1",
  apiKey: process.env.LLMTR_API_KEY,
});

const response = await client.responses.create({
  model: "openai/gpt-5.3-codex:max",
  input: "O(n) optimizasyonunu açıkla",
});

console.log(response.output_text);

Faturalama etkisi

Daha yüksek reasoning seviyeleri genelde daha fazla çıktı tokenı ve daha uzun işlem süresi üretir. Bu yüzden maliyet ve gecikme artabilir.

Daha fazla bilgi için Responses API sayfasına bakın.