İçeriğe geç

Reasoning Effort

Reasoning destekli modellerde (örn. GPT-5 Codex serisi) gateway, akıl yürütme seviyesini iki yoldan ayarlamanıza izin verir:

  1. Model slug suffixopenai/gpt-5.1-codex:high
  2. Body alanı{ "reasoning": { "effort": "high" } }

İki yöntem birlikte verilirse body alanı önceliklidir.

SeviyeSuffix aliasAçıklama
minimal:minAkıl yürütme neredeyse devre dışı, en hızlı yanıt
low:lowDüşük seviye, hızlı
medium:medium, :medDefault, dengeli
high:highYüksek seviye, daha derin analiz
xhigh:max, :xhighEn yüksek (yalnızca destekleyen modellerde)

Desteklenen seviyeler modele göre değişir. Desteklenmeyen bir seviye gönderilirse gateway 400 unsupported_capability döner.

Bilinmeyen suffix (:turbo, :fast gibi) 400 invalid_request_error döner.

Terminal window
curl https://llmtr.com/v1/responses \
-H "Authorization: Bearer sk_your_key" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-5.3-codex:max",
"messages": [
{"role": "user", "content": "Bu algoritmayı O(n) yap"}
]
}'

:max, xhigh için bir alias’tır.

Terminal window
curl https://llmtr.com/v1/responses \
-H "Authorization: Bearer sk_your_key" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-5.1-codex",
"reasoning": { "effort": "low", "summary": "concise" },
"messages": [
{"role": "user", "content": "Hızlı tek satır cevap"}
]
}'

summary opsiyoneldir. Kısa veya detaylı reasoning özeti almak istediğinizde kullanabilirsiniz.

from openai import OpenAI
client = OpenAI(
base_url="https://llmtr.com/v1",
api_key="sk_your_key",
)
response = client.responses.create(
model="openai/gpt-5.1-codex",
input="Refaktör et: bu fonksiyonu pure yap",
reasoning={"effort": "high"},
)
print(response.output_text)
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://llmtr.com/v1",
apiKey: process.env.LLMTR_API_KEY,
});
const response = await client.responses.create({
model: "openai/gpt-5.3-codex:max",
input: "O(n) optimizasyonunu açıkla",
});
console.log(response.output_text);

Daha yüksek reasoning seviyeleri genelde daha fazla çıktı tokenı ve daha uzun işlem süresi üretir. Bu yüzden maliyet ve gecikme artabilir.

Daha fazla bilgi için Responses API sayfasına bakın.