İçeriğe geç

Chat Completions

LLMTR gateway, OpenAI Chat Completions API’sine uyumludur. Tüm istekler https://llmtr.com/v1/chat/completions adresine POST edilir.

POST /v1/chat/completions
Authorization: Bearer sk_your_key
Content-Type: application/json
AlanTipZorunluAçıklama
modelstringevetCanonical model ID (örn. openai/gpt-4o)
messagesarrayevetOpenAI messages formatı
streambooleanhayırtrue ise SSE akışı döner
temperaturenumberhayır0-2 aralığında, default model’e göre değişir
max_tokensintegerhayırÇıktı token üst sınırı
top_pnumberhayırNucleus sampling
frequency_penaltynumberhayır-2 ile 2 arası
presence_penaltynumberhayır-2 ile 2 arası
stopstring/arrayhayırDurdurma dizileri
response_formatobjecthayır{ "type": "json_object" } destekleyen modellerde
toolsarrayhayırFunction calling (destekleyen modellerde)
tool_choicestring/objecthayırauto, none veya belirli tool
Terminal window
curl https://llmtr.com/v1/chat/completions \
-H "Authorization: Bearer sk_your_key" \
-H "Content-Type: application/json" \
-d '{
"model": "openai/gpt-4o",
"messages": [
{"role": "system", "content": "You are a concise assistant."},
{"role": "user", "content": "What is LLMTR?"}
],
"temperature": 0.3,
"max_tokens": 200
}'

Başarılı yanıt OpenAI formatıyla birebir aynıdır:

{
"id": "chatcmpl-xxx",
"object": "chat.completion",
"created": 1739200000,
"model": "openai/gpt-4o",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "LLMTR is a unified gateway..."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 24,
"completion_tokens": 52,
"total_tokens": 76
}
}

Tüm modeller canonical olarak provider/model şeklinde referanslanır:

  • openai/gpt-4o
  • anthropic/claude-sonnet-4.5
  • google/gemini-2.5-flash
  • deepseek/deepseek-v4-flash
  • mistral/mistral-large-latest

Tüm katalog için dashboard model listesini veya /api/models endpoint’ini kullanın.

Bazı sağlayıcılar ek body alanları veya özel seçenekler destekler. Desteklenen alanları doğrudan isteğinize ekleyebilirsiniz.

mimo/mimo-v2-pro, mimo/mimo-v2-omni, mimo/mimo-v2-flash modelleri.

Web aramasını etkinleştirme. İki yöntem de kullanılabilir:

// Yöntem 1: Tool alanı ile
{ "tools": [{ "type": "web_search" }] }
// Yöntem 2: Body alanı ile
{ "webSearchEnabled": true }

Web araması kullanılan isteklerde ek sağlayıcı ücretleri oluşabilir. Üretim trafiği göndermeden önce ilgili modelin fiyatını kontrol edin.

Thinking kontrolü. Destekleyen modellerde body alanına thinking ekleyerek davranışı ayarlayabilirsiniz:

{ "thinking": { "type": "enabled" } } // veya "disabled"
HTTPerror.typeAnlamı
400invalid_request_errorGeçersiz parametre / eksik alan
401auth_errorGeçersiz veya süresi dolmuş API anahtarı
403forbiddenBu model için yetki yok
429rate_limit_exceededRate limit aşıldı
500internal_errorGateway iç hatası
502provider_errorSağlayıcı tarafında hata

Detay için Hatalar bölümüne bakın.