Multimodal Genel Bakış

Destekleyen modellerde messages[].content alanını string yerine OpenAI uyumlu content-part listesi olarak gönderebilirsiniz. Platform şu anda şu part türlerini kabul eder:

text image_url input_audio

input_file

Ne zaman kullanılır?

Modal yetenekleri katalog üzerinden kontrol etmek için tek bir model:

curl https://llmtr.com/api/models \
  -H "Authorization: Bearer llmtr-your_key" \
  | jq '.data[] | select(.canonicalId=="google/gemini-2.5-flash") | .modalities'

Bir operasyonu (görsel üretim, embeddings, TTS, vb.) destekleyen tüm modelleri listelemek için operation filtresini kullanın:

# Görsel üretebilen tüm modeller
curl "https://llmtr.com/api/models?operation=IMAGES_GENERATIONS" \
  -H "Authorization: Bearer llmtr-your_key"

# Embedding modelleri
curl "https://llmtr.com/api/models?operation=EMBEDDINGS" \
  -H "Authorization: Bearer llmtr-your_key"

# Text-to-speech modelleri
curl "https://llmtr.com/api/models?operation=AUDIO_SPEECH" \
  -H "Authorization: Bearer llmtr-your_key"

Bir model yanlış endpoint’e gönderildiğinde dönen 400 unsupported_operation yanıtı error.details.supported_endpoints ve error.details.suggested_endpoint alanlarıyla doğru rotayı söyler. Bkz. Hatalar.

Content-part yapısı

{
  "messages": [
    {
      "role": "user",
      "content": [
        { "type": "text", "text": "Bu görselde ne var?" },
        {
          "type": "image_url",
          "image_url": { "url": "https://..." }
        }
      ]
    }
  ]
}

Sınırlar ve notlar

Görsel ve ses verisi JSON gövdesi üzerinden iletilir. Uzak URL kullanmak base64 inline’a göre daha güvenlidir.
Inline base64 ses kliplerini kısa tutun (< 1 MB önerilir).
Büyük dosyalar, PDF, video ve reusable medya için Files API kullanın.

Multimodal Genel Bakış

Ne zaman kullanılır?

Content-part yapısı

Sınırlar ve notlar

Alt sayfalar