İçeriğe geç

Multimodal Genel Bakış

Destekleyen modellerde messages[].content alanını string yerine OpenAI uyumlu content-part listesi olarak gönderebilirsiniz. Platform şu anda şu part türlerini kabul eder:

text  image_url  input_audio 

input_file

Modal yetenekleri katalog üzerinden kontrol etmek için tek bir model:

Terminal window
curl https://llmtr.com/api/models \
-H "Authorization: Bearer llmtr-your_key" \
| jq '.data[] | select(.canonicalId=="google/gemini-2.5-flash") | .modalities'

Bir operasyonu (görsel üretim, embeddings, TTS, vb.) destekleyen tüm modelleri listelemek için operation filtresini kullanın:

Terminal window
# Görsel üretebilen tüm modeller
curl "https://llmtr.com/api/models?operation=IMAGES_GENERATIONS" \
-H "Authorization: Bearer llmtr-your_key"
# Embedding modelleri
curl "https://llmtr.com/api/models?operation=EMBEDDINGS" \
-H "Authorization: Bearer llmtr-your_key"
# Text-to-speech modelleri
curl "https://llmtr.com/api/models?operation=AUDIO_SPEECH" \
-H "Authorization: Bearer llmtr-your_key"

Bir model yanlış endpoint’e gönderildiğinde dönen 400 unsupported_operation yanıtı error.details.supported_endpoints ve error.details.suggested_endpoint alanlarıyla doğru rotayı söyler. Bkz. Hatalar.

{
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Bu görselde ne var?" },
{
"type": "image_url",
"image_url": { "url": "https://..." }
}
]
}
]
}
  • Görsel ve ses verisi JSON gövdesi üzerinden iletilir. Uzak URL kullanmak base64 inline’a göre daha güvenlidir.
  • Inline base64 ses kliplerini kısa tutun (< 1 MB önerilir).
  • Büyük dosyalar, PDF, video ve reusable medya için Files API kullanın.