İçeriğe geç

Multimodal Genel Bakış

Destekleyen modellerde messages[].content alanını string yerine OpenAI uyumlu content-part listesi olarak gönderebilirsiniz. Platform şu anda şu part türlerini kabul eder:

text  image_url  input_audio 

input_file

Modal yetenekleri katalog üzerinden kontrol etmek için:

Terminal window
curl https://llmtr.com/api/models \
-H "Authorization: Bearer sk_your_key" \
| jq '.data[] | select(.canonicalId=="google/gemini-2.5-flash") | .modalities'
{
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Bu görselde ne var?" },
{
"type": "image_url",
"image_url": { "url": "https://..." }
}
]
}
]
}
  • Görsel ve ses verisi JSON gövdesi üzerinden iletilir. Uzak URL kullanmak base64 inline’a göre daha güvenlidir.
  • Inline base64 ses kliplerini kısa tutun (< 1 MB önerilir).
  • Büyük dosyalar, PDF, video ve reusable medya için Files API kullanın.