İçeriğe geç

Görsel Girdi

Vision destekleyen modellere görsel göndermek için image_url content-part kullanın.

Terminal window
curl https://llmtr.com/v1/chat/completions \
-H "Authorization: Bearer llmtr-your_key" \
-H "Content-Type: application/json" \
-d '{
"model": "google/gemini-2.5-flash",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Bu fotoğrafta ne görüyorsun?" },
{
"type": "image_url",
"image_url": {
"url": "https://example.com/photo.jpg"
}
}
]
}
]
}'

Aynı user mesajında birden fazla image_url parçası gönderebilirsiniz. Aynı konuşmanın sonraki user mesajlarında da yeni görseller eklenebilir.

{
"model": "google/gemini-2.5-flash",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Bu iki görseli karşılaştır." },
{ "type": "image_url", "image_url": { "url": "https://example.com/front.jpg" } },
{ "type": "image_url", "image_url": { "url": "https://example.com/back.jpg" } }
]
},
{
"role": "assistant",
"content": "İlk karşılaştırmayı hazırladım."
},
{
"role": "user",
"content": [
{ "type": "text", "text": "Bu üçüncü görseli de aynı bağlamda değerlendir." },
{ "type": "image_url", "image_url": { "url": "https://example.com/detail.jpg" } }
]
}
]
}
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,/9j/4AAQSkZJRgABAQ..."
}
}
{
"type": "image_url",
"image_url": {
"url": "https://example.com/chart.png",
"detail": "high"
}
}

detail değerleri: low, high, auto.

Büyük dosyalar için önce Files API’ye yükleyin, dönen file_id’yi kullanın:

{
"type": "input_file",
"input_file": {
"file_id": "file_xxx",
"mime_type": "image/jpeg"
}
}
  • Bir mesajdaki content part sayısı en fazla 16’dır. Metin, görsel, ses ve dosya parçaları bu toplamın içindedir.
  • Inline base64 görseller JSON body limitine dahildir. Büyük veya tekrar kullanılacak medya için Files API kullanın.
  • image_url, vision/chat girdisidir. /v1/images/generations içindeki image_url alanı image generation referansı içindir ve ayrı endpoint semantiğine sahiptir.
  • JPEG veya PNG, < 5 MB
  • Genişlik/yükseklik 512-2048 px arası
  • Metin okutacaksanız (OCR) yüksek kontrast ve keskin çözünürlük

Vision’lı modelleri katalogdan filtreleyin:

Terminal window
curl "https://llmtr.com/api/models?modality=image" \
-H "Authorization: Bearer llmtr-your_key"