Ses Girdi

Audio input destekleyen modellere ses vermek için input_audio content-part kullanın.

Örnek

curl https://llmtr.com/v1/chat/completions \
  -H "Authorization: Bearer llmtr-your_key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "google/gemini-2.5-flash",
    "messages": [
      {
        "role": "user",
        "content": [
          { "type": "text", "text": "Bu ses kaydını yazıya dök ve kısaca özetle." },
          {
            "type": "input_audio",
            "input_audio": {
              "data": "BASE64_WAV_DATA",
              "format": "wav"
            }
          }
        ]
      }
    ]
  }'

Format alanı

Desteklenen değerler:

wav
mp3
flac
ogg
webm

Boyut sınırı

Inline base64 ile < 1 MB önerilir.
Uzun ses için önce Files API ile yükleyin, file_id üzerinden referans verin.

File ID ile

{
  "type": "input_file",
  "input_file": {
    "file_id": "file_xxx",
    "mime_type": "audio/wav"
  }
}

Desteklenen modeller

Ses girdisi destekleyen modeller şu an Google Gemini ailesindedir. Katalogdan kontrol:

curl "https://llmtr.com/api/models?modality=audio" \
  -H "Authorization: Bearer llmtr-your_key"