İçeriğe geç

Ses Girdi

Audio input destekleyen modellere ses vermek için input_audio content-part kullanın.

Terminal window
curl https://llmtr.com/v1/chat/completions \
-H "Authorization: Bearer sk_your_key" \
-H "Content-Type: application/json" \
-d '{
"model": "google/gemini-2.5-flash",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Bu ses kaydını yazıya dök ve kısaca özetle." },
{
"type": "input_audio",
"input_audio": {
"data": "BASE64_WAV_DATA",
"format": "wav"
}
}
]
}
]
}'

Desteklenen değerler:

  • wav
  • mp3
  • flac
  • ogg
  • webm
  • Inline base64 ile < 1 MB önerilir.
  • Uzun ses için önce Files API ile yükleyin, file_id üzerinden referans verin.
{
"type": "input_file",
"input_file": {
"file_id": "file_xxx",
"mime_type": "audio/wav"
}
}

Ses girdisi destekleyen modeller şu an Google Gemini ailesindedir. Katalogdan kontrol:

Terminal window
curl "https://llmtr.com/api/models?modality=audio" \
-H "Authorization: Bearer sk_your_key"