Ses Girdi
Audio input destekleyen modellere ses vermek için input_audio content-part kullanın.
curl https://llmtr.com/v1/chat/completions \ -H "Authorization: Bearer sk_your_key" \ -H "Content-Type: application/json" \ -d '{ "model": "google/gemini-2.5-flash", "messages": [ { "role": "user", "content": [ { "type": "text", "text": "Bu ses kaydını yazıya dök ve kısaca özetle." }, { "type": "input_audio", "input_audio": { "data": "BASE64_WAV_DATA", "format": "wav" } } ] } ] }'Format alanı
Section titled “Format alanı”Desteklenen değerler:
wavmp3flacoggwebm
Boyut sınırı
Section titled “Boyut sınırı”- Inline base64 ile < 1 MB önerilir.
- Uzun ses için önce Files API ile yükleyin,
file_idüzerinden referans verin.
File ID ile
Section titled “File ID ile”{ "type": "input_file", "input_file": { "file_id": "file_xxx", "mime_type": "audio/wav" }}Desteklenen modeller
Section titled “Desteklenen modeller”Ses girdisi destekleyen modeller şu an Google Gemini ailesindedir. Katalogdan kontrol:
curl "https://llmtr.com/api/models?modality=audio" \ -H "Authorization: Bearer sk_your_key"