API de Transcripción+ (beta)

https://api.transcripcionplus.com

Nuestra API REST tiene diferentes endpoints para transcribir audio a texto, con o sin diarización, generación de resumen y prompts personalizados.
Estos son los endpoints disponibles:

simple-transcription

Transcripción de audio a texto básica

  • Dada la url de un archivo de audio, devuelve una transcripción en formato de texto plano.

simple-transcription-summary

Transcripción de audio a texto con resumen

  • Dada la url de un archivo de audio, devuelve una transcripción en formato de texto plano.
  • Incluye un resumen del texto y puntos clave.

simple-transcription-custom-prompt

Transcripción de audio a texto con prompt personalizado

  • Dada la url de un archivo de audio, devuelve una transcripción en formato de texto plano.
  • Ejecuta análisis del texto en base al prompt proporcionado, utilizando el modelo gpt-4o-mini

diarized-transcription

Transcripción de audio a texto con diarización

  • Dada la url de un archivo de audio, devuelve una transcripción diarizada en formato json.
  • Identifica hablantes y marcas de tiempo.

diarized-transcription-summary

Transcripción de audio a texto con diarización, resumen y palabras clave

  • Dada la url de un archivo de audio, devuelve una transcripción diarizada en formato json.
  • Identifica hablantes y marcas de tiempo.
  • Incluye un resumen del texto y puntos clave.

diarized-transcription-custom-prompt

Transcripción de audio a texto con diarización y prompt personalizado

  • Dada la url de un archivo de audio, devuelve una transcripción diarizada en formato json.
  • Identifica hablantes y marcas de tiempo.
  • Ejecuta análisis del texto en base al prompt proporcionado, utilizando el modelo gpt-4o-mini
Está basada en el modelo Whisper de OpenAI y otras herramientas basadas en proyectos de código abierto, para ofrecer precisión en la transcripción, identificación de hablantes y marcas de tiempo.
En particular nuestro modelo está optimizado para transcribir audio en español chileno y español latinoamericano.

Especificaciones técnicas

La URL base es: https://api.transcripcionplus.com

Las peticiones se realizan de forma asíncrona, por lo tanto cada petición retornará un id para poder hacer seguimiento al estado de la misma.

También puedes pasar un callbackUrl, de manera opcional, para que se envíe el resultado de la petición a dicha url, en formato json, con un request POST.

Actualmente, se permite un máximo de 250 peticiones pendientes simultáneas por usuario. Si llegas al máximo, deberás esperar a que alguna de tus peticiones pendientes sea completada antes de realizar una nueva.

Autenticación

La API utiliza un token de acceso para autenticar las peticiones. Deberás generar un token en la sección "API" de tu cuenta de usuario.

Una vez hayas generado un token, deberás incluirlo en el encabezado de cada petición a la API:

Authorization: Bearer <token>

Endpoints:

Consultar estado de una petición

Dado un id de petición, devuelve el estado de la petición.

Método URL Parámetros Respuesta
GET /v1/status/:id  
status - estado de la petición (pending, completed, failed, timeout)
endpoint - endpoint consultado
output - resultado de la petición (opcional, solo disponible cuando el estado es completed)
error - mensaje de error (opcional, solo disponible cuando el estado es failed)
 

Transcripción simple

Dado la url de un archivo de audio, devuelve una transcripción en formato de texto plano.

Método URL Parámetros Respuesta
POST /v1/simple-transcription
fileUrl - url del audio a transcribir (Debe ser accesible desde internet)
language - idioma del audio (opcional, por defecto es 'es')
callbackUrl - url a la que se enviará el resultado de la petición (opcional)
id - id de la petición
endpoint - endpoint consultado
status - estado de la petición (pending, completed, failed, timeout)

Transcripción simple con resumen

Dado la url de un archivo de audio, devuelve una transcripción en formato de texto plano, y un resumen del texto.

El resumen estará dado en formato json con los siguientes campos:

Método URL Parámetros Respuesta
POST /v1/simple-transcription-summary
fileUrl - url del audio a transcribir (Debe ser accesible desde internet)
language - idioma del audio (opcional, por defecto es 'es')
callbackUrl - url a la que se enviará el resultado de la petición (opcional)
id - id de la petición
endpoint - endpoint consultado
status - estado de la petición (pending, completed, failed, timeout)

Transcripción simple con prompt personalizado

Dado la url de un archivo de audio, devuelve una transcripción en formato de texto plano, y ejecuta un prompt personalizado sobre el texto, para devolver un json con el resultado.

Método URL Parámetros Respuesta
POST /v1/simple-transcription-custom-prompt
fileUrl - url del audio a transcribir (Debe ser accesible desde internet)
prompt - prompt para el análisis del audio
language - idioma del audio (opcional, por defecto es 'es')
callbackUrl - url a la que se enviará el resultado de la petición (opcional)
id - id de la petición
endpoint - endpoint consultado
status - estado de la petición (pending, completed, failed, timeout)

Transcripción diarizada

Dado la url de un archivo de audio, devuelve una transcripción con diarización. Identificando hablantes y marcas de tiempo.

Método URL Parámetros Respuesta
POST /v1/diarized-transcription
fileUrl - url del audio a transcribir (Debe ser accesible desde internet)
language - idioma del audio (opcional, por defecto es 'es')
callbackUrl - url a la que se enviará el resultado de la petición (opcional)
id - id de la petición
endpoint - endpoint consultado
status - estado de la petición (pending, completed, failed, timeout)

Transcripción diarizada con resumen

Dado la url de un archivo de audio, devuelve una transcripción con diarización, y un resumen del texto.

El resumen estará dado en formato json con los siguientes campos:

Método URL Parámetros Respuesta
POST /v1/diarized-transcription-summary
fileUrl - url del audio a transcribir (Debe ser accesible desde internet)
language - idioma del audio (opcional, por defecto es 'es')
callbackUrl - url a la que se enviará el resultado de la petición (opcional)
id - id de la petición
endpoint - endpoint consultado
status - estado de la petición (pending, completed, failed, timeout)

Transcripción diarizada con prompt personalizado

Dado la url de un archivo de audio, devuelve una transcripción con diarización, y ejecuta un prompt personalizado sobre el texto, para devolver un json con el resultado.

Método URL Parámetros Respuesta
POST /v1/diarized-transcription-custom-prompt
fileUrl - url del audio a transcribir (Debe ser accesible desde internet)
prompt - prompt para el análisis del audio
language - idioma del audio (opcional, por defecto es 'es')
callbackUrl - url a la que se enviará el resultado de la petición (opcional)
id - id de la petición
endpoint - endpoint consultado
status - estado de la petición (pending, completed, failed, timeout)
WhatsApp