API de Transcripción+

Nuestra API rest tiene diferentes endpoints para transcribir audio a texto, con o sin diarización, generación de resumen y prompts personalizados.
Estos son los endpoints disponibles:

simple-transcription

Transcripción de audio a texto básica

  • Dado un archivo de audio, devuelve una transcripción en formato de texto plano.
  • Retorna un JobId para poder hacer seguimiento del estado de la petición.

diarized-transcription

Transcripción de audio a texto con diarización

  • Dado un archivo de audio, devuelve una transcripción diarizada en formato json.
  • Retorna un JobId para poder hacer seguimiento del estado de la petición.
  • Identifica hablantes y asigna un id a cada uno.
  • Marcas de tiempo para cada intervención.

diarized-transcription-summary

Transcripción de audio a texto con diarización, resumen y palabras clave

  • Dado un archivo de audio, devuelve una transcripción diarizada en formato json.
  • Retorna un JobId para poder hacer seguimiento del estado de la petición.
  • Identifica hablantes y asigna un id a cada uno.
  • Marcas de tiempo para cada intervención.
  • Incluye un resumen del texto y palabras clave, generados utilizando el modelo gpt-4o-mini

diarized-transcription-custom-prompt

Transcripción de audio a texto con diarización y prompt personalizado

  • Dado un archivo de audio, devuelve una transcripción diarizada en formato json.
  • Retorna un JobId para poder hacer seguimiento del estado de la petición.
  • Identifica hablantes y asigna un id a cada uno.
  • Marcas de tiempo para cada intervención.
  • Ejecuta análisis del texto en base al prompt proporcionado, utilizando el modelo gpt-4o-mini

¿Cómo funciona?

Nuestra API está basada en el modelo Whisper de OpenAI y otras herramientas basadas en proyectos de código abierto, para ofrecer precisión en la transcripción, identificación de hablantes y marcas de tiempo.
En particular nuestro modelo está optimizado para transcribir audio en español chileno y español latinoamericano.

Documentación

Próximamente estaremos publicando la documentación detallada. Por ahora puedes contactarnos para poder aclarar dudas y obtener un token de acceso para hacer una prueba gratis.
WhatsApp