Comment les entreprises interagissent-elles avec les données audio ? La startup française Gladia propose une API de transcription audio qui pourrait révolutionner ce domaine. Serait-ce l’alternative aux API de transcription audio des grands acteurs du cloud tels que Google, Amazon et Microsoft ?
Passons en revue aujourd’hui la société française Gladia qui développe une API de transcription audio : une technologie qui promet d’être à la fois plus performante et moins onéreuse que celles existantes. Cependant, elle est déjà confrontée à une concurrence sérieuse : Google, Amazon et Microsoft ont tous déjà des API de transcription audio propriétaires. Peut-elle réellement rivaliser avec ces géants du numérique ?
Gladia se base sur le modèle de transcription Whisper d’OpenAI et y apporte des améliorations significatives en termes de vitesse, de performance et de fiabilité pour les langues multilingues. Mais ces améliorations suffisent-elles pour se démarquer de la concurrence ?
Avec son API de transcription audio innovante, Gladia promet une expérience supérieurer pour un coût réduit.
Il faut également mentionner que Gladia a pris soin d’améliorer certains aspects de Whisper pour éviter les problèmes d’hallucination : un problème récurrent qui fait parfois apparaître des phrases standardisées à un moment où elles n’apparaissent pas dans l’audio. La startup a également développé des algorithmes de pré- et post-traitement des données pour améliorer encore les résultats de la transcription.
Les tarifs de Gladia sont particulièrement compétitifs, avec un coût de 0,61 $ pour transcrire une heure d’audio et une vitesse de traitement d’environ 1 minute. Son API est capable de détecter plusieurs langues et de passer de l’une à l’autre si nécessaire, tout en insérant automatiquement une ponctuation et un formatage correct. Quelle qualité de résultats peut-on attendre de ces promesses ?
Notre expérience avec l’API de Gladia a été très positive : le processus de transcription était rapide et les résultats étaient de grande qualité, bien que pas parfaits. Le logiciel a correctement compris les acronymes et les termes techniques et s’est avéré bien plus performant que les API actuellement proposées par Google ou Azure. Gladia peut-elle continuer à maintenir cette qualité à mesure que sa base d’utilisateurs grandit ?
En résumé, Gladia constitue une avancée prometteuse dans le domaine des API de transcription audio, offrant aux entreprises une alternative aux solutions actuellement sur le marché. Si elle continue sur sa lancée, Gladia pourrait devenir le choix préféré pour les entreprises qui cherchent à exploiter les données audio et à générer du contenu à partir de ces données. Reste à voir si elle pourra tenir bon face à la concurrence des géants du numérique.
Source : Techcrunch