[Podcast] épisode 10 : KALDI, une boîte à outils pour construire un SRAP
La reconnaissance de la parole est une technologie indispensable aux nouvelles solutions d’interaction vocale. Dans l’optique de construire un Système de Reconnaissance Automatique de la Parole (SRAP) qui soit performant, il est nécessaire de se doter d’une boîte à outils qui soit à la fois flexible et extensible. Parmi les solutions qui permettent de concevoir un SRAP, KALDI est une solution open source qui répond à ces deux critères et que le groupe Axys a également retenu dans le cadre de l’offre Smart Customer Care Insight.
Afin de mieux comprendre de cette boîte à outils, il est nécessaire de savoir qui est à l’origine de KALDI ? Quels en sont les composants essentiels ? Qu’est-ce qu’un modèle de langage ? Comment en mesurer la qualité intrinsèque ? Qu’est-ce qu’un modèle acoustique ? Quels indicateurs utilise-t-on afin d’évaluer le taux de reconnaissance d’un SRAP après décodage ? Peut-on utiliser KALDI pour d’autres usages que la transcription textuelle automatique ? Quelles sont les solutions concurrentes à KALDI ? Quel est l’avenir d’une boîte à outils comme KALDI ?
Autant de questions auxquelles Carole Lailler & Jean-Luc Marini tenteront d’apporter une réponse lors de ce nouveau Labpod.
Texte intégral de l’échange disponible ici.