Reconnaissance Vocale: la France a un retard stratégique

Avec le projet SARAH je suis de prêt tout ce qui se passe autour de la reconnaissance et de la synthèse vocale. Je constate que la France est en train de progressivement se prendre une méga claque dans la figure.

Dans la reconnaissance vocale il y a 2 étapes:

1. Le Speech2Text : convertir de l’audio dans du texte.

Le sujet existe depuis 15ans mais n’est fiable que depuis quelques années. Pour que ça marche il faut:

  • Un algorithme d’intelligence artificielle (réseaux de neuronnes)
  • Un apprentissage sur un énorme dataset audio

En 2015, Appel/SIRI, Google/Now, Microsoft/Cortana/Oxford, Amazon/Echo font correctement le boulot en stramant l’audio sur des serveurs dédiés. MAIS cela marche moins bien en Français.

2. La sémantique : comprendre le texte

C’est bien beau d’avoir une String (du texte) mais il faut ensuite comprendre le sens de la phrase. Et là c’est le drame car c’est très dépendant (pour le moment) de la langue.

L’université de Stanford propose depuis quelques années des librairies d’analyse sémantique en Anglais. Ces travaux ont permis aux GAFA d’avancer sur le sujet. Je parlais récemment de LUIS disponible que en Anglais.

En Français, la sémantique est bien plus compliquée car nous avons des doubles négations, des faux amis, des périphrases, etc …

Un gros retard stratégique et économique ?

Oui car la techno arrive maintenant dans le business:

  • Youtube fait du transcript
  • SIRI devient un assistant intelligent
  • Amazon Echo gère les courses de la maison
  • Les voitures ont besoin de reco vocale
  • Et même des startup se lancent dans la course

Au final un décalage en terme d’usage se creuse entre les US et la France. Un peu comme si le SmartPhone n’était présent qu’au US et que nous soyons resté au Minitel. C’est inquiétant car ce n’est pas un problème de techno mais de langue.

J’espère vraiment qu’une approche réseaux de neurones permettra de rattraper ce retard…

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *