Comment DeepMind révolutionne le text to speech avec l’IA

Jean-Philippe Encausse

septembre 9, 2016

La société de recherche en deep learning a une nouvelle fois démontré l’étendue de son savoir-faire avec un nouveau modèle de génération sonore imbattable.

Trois chercheurs du laboratoire de DeepMind, Aäron van den Oord, Heiga Zen et Sander Dieleman ont conçu un modèle d’entraînement pour machines qui leur permettrait de générer automatiquement une diversité de sons en se basant sur des ondes brutes. Et par diversité, la société entend du discours oral aux notes de musiques. Leur modèle permettrait notamment de réduire l’écart entre le discours généré par la machine et celui d’un véritable être humain d’environ 50%.

Des exemples bluffant dans l’article !

Source : Comment DeepMind révolutionne le text to speech avec l’IA

Comment DeepMind révolutionne le text to speech avec l’IA

Partager :

Laisser un commentaire Annuler la réponse.