Comment DeepMind révolutionne le text to speech avec l’IA

La société de recherche en deep learning a une nouvelle fois démontré l’étendue de son savoir-faire avec un nouveau modèle de génération sonore imbattable.

Trois chercheurs du laboratoire de DeepMind, Aäron van den Oord, Heiga Zen et Sander Dieleman ont conçu un modèle d’entraînement pour machines qui leur permettrait de générer automatiquement une diversité de sons en se basant sur des ondes brutes. Et par diversité, la société entend du discours oral aux notes de musiques. Leur modèle permettrait notamment de réduire l’écart entre le discours généré par la machine et celui d’un véritable être humain d’environ 50%.

Des exemples bluffant dans l’article !

Source : Comment DeepMind révolutionne le text to speech avec l’IA

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *