La voix : une identité, une marque ou un instrument ? ce soir sur ClubHouse

Surtout un vaste débat que je mène depuis 15ans et qui se tiendra sur ClubHouse ce soir de 21h à 23h animé par Fadhila Brahimi

Avec un regard Tech

Derrière la voix se cache 2 concepts qui évoluent en parallèle au gré des technologies. Je veux parler

  • de la Reconnaissance Vocale : comment transformer de l'audio en texte puis essayer de comprendre ce texte
  • de la Synthèse vocale : comment transformer du texte en audio puis essayer de lui donner une personnalité, une âme.

Je joue avec ces 2 concepts depuis 15ans car c'est une manière magique d'immerger les utilisateurs dans de nouvelles expériences qui parleront à l'imaginaire du cerveau droit.

Un peu d'historique

Tout a commencé avec le petit lapin Nabaztag créé par Rafi Haladjian qui a eu l"idée géniale de rendre accessible aux commun des mortels l'API de synthèse vocale de Nuance. Et ainsi les parents pouvait déporter leur autorité parental sur l'animal afin qu'il demande aux enfants d'aller se coucher !

S'en est suivi le projet SARAH qui d'après mes statistique semble avoir eu 50.000 utilisateurs à travers le monde et permettait de faire des commandes vocales pour piloter la maison. La magie par la voix et des technologie de Microsoft caché au fin fond de windows depuis 2005 !

Mais la technologie évolue très très vite. Depuis 2015 l'intelligence artificielle a pris le relais. Ce ne sont plus des algorithmes qui tente de jouer de la voix mais des réseaux de neurone a qui l'on apprends à écouter et à parler… reconnaitre des sentiments …

De nos jours …

L'on parle de NeuroVoice, des voix de synthèse généré très proche de voix réelles (ce ne sont plus des morceau d'audio mis bout à bout). En 2021 il est même possible de numériser sa propre voix ! J'y travaille !

Le sujet est tellement sensible que Microsoft demande de signer de son sang l'usage qu'il va être fait car les débordement son très rapide (usurpation d'identité, biométrie, etc …)

Et l'avenir ?

Facebook a déposé un brevet affin d'apprendre la voix de ses utilisateurs à partir de seulement quelques phrase afin de synthétiser leurs SMS et Messages. L'idée est de ne plus regarder son téléphone en conduisant mais d'entendre la voix de son interlocuteur.

Spotify a déposer un brevet pour reconnaitre l'humeur vocale de son interlocuteur et lui proposer des playlist en conséquence.

Ce n'est que le début ! Les usages sont multiples ! Call-center, Maison Intelligente, Avatars, etc … car au-delà de la voix il y a l'identité.

… en ce moment j'expérimente un jeu vocale 🙂

Alors ? une identité, une marque ou un instrument ?

Nous avons été doté d'un instrument qui fait partie de notre identité

  • car il nous caractérise par sa singularité
  • car il sert à communiquer des idées et des convictions.

"Nous" pouvant être un individu, une marque et maintenant un assistant conversationnel … a l'inverse, on ne créé jamais seulement une voix … mais une identité, un personnage et porte parole, etc …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.