SARAH un terrain de jeu pour les Data Scientists
Voici quelques réflexions suites au sondage précédent: SARAH dans la Recherche Académique et à un talk que j’ai donné au Meetup Paris Machine Learning.
SARAH est un framework sur lequel plusieurs métiers peuvent échanger.
La communauté SARAH est majoritairement composée de profils « domoticien » qui maîtrisent le sujet hardware et utilisent SARAH pour piloter tous les équipements en NUI (Native User Interface).
Je pense que SARAH pourrait aussi être un terrain de jeu pour les Data Scientist, les Web Designers, … qui pourraient concevoir des plugins ou meta-plugin intelligents.
L’énorme avantage de SARAH étant sa communauté intéressée par ces nouveaux challenges et titiller GoogleNow, …
Quelques exemples
1. Le service Whisperies est une platforme collaborative ou des gens inventent et partagent des histoires à raconter aux enfants. Il serait très simple d’enrichir la timeline des histoires pour rajouter des événements avec les objets physiques: « Le dragon souffle du feu » > Lampes en Rouge + Odeur de souffre…
2. La recherche fondamentale sur la reconnaissance vocale nécessite un grand nombre d’échantillons de voix. SARAH génère dans ses logs
- l’audio des commandes vocales,
- la commande correspondante
- et la confidence de Microsoft.
Il est alors très simple pour un plugin de récupérer ces échantillons sur une platforme validée par la CNIL pour faire avancer la recherche. Mais pour que la communauté accepte de jouer le jeu il faudrait :
- Communiquer sur le projet dans la même logique que les projets Kickstarter qui communiquent sur leurs avancées pour remercier les gens
- Faire un plugin ludique de type Quizz, Jeopardy, … à questions fermées
3. Dans la même logique certains chercheurs travaillent sur l’éducation et l’apprentissage des connaissances. On peut donc imaginer:
- Un plugin jeu/quizz avec analyse des réponses
- Un plugin quizz pour apprendre les leçons en retrant de l’école
- Un plugin pour apprendre les tables de multiplication
Cela existe déjà avec les applications Android, mais dans notre cas SARAH améliore l’interaction avec la famille. Le jeu de plateau 3.0
4. Il y aurait des choses à faire pour enrichir le client:
- Analyse du stresse de la voix
- Biométrie sur la voix
- Mini Shazam comme le fait Prizm avec du finger printing et Echo Nest
- Reconnaissance d’objets: un sujet très compliqué ! Localement SARAH intègre Predator, CMT, SURF, … mais ça ne marche pas bien
5. SARAH intègre un moteur de règle à la IFTTT, je pense qu’on pourrait auto générer les règles.
« Tiens tous les jours, il allume la lampe A et la TV en gros à 18h ».
Pour cela il faudrait partager l’heure et la fonction des plugins pour appliquer des algos de machine learning.
Je me suis intéressé à Sarah pour le côté domotique mais surtout j’aimerai que Sarah apprenne des choses aux gens. L’idée de l’association Whisperies + SARAH est géniale. Il serait intéressant que les « écrivains » puissent transmettre leur vision du scénario facilement et que SARAH interprete tout directement sans devoir repasser derrière.
Bref, que de bonnes perspectives, j’ai hâte !!! 😉
Le cas de Whisperies est relativement simple, il « suffit » que a tel timecode le lecteur whisperies envoie une requête http à SARAH (dans mon exemple j’avais fais Youtube)
J’imagine que la saisie de l’action se ferait au moment du dépôt du dessin
– Ca pourrait être déjà du Text2Speech
– Et des action générique Lampe « rouge » qui ensuite serait interprété par le plugin pour appeler Les Philiphs HUE ou les LIFX ou les …