Sébastien de la Bastie, Invoxia : "La voix est beaucoup plus riche que le texte"


Directeur général d'invoxia, Sébastien de la Bastie revient sur les ambitions de ce spécialiste de l'audio connecté qui entend bien faire de la voix une interface aussi populaire qu'un écran tactile



Comment peut on présenter Invoxia ? Peut on encore parler d’équipementier télécom ? Pourquoi vous focaliser sur les interfaces vocales ?  
 
SdB - invoxia fait de l’audio connecté. Dans sa forme la plus simple, c’est un téléphone. A ses débuts, invoxia a réinventé ce téléphone en l'associant la meilleure connection - le réseau haut débit -, la meilleur interface - le smartphone - et le meilleur son - la techno in vivo acoustic. C’est ce qui a donné naissance aux postes de conférence audioffice, utilisés aujourd’hui un peu partout de le monde en entreprise ou en home office.
 
Vous avez récemment lancé Triby, un appareil pour révolutionner la communication domestique. Quel a été l’accueil des consommateurs ?
 
SdB - Le public a très vite été séduit par le design, la qualité du son et la simplicité. A l’usage, nos clients sont accros des doodles qu’ils envoient sur leur frigo, du drapeau qui sort tout seul quand ils reçoivent un message, et surtout, ils savent maintenant qu’on peut passer des coups de fil à la maison avec un main libre bien meilleur que le systèmes de conférence qu’ils ont au bureau…
 
Pour Triby, vous avez bénéficié d’un investissement d’Amazon. Quelle est l’idée ? lancer les fonctionnalités d’Amazon Echo sur votre propre terminal ?
 
SdB - L’énorme succès d’Amazon Echo est du essentiellement au fait qu’on peut l’activer à la voix même lorsqu’il est à l’autre bout de la pièce et converser naturellement avec lui. C’est une différence énorme par rapports aux solutions logées dans un smartphone, une tablette ou un PC que l’on doit avoir à moins d’un mètre de soi pour être entendu et entendre la réponse. Triby reprend toutes les qualités d’Echo - la capture du son à distance et la richesse des services disponibles - et les rend portable partout dans la maison, dans un design beaucoup plus sympa. C’est le design de Triby et ses performances acoustiques qui ont fait flasher Amazon et les ont convaincu de miser sur nous.
 
Les agents conversationnels sont en vogue sur les applications de messagerie (chatbot) mais ces technologies n’ont-elles pas vocation à s’imposer avant tout en mode audio ? Pourriez vous d’ailleurs lancer votre propre agent conversationnel basé sur de l’intelligence artificielle ?
 
SdB - Le chatbot écrit est une étape intermédiaire vers le chatbot audio, un entraînement. La voix est beaucoup plus riche que le texte. Elle indique l’humeur de la personne, ses émotions, son style et même son identité par l’emprunte vocale. Nous ne prévoyons pas de déveloper notre propre bot, notre vocation est de mettre nos plateformes à la disposition de fournisseurs de contenus et services tiers.
 
En revanche notre ambition va bien au delà du chatbot. La capture du son, croisée avec d’autres data, permet de récolter des informations cruciales sur le contexte. La voix n’est qu’une forme très particulière du son. Nous explorons le reste.
 
Qu’ils s’agisse d’assistants vocaux pour smartphones (Siri, Now, Cortana) voire de véritables boitiers (Amazon Echo, Google Home, …), la voix apparait comme une nouveau terrain de jeu pour les GAFAs. Pourquoi ?
 
SdB - Même si les jeunes utilisent plus les différentes formes de chat que le téléphone, dans une journée ils parlent plus qu’ils n’écrivent. Les GAFAs s’adaptent à ce qui nous est le plus naturel. Et puis, il faut le dire, c’est aussi un joli terrain de jeu pour les labos d’intelligence artificielle qui peuvent enfin prendre le grand public à témoin de leur prouesses.




Pionnier de la presse en ligne avec le lancement de NetEconomie.fr en 1999, Jérôme Bouteiller est… En savoir plus sur cet auteur

Dimanche 9 Octobre 2016

A lire également