Accueil Logiciel Technologie de reconnaissance vocale: utile ou douloureuse?

Technologie de reconnaissance vocale: utile ou douloureuse?

Table des matières:

Anonim

Avez-vous déjà appelé une entreprise pour obtenir de l'aide ou payer votre facture, seulement pour être accueilli par une voix enregistrée agréable qui veut avoir une conversation avec vous - mais ne peut pas comprendre la moitié de ce que vous dites? Ou peut-être que vous possédez un iPhone, et bien que Siri ait d'abord semblé être un bon allié, vous vous êtes rendu compte que parfois (OK, soyons honnêtes, souvent), elle ne le comprend tout simplement pas? La technologie de reconnaissance vocale (VRT), également connue sous le nom de synthèse vocale, tombe dans un piège commun: elle a le potentiel d'être incroyablement cool (et garçon, sommes-nous en train de l'enraciner), mais le plus souvent, c'est un grincement de dents exercice de frustration.


Autrefois une idée qui appartenait au domaine de la science-fiction, la reconnaissance vocale est passée de son enfance dans les années 1950, lorsque le système Audrey des Laboratoires Bell a été conçu pour reconnaître les chiffres parlés d'une seule voix, au réseau moderne d'électronique conversationnelle avec laquelle nous interagissons maintenant avec au quotidien - avec des résultats mitigés.

Pour parler à un humain, veuillez appuyer sur 0

De nombreuses entreprises d'aujourd'hui utilisent désormais des systèmes appelés réponse vocale interactive (RVI) pour gérer les appels du service client. L'utilisation la plus courante concerne les menus à navigation vocale, mais certaines entreprises utilisent des systèmes IVR qui peuvent accéder aux informations de compte client et répondre à des questions mineures. Le logiciel Menu IVR a généralement un vocabulaire limité, qui peut être limité à «oui», «non» et à des chiffres. Des systèmes plus complexes peuvent reconnaître des mots et des phrases spécifiques à l'entreprise.


Ces systèmes gagnent en popularité - du moins pour les entreprises - pour une raison simple: ils sont rentables. Selon un rapport publié en 2010 par le Wall Street Journal, un appel client typique qui atteint un agent coûte entre 3 $ et 9 $, tandis qu'un appel traité via un système automatisé ne coûte que cinq à sept cents. Et, bien sûr, les programmes informatiques ne se fatiguent pas, n'appellent pas malades ou ne deviennent pas frustrés par les clients (bien que les clients deviennent certainement frustrés par eux!).


Heureusement, cela ne signifie pas toujours que la RVI supprime des emplois des gens - ou du moins que toutes les personnes disparaissent des centres d'appels. Ces assistants à commande vocale permettent aux représentants du service client humain d'être plus productifs en dirigeant les appels et en répondant à des questions simples.


Bien sûr, pour les utilisateurs humains qui interagissent avec ces technologies, la navigation n'est pas toujours fluide. La technologie contribue à améliorer les problèmes courants de la technologie IVR, tels que les problèmes d'accents, mais le pillage des systèmes automatisés est toujours un thème courant en ligne. Découvrez ce sketch comique sur un ascenseur équipé de la reconnaissance vocale, qui met en évidence la frustration que les dysfonctionnements des systèmes IVR peuvent produire.

Applications de téléphonie personnelle: Siri, Google Now

La plupart des gens connaissent la reconnaissance vocale pour les smartphones. Alors que la majorité des derniers modèles de téléphones sont livrés avec la VR, leur popularité - et leur notoriété - a augmenté quand Apple a présenté Siri, l '"assistant personnel" légèrement sarcastique et activé par la voix pour l'iPhone 4S en 2011. Google a rapidement créé un concurrent direct: Google Maintenant, pour le système d'exploitation Android Jelly Bean. Les deux systèmes comportent des voix féminines et des fonctions de reconnaissance sophistiquées qui permettent aux utilisateurs de «parler» à leur téléphone en utilisant un langage informel.


Mais si ces systèmes sont considérablement plus sophistiqués et fonctionnels que leurs prédécesseurs, ils montrent également que la technologie a encore un long chemin à parcourir. Les blagues sur l'échec de Siri sont devenues un mème Internet populaire. Un homme a même poursuivi Apple pour publicité mensongère concernant les capacités de Siri.


C'est peut-être la raison pour laquelle Apple a créé Siri pour être avancé et informatif, le logiciel VR est également un peu insolent. Par exemple, si vous parlez de l'une des lignes de technologie du renseignement les plus tristement célèbres de l'histoire du cinéma du film de 1968 "2001: une odyssée de l'espace" - "ouvrez les portes de la baie de pod" - Siri répondra soit avec la ligne de réponse du film, " Je suis désolé (votre nom), j'ai bien peur de ne pas pouvoir faire ça ", ou plus sarcastique", nous, les agents du renseignement, ne vivrons jamais cela, apparemment. "


Vous appeler par son nom n'est qu'une des fonctions qui essaient de rendre Siri plus facile à aimer et un peu plus humain. L'assistant VR peut suivre les commandes vocales pour passer des appels, prendre des dictées et envoyer des SMS, effectuer des recherches sur Internet pour trouver des informations, trouver des magasins à proximité, donner des itinéraires et plus encore, le tout sans avoir besoin de toucher quoi que ce soit. Les réponses sont simultanément prononcées par le téléphone et affichées à l'écran.


Google Now, la partie VR de la plate-forme Android Jelly Bean, est très similaire à Siri. Le système offre les mêmes capacités de reconnaissance étendues en traduisant la parole informelle en commandes qui permettent aux utilisateurs de passer des appels, d'envoyer des textes, d'effectuer des recherches, d'effectuer des calculs et des conversions, de saisir des définitions de mots, de définir des alarmes, de jouer des chansons et d'obtenir des cartes et des itinéraires.


Avec les assistants vocaux personnels comme Siri et Google Now, les avantages sont évidents. Tout, des appels et des SMS à la recherche et au divertissement, est plus rapide et plus facile. Dites simplement ce que vous voulez et (la plupart du temps) l'application VR le saisit pour vous. La technologie mains libres de VR est particulièrement utile pendant la conduite. Et bien que de nombreuses personnes aient décrié les défauts de Siri, et les écrivains ont fait valoir que la capacité de Google Now à gérer essentiellement la vie des utilisateurs était à la fois un peu effrayante et insultante, la plupart des gens estiment que ces technologies futuristes sont plutôt cool.


Bien sûr, les applications de téléphonie personnelle comme Siri et Google Now sont loin d'être parfaites, même si elles montrent où cette technologie pourrait être dirigée à l'avenir. Cela signifie que même lorsque Siri trouve une mauvaise réponse, nous sommes susceptibles de rire et de lui pardonner, sachant que la prochaine version sera bien meilleure.

Où VR tombe à plat

Si vous avez déjà rencontré un RVI lorsque vous avez appelé une entreprise, vous avez peut-être remarqué certains obstacles à la communication. Certains programmes utilisent une voix de synthèse vocale robotique qui prononce mal les mots et rend les choses difficiles à comprendre. D'autres ont des problèmes de sensibilité qui empêchent le logiciel de traiter ce que vous dites si vous êtes trop fort, trop doux ou si vous ne l'énoncez pas soigneusement.


En outre, de nombreuses personnes ne se sentent toujours pas à l'aise de parler à une machine. Si vous exécutez quelques recherches sur IVR, vous rencontrerez des listes que les gens ont rassemblées sur les moyens de contourner les systèmes IVR et d'atteindre une «personne réelle». Ces solutions vont de «continuer à appuyer sur 0 pour un opérateur» à «jurer sur la machine jusqu'à ce qu'elle atteigne un être humain». En conséquence, une grande partie du développement récent des systèmes de RVI a consisté à les rendre plus agréables au goût pour les humains; rendre les voix plus sympathiques et moins robotiques, rendre le système plus facile à naviguer et faire savoir aux appelants combien de temps cela prendra du début à la fin. Cela suggère que la meilleure technologie n'est que la moitié de la bataille ici; l'autre moitié permet aux utilisateurs de parler à une machine.

Ce que l'avenir nous réserve

Malgré ces défis, la technologie de reconnaissance vocale s'améliore constamment. Des applications comme Siri et Google Now - défauts et tout - sont encore extraordinairement impressionnantes dans leurs performances, et plusieurs sociétés étendent les capacités VR à d'autres applications.


Par exemple, Nuance, les créateurs du logiciel de synthèse vocale Dragon NaturallySpeaking, a déjà développé des commandes vocales pour les téléviseurs et les automobiles, et des versions de cette technologie sont intégrées à certains téléviseurs Samsung et aux systèmes de divertissement SYNC utilisés dans certains véhicules Ford.


Et comme Google et Apple continuent de trouver de nouvelles utilisations pour leurs technologies de reconnaissance vocale, il est probable que nous parlerons de plus en plus à toutes sortes de machines de tous les jours, de nos téléviseurs à nos grille-pain. Et, encore une fois, il semble que la science-fiction avait raison. Nous devrons simplement espérer que ces écrivains intelligents se sont trompés sur une chose. Si ces machines prennent le relais, vous pourriez avoir beaucoup de problèmes la prochaine fois que vous demanderez à Siri «d'ouvrir les portes de la baie de pod».

Technologie de reconnaissance vocale: utile ou douloureuse?