Logo fr.androidermagazine.com
Logo fr.androidermagazine.com

Qu'est-ce que google duplex?

Table des matières:

Anonim

À Google I / O 2018, nous avons assisté à une démonstration du dernier né de Google, Duplex. L'écran de 60 pieds sur scène a montré ce qui ressemble à votre application Google Assistant avec une lecture ligne par ligne de l'Assistant faisant un appel téléphonique à un coiffeur et fixant un rendez-vous, avec les pauses, les um et ahhhs et le reste des idiosyncrasies qui accompagnent la parole humaine. La personne prenant le rendez-vous ne semblait pas savoir qu'elle parlait à un ordinateur car cela ne ressemblait pas à un ordinateur. Pas même un peu.

Ce genre de démo est incroyable (et peut-être un peu effrayant), mais qu'en est-il des détails? Qu'est-ce que Duplex, exactement? Comment ça marche même? Nous avons tous des questions lorsque nous voyons quelque chose d'aussi différent et qu'il est difficile de trouver des réponses réparties sur Internet. Passons en revue ce que nous savons jusqu'à présent sur Google Duplex.

Qu'est-ce que Google Duplex?

C'est un nouvel outil de Google qui vise à utiliser l'intelligence artificielle (IA) pour "accomplir des tâches du monde réel par téléphone", selon les chercheurs et les développeurs de Google sur l'IA. Pour l'instant, cela implique des tâches très spécifiques telles que la prise de rendez-vous, mais la technologie est en cours de développement dans l'optique d'une expansion dans d'autres domaines. Dépenser des milliards de dollars pour créer un moyen sympa de faire des réservations pour le dîner ressemble à quelque chose que Google ferait, mais ce n’est pas une grande utilisation de temps ou d’argent.

Duplex est aussi plus que ce que nous avons vu dans une démo et s'il quitte le laboratoire, il sera beaucoup plus que ce que nous voyons ou entendons de notre côté. Il existe d'énormes banques de données et les ordinateurs nécessaires à leur traitement ne sont pas aussi cool que le résultat final. Mais ils sont essentiels car il est difficile de faire parler et penser un ordinateur en temps réel, comme une personne.

N'est-ce pas juste comme du discours au texte?

Nan. Pas même proche. Et c'est pourquoi c'est un gros problème.

Le mode duplex est conçu pour changer la façon dont un ordinateur "parle" au téléphone.

Pour Duplex, l’objectif est de rendre les choses plus naturelles et pour que l’assistant réfléchisse rapidement afin de trouver une heure de rendez-vous qui fonctionne. Si Joe dit: "Oui, à ce sujet - je n'ai rien ouvert avant 10 heures, est-ce que ça va?" L’assistant doit comprendre ce que Joe dit, comprendre ce que cela signifie et savoir si ce que Joe vous proposera fonctionnera pour vous. Si vous êtes occupé de l'autre côté de la ville à 10 heures et qu'il vous faudra 40 minutes pour vous rendre au garage de Joe, l'Assistant doit être capable de comprendre cela et de dire 11h15 serait bien.

Tout aussi important pour Google, Duplex répond et sonne comme une personne. Google a déclaré qu'il souhaitait que la personne au téléphone ne sache pas qu'elle parlait à un ordinateur, bien qu'elle ait finalement décidé qu'il serait préférable de l'informer. Lorsque nous parlons avec les gens, nous parlons plus vite et moins formel (lire: babillage incohérent du point de vue d'un ordinateur) que lorsque nous parlons à Assistant sur notre téléphone ou à l'ordinateur du DMV lorsque nous appelons. Duplex a besoin de comprendre. ceci et le recréer en répondant.

Enfin, et le plus impressionnant, c'est que Duplex doit comprendre le contexte. Vendredi, vendredi prochain et vendredi après la semaine prochaine sont tous des termes que vous et moi comprenons. Duplex doit aussi les comprendre. Si nous parlions de la même façon que nous tapons, ce ne serait pas un problème, mais nous ne le savons pas parce que ça a l'air tellement étouffant ouais, ce n'est pas déroutant, bien que nous l'ayons entendu toute notre vie et que nous y soyons habitués. non, nous n'avons pas de problèmes que vous savez comprendre ou rien de tel.

Je vais donner les premiers soins à mon éditeur après avoir tapé cela pendant que vous le dites à voix haute, vous voyez donc ce que cela signifie.

Comment fonctionne le duplex?

Du point de vue de l'utilisateur, il suffit simplement de dire à l'Assistant de faire quelque chose. Pour l'instant, comme mentionné, quelque chose se limite à prendre des rendez-vous, nous disons donc: "Hé, Google, donnez-moi un rendez-vous pour une vidange d'huile chez Joe's Garage le mardi matin", puis (après nous avoir rappelé de le faire s'il vous plaît) placez Joe's Garage et configurez-le, puis ajoutez-le à votre calendrier.

Les conversations continues utilisent une grande partie de la même technologie sous-jacente que Duplex.

Assez chouette. Mais ce qui se passe hors caméra est encore plus difficile.

Le duplex utilise ce qu'on appelle un réseau de neurones récurrent. Il a été construit à l'aide de la technologie TensorFlow Extended de Google. Google a formé le réseau à tous les messages vocaux anonymisés et conversations Google Voice que vous avez accepté de laisser écouter si vous avez opté pour un mélange de logiciels de reconnaissance vocale et la possibilité de prendre en compte l'historique de la conversation et les détails tels que l'heure et le lieu. des deux parties.

Essentiellement, tout un réseau d’ordinateurs de grande puissance traite des données dans le nuage et communique via l’assistant de votre téléphone ou un autre produit doté de cet assistant.

Qu'en est-il de la sécurité et de la vie privée?

Cela se résume à une chose simple: avez-vous confiance en Google? L'intelligence de la machine sur le périphérique est une chose réelle, bien que contrainte et relativement nouvelle. Google a mis au point ML Kit pour aider les développeurs à utiliser davantage ce type de choses sur leur appareil, mais tout est une question de puissance de calcul. Il faut une quantité incroyable de calculs pour prendre rendez-vous avec un cheveu de cette façon, et il est impossible que cela se fasse sur votre téléphone ou sur Google Home.

Vous devez faire confiance à Google avec vos données pour utiliser ses produits intelligents, et Duplex ne sera pas différent.

Google doit puiser dans une grande partie de vos données personnelles pour effectuer les tâches spéciales que l'Assistant peut effectuer actuellement, et Duplex ne change rien à cela. La nouveauté est qu’il existe désormais une autre partie impliquée qui n’a pas explicitement autorisé Google à écouter sa conversation.

Si / quand Duplex devient un produit de consommation réel que quiconque peut utiliser, attendez-vous à ce qu'il soit critiqué et contesté devant les tribunaux. Et ça devrait être; Laisser Google décider de ce qui convient le mieux à notre vie privée, c'est comme le vieil adage de deux renards et d'un poulet qui décide ce qu'il faut pour dîner.

Quand vais-je avoir Duplex sur mon téléphone?

Attendez-vous à de gros changements d’assistant plus tard cette année.

Personne ne sait pour le moment. Cela peut ne jamais arriver. Google est excité quand il peut faire ce genre de chose fantastique et veut le partager avec le monde. Cela ne signifie pas qu'il réussira ou ne deviendra jamais un vrai produit.

Pour le moment, Duplex est en cours de test dans un environnement fermé et supervisé. Si tout se passe bien, une première version expérimentale destinée aux consommateurs pour leur permettre de faire des réservations de restaurant, de prendre rendez-vous pour un salon de coiffure et d'obtenir des heures de vacances par téléphone viendra plus tard cette année en utilisant uniquement Assistant sur les téléphones.

Où puis-je en apprendre plus?

Google est étonnamment ouvert sur la technologie utilisée pour créer Duplex. Vous trouverez des informations pertinentes sur les sites Web suivants:

  • Blog de Google AI (Google)
  • Esprit profond
  • Tensorflow.org
  • La bibliothèque universitaire de Cornell
  • Google Research (Google)
  • Le mot clé (Google)
  • Kit ML (Google)

Bien sûr, nous suivons également de près Duplex et vous entendrez les derniers développements dès qu'ils seront disponibles.