Google a utilisé des vidéos youtube du Mannequin Challenge pour former son personnel

Table des matières:

Que souhaitez-vous savoir
Obtenez plus de pixels 3a
Google Pixel 3a

Que souhaitez-vous savoir

Google forme son intelligence artificielle pour créer des cartes de profondeur isolant des sujets humains dans la scène à l'aide d'une seule caméra.
Pour commencer, Google a utilisé 2000 vidéos YouTube du Mannequin Challenge pour former l'IA.
Les résultats vous permettront d'ajouter des effets aux vidéos, tels que le mode portrait, et de les utiliser pour la réalité augmentée.

Dans un récent article de blog, Google a expliqué comment il travaillait sur la perception de la profondeur dans les vidéos où l'appareil photo et le sujet bougent. Pour commencer, l’étude nécessitait l’accès à une grande quantité de données pour former l’intelligence artificielle. La première étape logique consistait à l’entraîner à détecter les personnes dans une scène où la caméra bougeait, mais les personnes étaient statiques.

En fin de compte, Google disposait de la ressource idéale pour ces données, sous la forme de vidéos YouTube filmées pour le Mannequin Challenge. Dans ce défi, une personne ou un groupe de personnes resterait complètement immobile alors qu'une caméra filait leur position. Google a utilisé 2 000 vidéos du défi pour aider son entraîneur d'IA à détecter des figures humaines dans diverses scènes.

Ce qui rend cette étude encore plus intéressante est le fait que Google enseigne à l'IA de créer des cartes de profondeur à l'aide de séquences filmées avec une seule caméra. La plupart du temps, plusieurs caméras doivent être utilisées pour détecter les informations de profondeur dans une scène.

Google utilise déjà quelque chose de similaire pour les images fixes pour créer son effet de mode portrait sur les téléphones Pixel. Cependant, cela ne concerne que les images fixes. La nouvelle méthode mise au point par Google forme son intelligence artificielle afin de créer une carte de profondeur dans laquelle la caméra et le sujet se déplacent dans une scène.

En se ramifiant dans les vidéos, il ouvrira à l'avenir des fonctionnalités permettant de créer des bokehs dans des scènes vidéo similaires au mode portrait de votre téléphone. Cette étude présentera un autre avantage: de meilleurs résultats pour la réalité augmentée, tels que les Playmojis de Google Playground.

Une autre possibilité sera la génération d’images 3D à partir de scènes 2D. Bien que le matériel de l'appareil photo ait toujours été essentiel pour la photographie et la vidéographie, ce que Google a fait au fil des années avec les logiciels montre qu'à l'avenir, les algorithmes seront tout aussi importants et contribueront à créer de nouvelles expériences.