La reconnaissance d’objet d’une vidéo offerte par un nouvel API de Google Cloud

Google a dévoilé aujourd’hui une nouvelle technologie d’apprentissage automatique ayant la capacité de reconnaître les objets et éléments d’une vidéo.

Cette trousse d’outils, nommée Video Intelligence API, permettra aux développeurs d’obtenir le détail des contenus d’une vidéo grâce à ses «puissants modèles d’apprentissage automatique» qui peuvent y identifier des éléments avec précision. Alors que la reconnaissance d’objet n’est pas une nouvelle technologie en soi, les systèmes l’exploitant se limitaient toutefois jusqu’à présent qu’à des images statiques.

La reconnaissance d’objet se limitait jusqu’à présent qu’à des images statiques.

On peut ainsi imaginer l’intégration de ces outils dans un portail vidéo comme YouTube, qui pourrait alors offrir des résultats de recherche beaucoup plus fidèles à la réalité en puisant également ses informations des métadonnées générées par la reconnaissance d’objet, plutôt que la seule description et mots-clés (parfois trompeurs) attachés aux vidéos pouvant correspondre à la requête.

«Google collabore depuis longtemps avec les plus grandes entreprises médiatiques au monde en les aidant à trouver de la valeur à partir de données non structurées comme la vidéo», explique Fei-Fei Li, scientifique en chef de l’intelligence artificielle et de l’apprentissage automatique pour Google Cloud. «Cet API est destiné aux grandes entreprises médiatiques et aux entreprises technologiques grand public qui souhaitent construire leur catalogue multimédia ou trouver des moyens faciles de faire la gestion de contenu généré par les utilisateurs, mais aussi pour des partenaires comme Cantemo, qui pourra l’intégrer dans son propre logiciel de gestion vidéo.»

Un aperçu de l’API Video Intelligence en action (Image : Google Cloud).

Offerte aujourd’hui en version bêta fermée, l’API Video Intelligence viendra s’ajouter aux autres API d’apprentissage automatique (ou machine learning) offerts par Google Cloud, dont Vision, Speech, Natural Language, et Translation. Avec cette initiative, Google souhaite démocratiser les technologies d’apprentissage automatique qu’elle a développé à l’interne.

Si vous êtes curieux de voir l’API en action, vous pouvez l’essayer directement sur la page qui lui est consacrée sur le site de Google Cloud.

Reste à voir maintenant si l’arrivée d’une telle technologie parviendra à mieux positionner Google dans le secteur des services cloud dominé par Amazon et Microsoft.