Gemini Pro 1.5 : Une révolution dans l’analyse vidéo par IA

Google a récemment lancé Gemini Pro 1.5, une mise à jour majeure de sa série de modèles d'intelligence artificielle Gemini, qui offre une taille de contexte impressionnante de 1 000 000 de jetons, surpassant largement les capacités des modèles précédents. Ce qui distingue véritablement Gemini Pro 1.5, c'est sa capacité à analyser le contenu vidéo, une fonctionnalité testée par l'auteur avec des résultats étonnants. Malgré quelques erreurs et l'activation des filtres de sécurité pour certains mots, la capacité du modèle à extraire et à structurer des informations à partir de vidéos est impressionnante, allant jusqu'à identifier correctement des livres à partir de vidéos rapides et partiellement obstruées. Cette avancée représente un pas significatif dans l'utilisation des modèles de langage à grande échelle (LLM) pour l'analyse de contenu multimédia, promettant des applications futures enthousiasmantes malgré les défis persistants liés à la précision et à la censure algorithmique.

via HackerNewsletter : lire l’article source

Laisser un commentaire