Catégorie : 🧠Artificial Intelligence
-
Chain-of-Spot: AmĂ©liorer l’extraction des caractĂ©ristiques visuelles
Chain-of-Spot (CoS) est une nouvelle approche qui amĂ©liore l'extraction des caractĂ©ristiques en se concentrant sur les rĂ©gions d'intĂ©rĂŞt clĂ©s dans l'image, correspondant aux questions posĂ©es ou aux instructions donnĂ©es. Cette technique permet aux modèles de vision et de langage d'accĂ©der Ă des informations visuelles plus dĂ©taillĂ©es sans altĂ©rer la rĂ©solution de l'image d'origine, offrant ainsi […]
-
Les bips des machines dans les hôpitaux responsables de décès selon une étude
Une Ă©tude rĂ©vèle que les bips incessants des machines dans les hĂ´pitaux sont responsables de centaines de morts chaque annĂ©e. Pour remĂ©dier Ă ce problème, Sound To Sight propose une solution de design sonore en collaboration avec un fabricant Ă la pointe de la technologie et axĂ© sur l'expĂ©rience utilisateur. Le design sonore est une […]
-
Les guerres de l’IA s’intensifient avec Claude 3, revendiquant des capacitĂ©s « quasi humaines »
Mouai … ça se joue a peu … ça me rappel Google qui parlait de suprĂ©macie quantique.
-
Large Language Models On-Device with MediaPipe and TensorFlow Lite
Cette Ă©quipe de Google qui fait TensorFlow light, MediaPipe et maintenant LLM est juste dingue !
-
OpenAI Sora: Un pas de plus vers la Matrice
OpenAI a annoncĂ© hier Sora, le modèle d'IA le plus important de 2024. Sora est un modèle de texte-vidĂ©o de pointe capable de gĂ©nĂ©rer des vidĂ©os de haute qualitĂ© en une minute avec diffĂ©rentes rĂ©solutions. Mais Sora est plus que cela, il peut Ă©galement simuler un monde virtuel. Dans cet article, nous examinons les fonctionnalitĂ©s […]
-
Les entreprises chinoises peuvent-elles crĂ©er Sora ? Cette grande Ă©quipe modèle de Tsinghua donne de l’espoir
Cet article parle de la capacitĂ© des entreprises chinoises Ă dĂ©velopper des technologies de gĂ©nĂ©ration de vidĂ©os, en se concentrant sur le modèle Sora d'OpenAI. Il mentionne que les entreprises chinoises disposent dĂ©jĂ de rĂ©serves techniques dans ce domaine, notamment grâce aux travaux de l'Ă©quipe de Tsinghua sur des modèles basĂ©s sur l'architecture Transformer. Bien […]
-
Gemini Pro 1.5 : Une rĂ©volution dans l’analyse vidĂ©o par IA
Google a rĂ©cemment lancĂ© Gemini Pro 1.5, une mise Ă jour majeure de sa sĂ©rie de modèles d'intelligence artificielle Gemini, qui offre une taille de contexte impressionnante de 1 000 000 de jetons, surpassant largement les capacitĂ©s des modèles prĂ©cĂ©dents. Ce qui distingue vĂ©ritablement Gemini Pro 1.5, c'est sa capacitĂ© Ă analyser le contenu vidĂ©o, […]
-
Google innove avec des commandes vocales et gestuelles pour ses assistants
Sujet que je testait il y a +10ans avec SARAH
-
PL2Map: Representing 3D sparse map points and lines for camera relocalization
PL2Map can simultaneously predict 3D coordinates of points and lines for high-accuracy camera re-localization. via Deep Learning Weekly : lire l’article source
-
Project Music GenAI Control : Adobe lance une IA pour générer de la musique
Adobe annonce le lancement de Project Music GenAI Control. Cet outil basĂ© sur l’intelligence artificielle permet de gĂ©nĂ©rer de la musique Ă partir de prompts puis de l’éditer pour l’adapter Ă ses besoins. via Les NumĂ©riques : lire l’article source