Catégorie : 🪄 Technologies
-
OpenAI propose un modèle d’IA de clonage vocal qui ne nécessite qu’un échantillon de 15 secondes pour fonctionner
OpenAI offre un accès limité à une plateforme de génération de texte en voix qu'elle a développée appelée Voice Engine, qui peut créer une voix synthétique basée sur un extrait de 15 secondes de la voix de quelqu'un. La voix générée par l'IA peut lire des instructions textuelles sur commande dans la même langue que celle du locuteur ou dans…
-
Le premier patient avec un implant Neuralink joue à Mario Kart avec son esprit
Dans une nouvelle démonstration impressionnante, le premier patient avec un implant Neuralink a joué au jeu vidéo Mario Kart avec son esprit. Noland Arbaugh, un quadriplégique de 29 ans, a déclaré que cette expérience était 'transformatrice' lors d'une réunion de l'entreprise. Cette démonstration arrive à un moment où Neuralink fait face à des critiques négatives et des demandes de transparence…
-
Pixart-α: A Faster and High-Quality Text-to-Image Diffusion Model
Pixart-α is a new text-to-image diffusion model that can generate high-resolution images with competitive quality while requiring significantly less training time compared to other models. This article explores the architecture and training strategy of Pixart-α, as well as how to run it using HuggingFace Diffusers and manage experiments with Weights & Biases. The article also compares the image quality of…
-
Meta AI Research: Making Headsets And Glasses Understand Your Room Layout & Furniture
Meta a développé un nouveau système de recherche en IA appelé SceneScript qui permet aux casques et aux lunettes de comprendre la disposition de votre pièce et de votre mobilier. Ce système utilise la même technique que les modèles de langage, mais au lieu de prédire le prochain fragment de langage, il prédit les éléments architecturaux et mobiliers dans un…












