Catégorie : 🧠Artificial Intelligence
-
VASA: Generating Lifelike Talking Faces of Virtual Characters
VASA is a framework that generates lifelike talking faces of virtual characters with appealing visual affective skills. The premiere model, VASA-1, can produce lip movements synchronized with audio and capture facial nuances and natural head motions. The core innovations include a holistic facial dynamics and head movement generation model and the development of an expressive […]
-
Mistral AI propose le nouveau modèle Mixtral 8x22B d’IA gĂ©nĂ©rative en tĂ©lĂ©chargement gratuit de 281 Go
La startup d'IA gĂ©nĂ©rative Mistral AI a publiĂ© son plus rĂ©cent modèle de langage de grande taille, le modèle Mixtral 8x22B, en tant que fichier de 281 Go accessible via un lien magnet publiĂ© sur X, sans aucune explication ni commentaire. Ce modèle, dotĂ© de 22 milliards de paramètres, pourrait surpasser son prĂ©dĂ©cesseur, le modèle […]
-
VideoPrism: Un encodeur visuel fondamental pour la compréhension des vidéos
Une démo en quelques tweet : https://twitter.com/CodeByPoonam/status/1776902550811525146
-
Spotify lance un crĂ©ateur de playlist gĂ©nĂ©rative basĂ© sur l’IA
Spotify dĂ©ploie une nouvelle fonctionnalitĂ© appelĂ©e 'AI Playlist' qui transforme les descriptions textuelles en playlists en utilisant l'IA gĂ©nĂ©rative. Les abonnĂ©s Premium au Royaume-Uni et en Australie peuvent dĂ©jĂ y accĂ©der sur les appareils Android et iOS, et d'autres rĂ©gions suivront. Les utilisateurs peuvent simplement saisir une description qui peut inclure des rĂ©fĂ©rences Ă des […]
-
Plongée approfondie dans le Diffusion Transformer (DiT) de Sora
Cet article explore le fonctionnement du modèle de texte-vidĂ©o Sora, qui est un diffuseur transformer (DiT) dĂ©veloppĂ© par Open AI. Il utilise la diffusion pour prĂ©dire les vidĂ©os et la puissance des transformers pour une mise Ă l'Ă©chelle de niveau supĂ©rieur. L'article dĂ©taille les diffĂ©rentes Ă©tapes de fonctionnement de Sora, notamment la conversion des vidĂ©os […]
-
Nouvelle fonctionnalité de mouvement pour ajouter du dynamisme à vos images
La nouvelle fonctionnalitĂ© '/move' permet d'ajouter du mouvement Ă vos images prĂ©fĂ©rĂ©es. Une vidĂ©o de dĂ©monstration montre comment combiner du matĂ©riel vidĂ©o de danse avec la beautĂ© IA gĂ©nĂ©rĂ©e par @TensorArt en utilisant '/move'. Quelques astuces sont Ă©galement partagĂ©es, comme utiliser des images identiques pour la vidĂ©o et la composition, Ă©viter les vidĂ©os avec trop […]
-
La chanson gĂ©nĂ©rĂ©e par une IA d’un texte viral de la Licence MIT devient virale
L'IA Suno.ai permet Ă n'importe quelle sĂ©rie de mots de devenir des paroles de chanson, y compris des blagues internes. Un ingĂ©nieur a tweetĂ© une chanson gĂ©nĂ©rĂ©e par l'IA avec les paroles de la Licence MIT et elle a rapidement circulĂ© dans la communautĂ© de l'IA en ligne. Suno est une entreprise qui a Ă©tĂ© […]
-
Machine learning driven teleprompter
Microsoft is bringing AI to broadcast news. The company wants to patent systems for a “machine learning driven teleprompter.” via PatentDrop : lire l’article source
-
Join the waitlist for KaraVideo.AI, the revolutionary video generator powered by OpenAI Sora
Don't miss out on the opportunity to be one of the first to experience Sora! Join the waitlist for KaraVideo.AI, an incredible video generator powered by OpenAI Sora. With its advanced capabilities, KaraVideo.AI is set to revolutionize the way videos are created. Don't wait, sign up now and be at the forefront of this exciting […]
-
OpenAI propose un modèle d’IA de clonage vocal qui ne nĂ©cessite qu’un Ă©chantillon de 15 secondes pour fonctionner
OpenAI offre un accès limitĂ© Ă une plateforme de gĂ©nĂ©ration de texte en voix qu'elle a dĂ©veloppĂ©e appelĂ©e Voice Engine, qui peut crĂ©er une voix synthĂ©tique basĂ©e sur un extrait de 15 secondes de la voix de quelqu'un. La voix gĂ©nĂ©rĂ©e par l'IA peut lire des instructions textuelles sur commande dans la mĂŞme langue que […]