Stability AI, connue pour ses réalisations visuelles basées sur l’intelligence artificielle, franchit une nouvelle étape en lançant Stable Audio, un générateur de sons alimenté par l’IA. Cette nouvelle plateforme text-to-music, capable de produire des clips musicaux et des effets sonores de haute qualité jusqu’à 90 secondes, promet de révolutionner le monde de la création musicale.
Stable Audio : L’IA au Service des Musiciens
Stable Audio a été formé à partir d’une immense base de données comprenant plus de 800 000 fichiers audio provenant de la bibliothèque de musique de stock AudioSparx. Ce générateur est capable de répondre à des instructions détaillées concernant le genre musical, les instruments, l’ambiance, le BPM et bien plus encore. Les créateurs de Stable Audio ont publié un article de blog présentant plusieurs exemples impressionnants de ce que l’outil peut accomplir. À en juger par ces démonstrations, Stable Audio semble avoir le potentiel de surpasser les capacités de MusicGen et MusicLM, les générateurs de musique basés sur l’IA développés par Meta et Google au cours de l’année écoulée.
Un Outil pour les Musiciens et les Producteurs
Les créateurs de Stable Audio affirment que cette plateforme est “idéale pour les musiciens souhaitant créer des échantillons pour leur musique”. Les exemples publiés montrent que l’outil peut générer des clips à n’importe quel BPM donné, ce que ses concurrents semblaient incapables de faire. Par exemple, en demandant “Boucle de batterie rock propre à 116 BPM”, Stable Audio a créé une boucle de batterie rock propre à 116 BPM, parfaitement utilisable. Cependant, il semble avoir du mal à comprendre la tonalité, comme en témoigne une demande de boucle de piano en sol majeur qui a donné lieu à une boucle en la mineur.
Une Création Structurée et Contrôlée
Stable Audio peut générer des clips de différentes longueurs et excelle particulièrement dans la création d’idées musicales structurées. Il a été formé pour prendre en compte la “durée du fichier audio et l’heure de début” en plus des attributs musicaux tels que le genre et l’instrumentation. Cela signifie qu’il est moins susceptible de générer des sections aléatoires de chansons qui commencent ou se terminent au milieu d’une phrase, un problème courant avec d’autres générateurs de musique basés sur l’IA.
Disponible en Deux Versions
Stable Audio est disponible en deux versions. La version gratuite, accessible dès maintenant pour tous les utilisateurs, permet de générer des clips audio jusqu’à 20 secondes. La version Pro, au prix de 11,99 $ par mois pour les abonnés, offre la possibilité de générer jusqu’à 500 pistes par mois, d’une durée maximale de 90 secondes, pouvant être utilisées dans des projets commerciaux.
Emad Mostaque, PDG de Stability AI, déclare : “En tant qu’entreprise indépendante, ouverte et multimodale dans le domaine de l’IA générative, nous sommes ravis d’utiliser notre expertise pour développer un produit en soutien aux créateurs de musique. Notre espoir est que Stable Audio permettra aux amateurs de musique et aux professionnels de la création de générer de nouveaux contenus grâce à l’IA, et nous sommes impatients de voir les innombrables innovations qu’il inspirera.”
Détails Techniques
Les modèles Stable Audio utilisent une architecture de diffusion latente, comprenant :
- VAE (Variational Autoencoder) : Il compresse l’audio stéréo en une représentation latente, résistante au bruit et compressée pour une génération et un entraînement rapides.
- Encodeur de texte : Basé sur un modèle CLAP formé sur notre dataset, il permet d’associer des informations textuelles aux données audio.
- Modèle de diffusion conditionné U-Net : Ce modèle de 907M de paramètres utilise des couches résiduelles, d’auto-attention et de cross-attention pour réduire le bruit audio en fonction du texte et du timing.
- Informations temporelles : Les valeurs “seconds_start” et “seconds_total” sont calculées lors de l’entraînement pour indiquer quand commence un morceau audio et sa durée totale. Ces informations sont cruciales pour définir la longueur de la sortie audio.
Ces modèles sont conçus pour générer des clips audio de haute qualité en réponse à des instructions détaillées sur le genre, l’instrumentation, l’humeur, le BPM, et plus encore.
Conclusion
Avec Stable Audio, Stability AI étend son influence dans le domaine de la création musicale en exploitant la puissance de l’IA. Ces mises à jour offrent aux musiciens et aux producteurs un outil novateur pour stimuler leur créativité et simplifier leur travail. Stable Audio promet de devenir un atout précieux dans l’arsenal des professionnels de la musique, ouvrant la voie à des expérimentations musicales inédites et à des compositions toujours plus innovantes.
-
Arduino UNO Avec ATmega328 SMD75,00 DH
-
Kit Arduino uno200,00 DH
-
Arduino Uno R3 avec câble USB120,00 DH
- Pour plus d’articles : https://www.moussasoft.com/tutoriels-electroniques
- Twitter: Moussa Lhoussaine (@Moussasoft_com) / Twitter