LALAL.AI : Un outil en ligne pour extraire instrumentaux et vocaux d’une source sonore

Il y a mille et une raisons de vouloir séparer les instrumentaux et vocaux d’une même source sonore. Peut-être pas mille à vrai dire, mais un certain nombre : préparer un cours de musique, travailler son instrument sur un chant ou au contraire chanter sur la bande musicale de de son choix sont quelques unes des motivations qui poussent au « split » des différentes pistes d’un morceau.

LALAL.AI est sans aucun doute l’outil en ligne le plus affuté pour effectuer cette tâche d’extraction de l’instrumental et du vocal. Ce service est entièrement basé sur un logiciel de machine learning (apprentissage machine), ce qui signifie que l’IA s’est en quelque sorte entrainée afin d’ affiner ses algorithmes de traitement sonore. 200 Go de données ont été fournies au logiciel au démarrage de cette phase d’apprentissage, bientôt suivis par 20To  de datas ! Sans rentrer dans le détail de la tambouille du code, cette phase d’entrainement a nécessité pas moins de 45 millions de paramètres de réseau neuronal et de traitements de signal numérique avancé, du jamais vu pour un logiciel de ce type ! Plusieurs niveaux de filtre d’extraction sont disponibles, soit Léger, Normal ou Agressif. Le niveau léger contient un peu d’erreurs, le niveau moyen (par défaut) en contient beaucoup moins mais avec quelques artefacts sonores, tandis que le niveau Agressif limite au maximum les erreurs.

Les développeurs de LALALAI le claironnent : aucune autre solution n’est aussi efficace, ni même Spleeter ou PhonicMind (explications à la clef). Cette affirmation se double d’une facilité d’utilisation confondante. Il suffit de sélectionner la piste sonore de son choix et de lancer le traitement d’extraction… et c’est tout. LALAL.AI permet bien entendu de récupérer les différentes pistes sonores de manière à pouvoir les exploiter ultérieurement dans un autre logiciel dédié (séquenceur ou échantillonneur par exemple). On notera aussi que l’intégrité du format source est parfaitement respectée : lorsque LALAL.AI traite un fichier MP3, on se retrouve avec du MP3 en sortie, idem pour du WAV ou du FLAC. Pour le dire de façon un peu plus technique, un morceaux codé en 192kHz/24bit ressortira de la moulinette LALAL.AI en 192kHz/24bit ! Les « connaisseurs » apprécieront.

Plusieurs vidéos de comparaison disponibles sur YouTube rassurent d’ailleurs totalement sur les performances de l’outil. Sur l’ensemble des comparos effectués, le timbre et la clarté de la piste vocale sont parfaitement restitués, sans cet effet de mise en sourdine souvent typique de ce genre d’outils. Et cela marche tout aussi bien avec n’importe quel style de musique, du rap en passant par le rock le plus métal, l’IA parvenant sans peine à extraire la piste vocale principale y compris dans les morceaux les plus complexes (multi-instrumental avec de nombreuses pistes sonores). Après LA La Land, LALAL.AI mériterait presque lui aussi son petit Oscar…

Last but not least, plusieurs packages sont disponibles pour l’extraction, soit un pack à 10 dollars pour une dizaine morceaux (ou 90 minutes de musique), un pack à 30 dollars correspondant à 30 morceaux (ou 500 minutes de musique), ou bien encore un pack à « négocier » pour ceux qui ont besoin d’extraire sur un volume musical beaucoup plus important encore.

Articles Similaires

Laisser un commentaire