Meta ha appena presentato AudioCraft, un nuovo modello di intelligenza artificiale generativa (Gen AI) open-source progettato per la creazione di musica ed effetti sonori.
Questo nuovo strumento si compone di tre modelli specializzati:
MusicGen: Creato per generare musica, MusicGen è stato addestrato utilizzando oltre 20.000 ore di canzoni di proprietà di Meta o con licenza. Offre la possibilità di creare composizioni musicali.
AudioGen: Questo modello si occupa degli effetti sonori, come il suono di una porta che si apre o un cane che abbaia. È stato allenato utilizzando librerie di effetti sonori accessibili al pubblico.
EnCodec: EnCodec lavora sulle uscite di MusicGen e AudioGen, eliminando artefatti e imperfezioni per migliorare la credibilità dell'audio generato. Questa nuova versione offre maggiore precisione e potenza rispetto alla precedente.
MusicGen e AudioGen funzionano simili a ChatGPT: l'utente fornisce istruzioni testuali e l'intelligenza artificiale genera l'audio corrispondente. EnCodec agisce in supporto agli altri due modelli.
Meta ha condiviso clip audio create con AudioCraft nel suo annuncio sul blog ufficiale, mostrando esempi di alta qualità. Alcuni esperti di settore, come quelli di The Verge, hanno testato direttamente l'AI e fornito feedback generalmente positivi, sebbene l'artificialità possa essere riconoscibile soprattutto con strumenti analogici.
L'effettiva capacità dell'AI di creare una canzone di successo è ancora incerta, ma strumenti come AudioCraft potrebbero trovare utilità nella creazione di musica di sottofondo per ambienti come negozi, ascensori e call center. Meta ha una visione più ampia, considerando la possibilità che AudioCraft possa evolversi in un nuovo strumento musicale digitale, simile a come avvenuto con i sintetizzatori in passato.
Il pacchetto offerto da Meta porta con sé una serie di vantaggi significativi, in particolare grazie alla sua natura open source. Questo significa che sia ricercatori che professionisti avranno l'opportunità di accedere al codice sorgente e apportare i propri insiemi di dati, contribuendo così al progresso dell'integrazione tra intelligenza artificiale e settore audio. Questo si traduce in concrete opportunità: gli aspiranti artisti che non hanno ancora padronanza degli strumenti musicali possono liberare la loro creatività attraverso AudioCraft. Inoltre, musicisti esperti possono creare nuove basi e brani innovativi sfruttando l'IA e addestrandola con la propria produzione musicale.
AudioCraft rappresenta una soluzione completa per la gestione di aspetti musicali, sonori, di compressione e generazione di brani, tutto racchiuso in un unico pacchetto di facile costruzione e riutilizzo..
Ci teniamo a precisarvi, che attualmente l'adozione di AudioCraft è ancora in fase iniziale e dipende dalla qualità dei dati utilizzati. Meta ammette che MusicGen è stato addestrato principalmente con musica occidentale, e l'apertura del codice sorgente è un'opportunità per ricevere dati più diversificati da parte di ricercatori indipendenti. La complessità della generazione audio è notevole, con milioni di punti di azione dell'AI in un singolo clip, a differenza delle "sole" migliaia presenti nella generazione di testo.
Tags:
Intelligenza artificiale