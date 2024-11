Suno è il quinto servizio di intelligenza artificale generativa più utilizzato al mondo e continua a fare passi avanti a livello tecnologico, pur dovendo affrontare una causa intentata dall’industria discografica per aver utilizzato canzoni protette da copyright per addestrare il suo modello di AI. L’ultima versione, V4, è notevolmente più realistica ed è già disponibile per gli abbonati a pagamento, prima di essere diffusa a tutti gli utenti. «Sta diventando una piattaforma che genera canzoni che voglio ascoltare», dice Mikey Shulman, co-fondatore di Suno, «e non solo esperimenti da migliorare».

Siamo in uno studio di registrazione nuovo fiammante (con chitarre, bassi e un impianto audio top) allestito negli uffici dell’azienda, che sono altrettanto nuovi. Occupano due piani, che presto diventeranno tre, vicino al campus dell’Università di Harvard a Cambridge, Massachusetts. «Siamo stati costretti a migliorare il modello per giustificare l’acquisto di questi diffusori top di gamma», scherza Shulman. A febbraio, l’azienda aveva una dozzina di dipendenti, ora ne ha più di 50 e altri sono in arrivo. «È difficile competere con OpenAI quando si tratta di accaparrarsi i ricercatori migliori», spiega Shulman, menzionando il colosso dell’intelligenza artificiale che sta dietro a ChatGPT. «Ma abbiamo un nostro punto di forza: siamo i migliori quando si tratta di adeguare i modelli di AI ai gusti degli esseri umani».

Se i modelli linguistici di grandi dimensioni possono essere giudicati secondo parametri oggettivi (per fare un esempio, è possibile confrontare i punteggi di Claude e ChatGPT nei test di ammissione all’università), gli ingegneri di Suno hanno come punto di riferimento i gusti delle persone. E così il modello è stato migliorato prendendo nota delle preferenze espresse dagli utenti che si sono trovati di fronte diversi risultati partendo da uno stesso prompt. «Ora, dopo qualche mese di lavoro, abbiamo un’idea più precisa di quali sono le preferenze umane».

La musica generata dall’intelligenza artificiale da Suno o dal suo concorrente più prossimo, che è Udio, non ha un suono pieno e in questo somiglia a quella dei vecchi MP3 con bitrate basso, una cosa che risulta particolarmente evidente nelle voci. Abbiamo passato un paio d’ore a generare una canzone dietro l’altra. Risultato: le creazioni del V4 non sono mai state altrettanto buone, con cantanti e strumenti più realistici e un effetto stereo più marcato. Shulman dice che il modello è migliorato anche nel songwriting. «La musica sta diventando più interessante. Ci sono sequenze di accordi che uno non si aspetterebbe».

Per uno dei nostri tentativi, che potete ascoltare qui sotto, abbiamo usato un testo che ho scritto sul momento abbinato a un prompt che richiedeva una canzone di organic country. Il risultato è impressionante, sembra quasi di vedere il bordo liso del cappello da cowboy indossato dal finto vocalist. Il cantato sembra lievemente filtrato da AutoTune, probabilmente per via delle tante voci modificate elettronicamente con cui Suno è stato addestrato.



Per chi detesta l’intelligenza artificiale, categoria di persone che almeno sulla carta comprende quasi tutta l’industria discografica e i suoi artisti, molti dei quali hanno firmato petizioni contro il suo uso, la prospettiva di un’AI ancora più efficace nel generare musica è una cattiva notizia. Ci sono, però, delle eccezioni. Timbaland, ad esempio, ha detto a Rolling Stone che ha usato Suno 10 ore al giorno per rifinire canzoni rimaste incomplete e che ha collaborato con l’azienda come consulente creativo. Secondo Shulman molti artisti, autori e produttori usano tranquillamente Suno. Tra loro ci sarebbe almeno una star che ha firmato una petizione contro l’AI.

Shulman spera che si possa raggiungere alla fine un accordo sull’utilizzo dei dati per addestrare l’AI ed è convinto che gli artisti dovrebbero essere maggiormente preoccupati da altri modelli, quelli che in futuro riprodurranno le loro voci anche se non sono stati specificamente addestrati col loro materiale. Suno non permette di farlo, giacché vieta l’uso dei nomi di artisti veri nelle istruzioni per generare le canzoni. «Prima o poi, senza usare la musica di Neil Young, qualcuno addestrerà un modello capace di creare una copia esatta di Neil Young».

Ora Suno non si limita più a generare canzoni basandosi su brevi testi digitati come su ChatGPT. È possibile caricare le proprie composizioni non finite, tracce solo vocali, loop e altri frammenti audio e trasformarli in canzoni, raggiungendo un livello avanzatissimo di collaborazione fra uomo e AI (è persino disponibile, in versione beta, una funzione che consente di caricare video o foto per ispirare le canzoni).

Rebecca Hu, project manager di Suno, sostiene che la possibilità di lavorare su audio pre-esistente sta attirando l’attenzione dei giovani beatmaker. «Molti dei nostri power users sono giovani producer. Per loro rappresenta il futuro. Stiamo cercando di passare a un’interfaccia utente che risponde alla musica e non ai prompt testuali, che sono più difficili da interpretare quando si tratta di generare suoni. Produttori e autori che si trovano in studio per lavorando alle loro canzoni ne faranno l’uso più proficuo». Per ora, l’azienda si concentra ancora sulla mission originale, cioè permettere ai non musicisti di fare musica.

La V4 offre anche la possibilità di utilizzare un nuovo modello, al momento in fase di perfezionamento, in grado di generare testi più credibili rispetto al modello precedente di ChatGPT. È nettamente migliore nella stesura di testi rap, anche se in una delle nostre prove ha copiato un verso di Drake del 2015, “running through the Six”.

La maggior parte dei dipendenti dell’azienda non è preoccupata per la causa per violazione del diritto d’autore che incombe su Suno, dice Shulman, ma «ovviamente pesa, perché a nessuno piace essere citato in giudizio. Qui però stiamo costruendo il futuro della musica. La causa è un ostacolo, ma non ci impedirà di costruire quel futuro». Il prossimo passo è coinvolgere etichette e artisti facendoli diventare partner, «perché quel futuro non possiamo, né vogliamo costruirlo da soli».

Da Rolling Stone US.