Questa volta l’anno scorso, i social media hanno brillato con il virale “Deep Nostalgia” di MyHeritage, la cui magia dell’IA anima le nostre vecchie foto di famiglia con un realismo inquietante. Bene, se ne vai fuori di testa, aspetta di vedere la nuova funzione che ho appena chiamato Storia dal vivo.
Questa volta, la tecnologia di un’azienda di genealogia online non sta creando una piccola clip di 10-20 clip basata su una vecchia foto di un tuo parente. Invece, LiveStory va oltre creando un video animato più lungo del tuo antenato che racconta la storia di tutta la sua vita, completo di audio con sincronizzazione labiale e una presentazione di vecchie foto.
Come prima, funziona utilizzando la tecnologia di “rievocazione” basata sull’intelligenza artificiale che anima l’immagine del viso di un parente. Ma questa volta ottieni anche una voce che viene generata automaticamente dall’albero genealogico di MyHeritage o inserita manualmente da te. Quindi la tecnologia di sintesi vocale dà vita alla storia e la voce viene sincronizzata con l’altoparlante in movimento del tuo parente.
Come funziona?
Come la tecnologia “Deep Nostalgia” dell’anno scorso, le animazioni di LiveStory vengono create utilizzando un’ampia raccolta di “video del driver”. Una volta che gli algoritmi del servizio analizzano l’immagine che hai caricato, le sue caratteristiche salienti o le “caratteristiche” del viso vengono quindi mappate sul video del conducente per creare l’impressione del movimento. Gli algoritmi compilano anche tutti i dettagli mancanti. Il generatore di voci sintetiche crea anche una narrazione basata sulle informazioni nel profilo della persona, oppure puoi creare il tuo script da zero. Puoi anche caricare la tua registrazione audio.
MyHeritage e D-ID, la società israeliana che crea e concede in licenza la tecnologia, affermano che il risultato finale è completamente personalizzabile, dandoti la possibilità di modificare la narrazione, le immagini e l’audio prima di inviarlo alla famiglia o ai social media. LiveStory sembra anche supportare 31 lingue, dozzine di dialetti e centinaia di caratteri vocali, insieme a diverse opzioni vocali maschili e femminili.
Nonostante tutto, non c’è dubbio che la tecnologia sia un po’ inquietante e ci porti in un viaggio ancora più grande nella valle misteriosa. Per alcuni, l’aggiunta dell’audio potrebbe portare le cose troppo lontano e MyHeritage ha dovuto aggiungere alcune dichiarazioni di non responsabilità per garantire che la tecnologia non venisse abusata. Dice che LiveStory “è inteso solo per essere utilizzato su fotografie di persone decedute, di solito i propri antenati” e che “non dovrebbe mai essere utilizzato su una fotografia di una persona vivente senza il loro permesso”.
Tuttavia, molti sui social media hanno scoperto che la tecnica della “profonda nostalgia” dell’anno scorso era un modo confortante o addirittura caloroso per relazioni che non avevano mai visto prima nella vita reale. Come questa funzione, LiveStory è attualmente disponibile per la prova gratuita su desktop e Web mobile (entrambi tramite Sito MyHeritage) e nell’app mobile MyHeritage. Puoi creare diverse LiveStories gratuitamente, ma in seguito dovrai pagare un abbonamento (da $ 119 / £ 89 all’anno).
Analisi: una mossa più audace nella valle misteriosa
Proprio come “Deep Nostalgia” dell’anno scorso, siamo un po’ combattuti sulla nuova funzione “LiveStory” di MyHeritage. Non c’è dubbio che la tecnologia sia eccezionale e il fatto che possa generare automaticamente una biografia video di 90 secondi da una foto, un albero genealogico e del testo è sia impressionante che terrificante.
Tuttavia, non possiamo fare a meno di pensare che gran parte del precedente successo virale della tecnologia (che ha portato a 100 milioni di animazioni) sia dovuto alla sua precisione. I volti in movimento prodotti da Deep Nostalgia sbattevano occasionalmente o inclinavano la testa, ma era così – e questa restrizione ha contribuito a creare un’illusione mascherando i limiti della tecnologia.
L’aggiunta del suono è un passaggio logico e senza dubbio si rivelerà uno strumento popolare per coloro che non hanno i brividi dall’innegabile fattore di scorrimento. Ma dagli esempi che abbiamo visto finora, l’intonazione a volte è automatizzata e il fatto che il suono non sia campionato dall’originale lo rende alquanto artificiale.
Attualmente, LiveStory sembra essere più adatto ai musei o all’istruzione, dove la sua capacità di portare in vita personaggi storici (piuttosto che relazioni personali) potrebbe essere un modo utile per rendere la storia più coinvolgente per visitatori e bambini.
Naturalmente, esiste anche il potenziale per un uso improprio, sebbene D-ID (il produttore della tecnologia) abbia messo in atto alcune barriere per impedire che ciò accada. Tutti gli utenti devono accettare i termini, inclusa la promessa di non utilizzarli su persone viventi, prima di poter creare una LiveStory. C’è anche un algoritmo di modifica del testo a bordo per verificare la presenza di informazioni offensive, diffamatorie o false, anche se non è chiaro come queste ultime vengano controllate.
quando Abbiamo parlato con D-ID l’anno scorso in un’intervista esclusivaSiamo impressionati dal suo impegno nell’assicurarsi che la sua tecnologia di intelligenza artificiale non venga utilizzata in modi nefasti, se anche leggermente infastiditi dalla sua previsione che la maggior parte dei media visivi che vediamo online saranno sintetici “entro 5-10 anni”. LiveStory è chiaramente un altro passo avanti: questa traccia, se non la mossa, è il successo virale che è stato “profonda nostalgia” l’anno scorso.