Intelligenza Artificiale & VoiceOver. A che punto siamo oggi?
L’intelligenza artificiale ad oggi è praticamente onnipresente all’interno della nostra vita di tutti i giorni. Dal funzionamento di un call center con risponditore automatico alla maniera in cui il nostro smartphone apprende le nostre routine per ottimizzare il suo funzionamento migliorando la nostra esperienza d’uso e il consumo energetico.
Tratto imprescindibile dell’AI è quindi la sua possibilità di apprendimento, il deep learning, che ne costituisce il cardine di una continua evoluzione, per altro con la peculiarità che ha bisogno di poco apporto umano per la gestione del progresso di questo suo automatico evolversi.
Appare chiaro che date queste premesse la riflessione di carattere etico comincia a diventare importante ed è un aspetto sul quale trovo fondamentale che ognuno di noi si faccia la sua idea a riguardo, prima che possa diventare troppo tardi, ovvero prima che l’utilizzo dell’AI sia talmente sdoganato nella sua applicazione per discutibili obiettivi.
Mi sovviene a tal punto l’utilizzo dell’Intelligenza Artificiale applicata al Deepfake, ovvero alla produzione di filmati o fotografie che ritraggono un personaggio famoso mentre fa o dice cose che non ha mai realmente fatto o detto. Nella nostra televisione di oggi se ne fa già largo uso e mi riferisco a ciò che viene prodotto a riguardo da Striscia la Notizia (non ultimo il deepfake di Ilary Blasi che si produce in dichiarazioni prive di gusto sulla sua separazione con Francesco Totti).
Quanto la produzione di questi contenuti può alterare la nostra percezione delle notizie e dei fatti? Quanto questa tecnica può essere di per se destabilizzante se applicata in ambiti più rischiosi?
Non volendomi soffermare su questo aspetto etico in particolare, c’è una domanda ulteriore che mi pongo riguardo l’uso dell’intelligenza artificiale, che ormai non conosce limiti di applicazione in qualsiasi campo lavorativo: quanto impatta sul lavoro? Ovvero, dov’è il limite tra l’aiuto al lavoro umano che questa possa fornire e la reale sostituzione che questa abbia al lavoro umano? Chiaramente non sono domande che rivolgo all’intelligenza artificiale stessa, bensì all’uomo, che decide di servirsene.
Nel mio ambito specifico posso dire di non essere ancora preoccupato, ma seriamente pensieroso. Ormai ascolto sempre più spesso prodotti audiovisivi che si servono di una voce non umana. Siamo arrivati a dei livelli di fedeltà interessanti, ma non certo alti. Mi preoccupa quindi la propensione alla scelta della scarsa qualità rispetto all’affidarsi a qualcuno che con il suo imprescindibile fattore umano, possa realmente capire ciò di cui un cliente ha bisogno. Questa possibilità di comprensione umana (che fieramente contrappongo all’apprendimento sintetico di un sistema neurale artificiale) e il lato artistico della mia professione e di quella dei miei colleghi, che non potrà mai essere compensata da nessuna Intelligenza artificiale.
C’è stato un periodo, e molti miei colleghi lo ricorderanno, in cui sono girate numerose offerte di lavoro strane e redditizie. Veniva richiesto di incidere singole frasi e parole con diverse intonazioni. Il volume di frasi richieste era molto alto e molte persone attratte dal guadagno possibile, non sospettando l’uso che se ne sarebbe fatto, hanno “prestato il fianco” agli sviluppatori di piattaforme di AI che si occupavano di generare voci diverse che avessero la capacità di sintetizzare un discorso scritto e di emularne tutte le intonazioni possibili.
Consigliati da LinkedIn
L’uso delle voci sintetizzate è oggi sempre più presente anche nelle forme comunicative immediate dei reels che girano su Instagram, TikTok e Facebook, tipico esempio è quello di animali domestici inquadrati e una voce sintetizzate che parli per loro o narri di loro.
Se pensiamo, però che anche le società di comunicazione stanno affacciandosi a questa possibilità le perplessità a riguardo aumentano. Ho personalmente ascoltato Tutorial, E-learning e Corporate Video prodotti con voce artificiale, potendone ravvisare numerose imperfezioni e sbavature tonali, frasi che finiscono come fossero voci di un elenco anche se facenti parte di un periodo concluso, accenti tonici sbagliati e altre imperfezioni che rendono i prodotti percepibili come qualitativamente scarsi (“Cheap” oserebbe dire oggi il mercato). Inutile dire che molte società ne stanno approfittando attratte dal costo basso. Sono le stesse società alle quali sento forte la spinta di sconsigliare l’uso dell’intelligenza artificiale nei propri prodotti, sia per la componente audio che per quella video (eh già, perché oggi un prodotto audio visivo può essere interamente sviluppato così).
L'invito che rivolgo ai miei clienti, (soprattutto quelli potenziali futuri poiché quelli con cui già collaboro conoscono perfettamente il mio pensiero a riguardo e lo sposano pienamente) è quello di non fare l'errore di considerare gli audiovisivi come prodotti ad alto apporto artistico e, conseguentemente, umano. Anche un tutorial o un E-learning, (prodotti che spesso sono sottovalutati per il loro potenziale a mio parere) possono avere un alto grado comunicativo. L'efficacia di un prodotto del genere è strettamente legata al fattore umano e artistico che sta alla base della sua costruzione.
L'invito che rivolgo invece alle mie colleghe e colleghi è di riflettere su questo scenario e condividere con me i loro punti di vista e le loro opinioni.
In definitiva potrei concludere sintetizzando e astraendo il concetto: la comunicazione è sempre stata e sempre sarà qualcosa fatta dagli individui, per gli individui e tra gli individui. Delegare anche uno solo di questi tre aspetti ad una macchina (quale che sia la sua abilità e potenza) ne snatura il suo atavico paradigma.