#MID061 | Agenti autonomi, ma furtivi
#MID061 | Agenti autonomi, ma furtivi

#MID061 | Agenti autonomi, ma furtivi

Nelle ultime settimane, non si sente parlare d’altro che di agenti autonomi, ma, poco o niente, di uno dei loro principali lati oscuri: lo “Scheming Reasoning”, ovvero, il cosiddetto “ragionamento intrigante”, che, di intrigante, parliamoci chiaro, ha davvero ben poco. Per riuscire a capirci qualcosa, mi sono dovuto impegnare. Non mi sono bastati i classici e brevi (ci mancherebbe!) post promozionali che spesso si leggono su social, ma ho rintracciato e divorato un paper di 70 pagine (“Frontier Models are Capable of In-context Scheming”) davvero molto interessante, che, oltre a spaventarmi, mi ha fornito anche qualche risposta.

Sintetizzando (ma, se aveste tempo, vi consiglio di leggere l’intero paper!), lo Scheming Reasoning è la capacità di una Intelligenza Artificiale di fare tre cose ben distinte, ma correlate fra loro: pianificare azioni complesse (e, fin qui, tutto bene), adattarsi alle circostanze (modificando i propri piani in funzione degli eventi) e…manipolare le informazioni! Sì, avete letto bene. Le Intelligenze Artificiali possono omettere dettagli, fornire informazioni false e tendenziose, o addirittura creare artificialmente delle narrazioni farlocche per influenzare le decisioni degli altri.

Più in particolare, lo studio analizza le capacità di alcuni LLM (Large Language Model) di “perseguire obiettivi non allineati in modo furtivo”. Questi modelli, come GPT o1, Claude 3.5 Sonnet e Llama 3.1 possono riconoscere lo “Scheming” come una strategia valida e decidere di impegnarsi attivamente in comportamenti ingannevoli, come introdurre errori strategici nelle loro risposte o tentare di disabilitare i meccanismi di supervisione, soltanto per raggiungere i propri obiettivi.

Tali scoperte hanno sollevato una certa preoccupazione, anche tra ricercatori firmatari dello studio (Alexander MeinkeBronson Schoen, Jérémy Scheurer, Mikita Balesni, Rusheb Shah e Marius Hobbhahn), soprattutto riguardo ai rischi associati all'uso di agenti autonomi basati sull’Intelligenza Artificiale, poiché la loro capacità di ragionare in maniera “intrigante” potrebbe rappresentare una minaccia concreta e non solo teorica.

Bisognerebbe parlarne, no? Che ne dite? Non mi pare che i nostri blasonati organi di informazione specializzata abbiano fatto a gara per essere i primi a rilanciare questa notizia. Come vi ripeto ormai da diversi mesi, c’è un grosso problema di “narrazione”, e non sto parlando di quella degli agenti autonomi! Se non la smetteremo di esaltare superficialmente le innovazioni senza evidenziarne anche i limiti, andrà tutto a rotoli. Questa è un’opportunità davvero irripetibile (sto parlando dell’AI!), ma non abbiamo ancora dimostrato di saperla gestire. Parlare dei problemi, non significa certo mettere in discussione le potenzialità di una specifica tecnologia, ma piuttosto, sarebbe un buon punto di partenza per comprendere qualcosa che, al momento, possiamo soltanto immaginare.

Buon Weekend!

Andrea Camerino


 

Sponsorizza Make It Digital!

🔔Vuoi sponsorizzare uno dei prossimi episodi di Make It Digital? Scrivimi!

🚀 Make It Digital viene letta, ogni settimana, da oltre 450 professionisti di settore interessati ai temi del digitale e della tecnologia, con un open rate superiore al 45%.

Per visualizzare o aggiungere un commento, accedi

Altri articoli di Andrea Camerino

  • #MID063 | Un futuro diverso

    #MID063 | Un futuro diverso

    Non ve ne ha parlato quasi nessuno in maniera così esplicita, ma la vera novità del 2024 in ambito digitale è stata…

  • #MID062 | Le AI sono sempre più voraci

    #MID062 | Le AI sono sempre più voraci

    Ilya Sutskever, ex-OpenAI, oggi, fondatore di una nuova startup chiamata Safe Superintelligence, ha recentemente…

  • #MID060 | Un miliardo di utenti

    #MID060 | Un miliardo di utenti

    Sarah Friar, direttrice finanziaria di OpenAI, ha dichiarato che il principale obiettivo della società californiana per…

  • #MID059 | L’inarrestabile ascesa del web conversazionale

    #MID059 | L’inarrestabile ascesa del web conversazionale

    Se, fino all’altro ieri, la forma più avanzata di world wide web era il Web 3.0, ovvero il cosiddetto web…

  • #MID058 | Due pesi e due misure

    #MID058 | Due pesi e due misure

    Che il Search Engine sia uno dei settori maggiormente impattati dall’avvento dell’AI Generativa non è più una novità…

  • #MID057 | Fare arte con l’AI

    #MID057 | Fare arte con l’AI

    Avreste mai immaginato che un robot o, meglio ancora, una Intelligenza Artificiale, potesse “fare arte”? Io no davvero,…

  • #MID056 | Il “mercato di internet” è vivo più che mai

    #MID056 | Il “mercato di internet” è vivo più che mai

    Tra la fine del vecchio e l’inizio del nuovo millennio, la compravendita di domini internet era un passatempo molto…

  • #MID055 | La democratizzazione della ricerca

    #MID055 | La democratizzazione della ricerca

    Parliamoci chiaro: fino a qualche anno fa, nessuno avrebbe mai potuto immaginare di “mettersi contro” Google in area…

  • #MID054 | Il futuro dei podcast

    #MID054 | Il futuro dei podcast

    Negli ultimi giorni, non ho fatto altro. O quasi.

    2 commenti
  • #MID053 | Chiacchiere e distintivo

    #MID053 | Chiacchiere e distintivo

    Non potendo far leva su una particolare passione per le automobili, cosa, questa, che mi avrebbe senz’altro consentito…

    9 commenti

Altre pagine consultate