Scienziati preparano un test per sfidare l’IA più potente

Gli esperti di intelligenza artificiale (IA) si stanno preparando per un esame senza precedenti, progettato per mettere alla prova i sistemi di IA più avanzati e quelli ancora in fase di sviluppo. Questo test, soprannominato “L’Esame Finale dell’Umanità”, è una sfida collettiva lanciata dal Center for AI Safety (CAIS) e dalla Scale AI, una società specializzata nell’etichettatura dei dati di addestramento per l’IA. L’obiettivo è quello di creare “la serie di domande più difficile e ampia mai vista” per verificare i limiti e le capacità delle IA.

Secondo quanto riportato da Reuters, il CAIS ha aperto le candidature per la creazione di questo esame subito dopo la pubblicazione dei risultati preliminari del nuovo modello o1 di OpenAI. Dan Hendrycks, direttore esecutivo del CAIS, ha dichiarato che il modello o1 ha “distrutto i benchmark di ragionamento più popolari”, superando di gran lunga le aspettative degli esperti del settore.

La creazione di un test di questo calibro non è una novità per Hendrycks. Già nel 2021, ha co-autore di due articoli in cui proponeva criteri di valutazione per testare se i modelli di IA potessero superare gli studenti universitari. In quell’occasione, i sistemi di IA generavano risposte quasi casuali, ma oggi, come sottolinea Hendrycks, le IA moderne hanno “annientato” i test del 2021.

Pensiero astratto e segretezza del test

Una delle novità più significative di questo nuovo esame è l’inclusione di domande che valutano il ragionamento astratto, una forma di pensiero particolarmente complessa anche per gli esseri umani. Nel 2021, i test si concentravano principalmente su materie come matematica e scienze sociali. Con l’Esame Finale dell’Umanità, però, il CAIS punta a spingersi oltre, cercando di sfidare le capacità di astrazione delle IA con domande che esulano dal pensiero lineare e concreto.

Un altro elemento chiave sarà la segretezza del test. Le due istituzioni organizzatrici hanno deciso di mantenere i criteri e le domande riservati per evitare che vengano inclusi nei dati di addestramento delle future IA. Questa decisione è fondamentale per garantire che le IA non possano prepararsi in anticipo e che i risultati ottenuti siano il più possibile attendibili e imparziali.

Gli esperti provenienti da campi diversi, dalla filosofia alla missilistica, sono invitati a inviare domande che metterebbero in difficoltà chiunque non sia un esperto nel settore. Le domande dovranno essere sottoposte a revisione tra pari e, per gli autori delle migliori proposte, sono previsti premi fino a 5.000 dollari, sponsorizzati dalla Scale AI, oltre alla possibilità di co-firmare un articolo associato al test.

Nonostante la vastità dei campi di competenza che si prevede di esplorare con questo esame, c’è un argomento che non sarà trattato: le armi. Gli organizzatori hanno infatti deciso di escludere qualsiasi domanda relativa a sistemi d’arma, considerando troppo pericoloso che le IA possano acquisire conoscenze dettagliate in questo ambito. Questa esclusione evidenzia l’approccio etico e responsabile che CAIS e Scale AI intendono seguire nella gestione delle tecnologie emergenti.

Il futuro dell’intelligenza artificiale

L’Esame Finale dell’Umanità rappresenta un tentativo audace di capire fino a che punto i sistemi di IA possono spingersi nel pensiero complesso e nella risoluzione di problemi. L’iniziativa ha anche un’importante valenza simbolica: se i modelli di IA riuscissero a superare questa sfida, ci troveremmo di fronte a una nuova era dell’intelligenza artificiale, in cui le macchine potrebbero competere con l’intelligenza umana non solo su compiti operativi, ma anche su quelli più intellettuali.

Tuttavia, questo test solleva anche questioni di sicurezza e controllo. Man mano che le IA diventano più potenti e autonome, la comunità scientifica deve affrontare nuove sfide per garantire che queste tecnologie non sfuggano al controllo e vengano utilizzate per il bene dell’umanità.

Mentre il mondo osserva con interesse lo sviluppo e il superamento di nuovi limiti da parte delle intelligenze artificiali, l’Esame Finale dell’Umanità è destinato a diventare un banco di prova cruciale. Da un lato, sarà un test delle capacità di ragionamento delle IA, dall’altro una riflessione sulle possibilità e i rischi di un futuro in cui le macchine potrebbero rivaleggiare con il cervello umano. Indipendentemente dai risultati, l’iniziativa rappresenta un passo fondamentale verso una comprensione più profonda delle potenzialità e delle responsabilità che derivano dall’innovazione tecnologica.