Cerca

Tecnologia

L'Intelligenza artificiale sfida Super Mario: un nuovo modo di misurare le prestazioni IA

L'IA Claude 3.7 Sonnet eccelle nei videogiochi, ma la sua abilità è davvero pronta?

L'Intelligenza artificiale sfida Super Mario: un nuovo modo di misurare le prestazioni IA

La scorsa settimana, il panorama tecnologico è stato sconvolto da un evento sorprendente: la trasmissione in diretta su Twitch del modello IA denominato Claude 3.7 Sonnet, ideato da Anthropic, mentre si cimentava con il gioco Pokémon Rosso. Questo avvenimento ha destato un ampio interesse, ma rappresentava solo l'inizio. Alcuni giorni dopo, i ricercatori del Hao IA Lab, affiliato all'Università della California a San Diego, hanno deciso di mettere alla prova la capacità dell'intelligenza artificiale con un altro iconico videogioco: Super Mario Bros.

Claude 3.7 Sonnet, descritto come il primo modello di intelligenza artificiale dotato di un ragionamento ibrido, ha dimostrato di eccellere come giocatore di Super Mario Bros., superando perfino il suo predecessore, Claude 3.5. Stando a quanto riportato da TechCrunch, il gioco è stato eseguito su un emulatore e integrato con un sistema denominato Gaming Agent. Tale sistema ha consentito all'intelligenza artificiale di assumere il controllo del personaggio di Mario, seguendo istruzioni dettagliate come "se un ostacolo o un nemico è vicino, muoviti/salta a sinistra per eludere", supportate da immagini del gioco

Nonostante le istruzioni puntuali, Super Mario Bros. ha messo a dura prova le capacità di pianificazione e strategia dei modelli di intelligenza artificiale. Inaspettatamente, i modelli computazionali con capacità di ragionamento hanno ottenuto risultati inferiori rispetto a quelli senza tale capacità. Questo perché il gioco richiede un tempismo eccellente e molti modelli si sono rivelati troppo lenti nel ragionamento. È un po' come cercare di risolvere un cubo di Rubik mentre si corre: rapidità e precisione sono fondamentali. Tuttavia, non tutti ritengono che la competenza di un'IA in Super Mario sia un indicatore affidabile delle sue prestazioni globali.

Andrej Karpathy, ricercatore e membro fondatore di OpenAI, ha espresso dubbi sulla validità di questi test, affermando: "C'è una crisi di valutazione. Non so davvero quali parametri guardare in questo momento." La sua riflessione solleva un quesito fondamentale: i videogiochi possono effettivamente misurare l'intelligenza di un modello IA? Nonostante le critiche, l'idea di osservare un sistema di intelligenza artificiale alle prese con i giochi della nostra infanzia ha un fascino indiscutibile.

Resta aggiornato, iscriviti alla nostra newsletter

Logo Federazione Italiana Liberi Editori L'associazione aderisce all'Istituto dell'Autodisciplina Pubblicitaria - IAP vincolando tutti i suoi Associati al rispetto del Codice di Autodisciplina della Comunicazione Commerciale e delle decisioni del Giurì e de Comitato di Controllo.