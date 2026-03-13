Dalla matematica alle lingue antiche | il nuovo esame che mette in crisi l’intelligenza artificiale

Negli ultimi anni, i sistemi di intelligenza artificiale hanno ottenuto risultati sempre migliori nei test accademici, dimostrando progressi significativi in vari ambiti. Recentemente, è stato introdotto un nuovo esame che copre materie come matematica e lingue antiche, mettendo alla prova le capacità delle macchine. Questa novità ha suscitato interesse tra gli esperti che seguono lo sviluppo dell’intelligenza artificiale.

Negli ultimi anni i sistemi di intelligenza artificiale hanno raggiunto risultati sempre più elevati nei test accademici utilizzati per valutare le loro capacità. Molti modelli avanzati riescono ormai a ottenere punteggi molto alti nei benchmark tradizionali, superando spesso livelli considerati difficili fino a pochi anni fa. Tra questi test c'è il noto Massive Multitask Language Understanding, un esame molto utilizzato per misurare le competenze linguistiche e logiche dei modelli di IA. Il problema, secondo molti ricercatori, è che questi strumenti non riescono più a distinguere con precisione i livelli di abilità dei sistemi più avanzati. In altre parole, le prove che un tempo rappresentavano una vera sfida per le macchine oggi risultano troppo semplici per valutare l'effettiva complessità dei modelli più evoluti.