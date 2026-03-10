Le intelligenze artificiali trovano complicato leggere i PDF, un formato molto usato ma complesso da interpretare per le macchine. Questo problema riguarda sia la struttura del file che i vari elementi contenuti al suo interno, rendendo difficile l'estrazione di dati utili. Nonostante la loro diffusione, i PDF rappresentano una sfida tecnica per l'elaborazione automatica delle informazioni.

Che si tratti di moduli per la pubblica amministrazione, documenti di lavoro o progetti personali, ogni giorno milioni di persone scaricano e inviano file in PDF. Il formato, creato da Adobe nel 1993, è ormai uno standard universale, ma con la diffusione dei programmi di intelligenza artificiale (AI) i suoi limiti tecnici sono diventati sempre più evidenti. I PDF (da Portable Document Format) sono stati infatti creati per essere usati dagli utenti, più che dalle macchine. La scarsa leggibilità dei PDF da parte dei sistemi informatici è un problema noto da tempo, ed è diventato ancora più urgente negli ultimi anni. A dispetto della loro capacità di comprendere e generare contenuti di vario tipo, infatti, i modelli linguistici come GPT-5 continuano ad avere grossi limiti nella lettura (o parsing) dei documenti in PDF. 🔗 Leggi su Ilpost.it

