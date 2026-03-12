Gemini 2 | unifica testo video e audio in un unico spazio

Google ha annunciato il lancio di Gemini Embedding 2, un modello di embedding in grado di integrare testo, immagini, video e audio all’interno di un singolo spazio vettoriale condiviso. Questa novità rappresenta il primo esempio di modello nativamente multimodale sviluppato dall’azienda, che permette di combinare diversi tipi di contenuti in modo più efficiente. La presentazione è stata rilasciata ufficialmente e coinvolge diverse modalità di dati.

Google ha lanciato ufficialmente Gemini Embedding 2, il primo modello di embedding nativamente multimodale che unifica testo, immagini, video e audio in un unico spazio vettoriale condiviso. Questa innovazione tecnologica, annunciata nel marzo del 2026, elimina la necessità di pipeline separate per elaborare contenuti diversi, permettendo a imprese e sviluppatori di gestire dati eterogenei come se fossero una singola entità semantica.