Recap Google I/O 2026: Agenti e Gemini Omni

Il Google I/O del 19 maggio 2026 possiamo riassumerlo nella frase di Sundar Pichai: siamo entrati nell’era degli agenti Gemini. Tradotto: l’intelligenza artificiale passa dal rispondere a fare cose per noi. Modelli nuovi, agenti che lavorano mentre dormiamo, una Ricerca che assomiglia sempre più a una conversazione, occhiali smart in arrivo e perfino un carrello della spesa che ragiona da solo. Vediamo il recap!

Gemini: la crescita di Utenti e Token usati

Prima di entrare nel merito, un dato che vale più di mille slide. Due anni fa Google elaborava circa 9,7 trilioni di token al mese su tutte le sue piattaforme. All’I/O dell’anno scorso erano già diventati 480 trilioni. Oggi siamo oltre i 3,2 quadrilioni al mese: una crescita di sette volte in dodici mesi.

Anche il resto dell’ecosistema cresce importante: più di 8,5 milioni di sviluppatori costruiscono ogni mese qualcosa sopra i modelli di Google, e nell’ultimo anno oltre 375 clienti Google Cloud hanno superato singolarmente il trilione di token elaborato. L’app Gemini, intanto, è passata da 400 milioni di utenti attivi mensili nel 2025 a più di 900 milioni oggi, con le richieste quotidiane cresciute di oltre sette volte.

Insomma: Google sta scalando come pochi possono permettersi, e i sette annunci dell’I/O vanno letti in questa cornice.

1. Gemini 3.5 Flash, il modello che fa tutto il lavoro pesante

Gemini 3.5 Flash è il primo di una nuova generazione di modelli che mette insieme intelligenza di frontiera e capacità di agire. Rispetto al precedente 3.1 Pro è migliore su quasi tutti i benchmark, con un balzo importante su GDPVal, che misura quanto un modello sa fare cose economicamente rilevanti nel mondo reale.

Il vero punto di forza, però, è il rapporto fra velocità e prezzo. Sui token di output al secondo è circa quattro volte più veloce degli altri modelli di frontiera, e costa meno della metà di prodotti paragonabili. Il CEO di Alphabet Pichai ha fatto un calcolo che fa rumore: una grande azienda che oggi elabora un trilione di token al giorno, spostando l’80% del carico su Flash, potrebbe risparmiare più di un miliardo di dollari all’anno. È il tipo di numero che, nei prossimi consigli di amministrazione, qualcuno tirerà fuori.

Il modello è disponibile da subito su tutti i prodotti Google e via API.

La versione 3.5 Pro, invece, arriverà il mese prossimo.

2. Gemini Omni, quando l’AI inizia a simulare

Gemini Omni è un modello capace di prendere in input qualsiasi cosa -immagini, audio, video, testo – e generare video coerenti, modificabili poi semplicemente parlandoci.

Tre caratteristiche fanno la differenza rispetto a quello che si vedeva fino a ieri:

editing conversazionale: ogni istruzione si somma alla precedente, i personaggi restano se stessi, la fisica viene rispettata e la scena ricorda quello che è successo prima.
Omni “capisce” il mondo: gravità, energia cinetica, dinamica dei fluidi sono interpretate in modo intuitivo, e attorno ci sta tutta la conoscenza di Gemini su storia, scienza, cultura. Il risultato non è più solo un video bello, ma un video sensato.
multi-input nativo: puoi mescolare un’immagine di riferimento, una clip esistente e un audio, e ottenere un singolo output coerente.

Sul fronte trasparenza, ogni video creato con Omni porta la filigrana invisibile SynthID e le credenziali C2PA, così è verificabile se un contenuto è stato generato dall’AI.

3. Gemini Spark, l’agente personale 24/7

Qui si entra nel cuore della “svolta agentica“. Spark è l’agente AI personale nell’app Gemini, pensato per gestire pezzi della vita digitale al posto nostro, ovviamente sotto il nostro controllo. Gira su macchine virtuali dedicate sul cloud di Google e resta attivo 24 ore su 24, così non serve tenere acceso il computer o il telefono.

“Sotto il cofano” c’è Gemini 3.5 più la piattaforma Antigravity, e nelle prossime settimane Spark si collegherà a strumenti di terze parti via MCP, lo standard ormai diffuso per far parlare gli agenti con il resto del mondo.

Su Android sarà monitorabile in tempo reale grazie a un nuovo spazio dell’interfaccia chiamato Android Halo, in arrivo entro fine anno, e più avanti in estate Spark si insedierà direttamente dentro Chrome, diventando di fatto un browser-agente. La distribuzione parte questa settimana con un gruppo di tester selezionati. La Beta arriva per gli abbonati Google AI Ultra negli Stati Uniti la settimana prossima.

A Spark si affianca Daily Brief, un agente più piccolo ma molto pratico: pesca da Gmail, Calendar e Tasks, stabilisce priorità e prepara un riassunto mattutino con i passi successivi suggeriti.

4. La Ricerca diventa agentica (e a volte si costruisce da sola)

La Ricerca resta il core business di Google e i numeri lo confermano: AI Overviews ha superato i 2,5 miliardi di utenti attivi mensili, e AI Mode – l’aggiornamento più importante mai fatto a Search – ha superato il miliardo di utenti in dodici mesi.

Le novità presentate spingono ancora oltre. Arrivano gli agenti informativi: assistenti AI personalizzati che si lasciano “accesi” in background e cercano cose per noi al momento giusto. Saranno disponibili in estate per gli abbonati Pro e Ultra. C’è poi l’interfaccia generativa: la Ricerca, grazie a Flash più Antigravity, costruirà al volo layout dinamici e grafiche interattive su misura della domanda. Gratis per tutti, sempre in estate 2026. E infine, per i compiti che durano nel tempo, la Ricerca potrà generare vere e proprie dashboard e tracker persistenti: piccole app personali che continuano a vivere oltre la singola query per esigenze continue e frequenti ( tipo una dashboard delle previsioni del meteo).

A tutto questo si aggiungono Ask YouTube – che porta direttamente al punto esatto del video che ci serve, in test ora e in rollout negli Stati Uniti in estate – e Ask Maps, già lanciato e usato per fare a Google Maps domande lunghe e complesse, da turista esigente.

Google Workspace impara ad ascoltare

In Google Workspace il tema dell’I/O 2026 è la voce. Docs Live ne è l’esempio più chiaro: invece di scrivere un prompt preciso, si può fare un “brain dump” parlato – tutto quello che si ha in testa, alla rinfusa – e lasciare a Gemini il compito di trasformarlo in documento. In prospettiva, sia la creazione che le modifiche si potranno fare interamente a voce. Disponibile per gli abbonati in estate 26, insieme a funzioni vocali simili su Gmail e Keep.

Sul lato creativo arriva Google Pics, basato su Nano Banana. La differenza con un normale editor è che tratta ogni elemento dell’immagine come un oggetto singolo, non come pixel: si possono sostituire dettagli, perfezionarli, rifare solo un pezzo, senza rompere il resto. Disponibile per tester selezionati ora, in arrivo in estate per gli abbonati Workspace Pro e Ultra.

Occhiali smart dall’autunno 2026

E’ Iniziata la fine dell’interfaccia smartphone? Google torna sul wearable, e questa volta con partner che pesano: Gentle Monster e Warby Parker firmano le montature. Sul mercato arriveranno prima gli occhiali audio, capaci di portare l’assistenza vocale direttamente nell’orecchio per ricevere indicazioni, inviare messaggi, scattare foto a comando. Più avanti seguiranno quelli con display, che mostreranno informazioni nel campo visivo solo quando servono. Il filo comune è mani libere e sguardo avanti: l’opposto del modello “testa china sullo schermo e male al toccolo dal troppo smartphone”.

Carrello universale e shopping agentico

Google ha presentato il Carrello universale e un set di strumenti pensati per il commercio basato su agenti – uno scenario in cui non scegliamo più solo cosa comprare, ma deleghiamo all’AI il “come” e il “quando”, lasciandole confrontare prezzi, tempi, disponibilità e portare a casa il risultato. È un cantiere aperto, ma la direzione è dichiarata. Ne parleremo nel nostro prossimo corso di GEO.

TPU di ottava generazione e SynthID condiviso

Tutto questo gira su un’infrastruttura che Google sta ampliando in modo vertiginoso. Nel 2022 la spesa in conto capitale era di 31 miliardi di dollari l’anno; quest’anno sarà circa sei volte tanto, intorno ai 190 miliardi come annunciato nell’ultima call degli investitori.

Sul palco sono state ribadite le novità delle TPU di ottava generazione, con un approccio inedito a doppio chip: la 8t è ottimizzata per il pre-training su larga scala e triplica quasi la potenza di calcolo grezza della generazione precedente, permettendo addestramenti distribuiti su oltre un milione di TPU; la 8i è pensata per l’inferenza, con prestazioni per watt fino a due volte superiori.

C’è poi un capitolo sulla trasparenza che merita attenzione. SynthID, la filigrana invisibile di Google, ha già marcato oltre cento miliardi di immagini e video più sessantamila anni di contenuti audio. La notizia è che il suo bacino di adozione si allarga: oltre a Nvidia, che l’aveva adottata lo scorso anno, ora la implementano anche OpenAI, Kakaw ed Eleven Labs. Tradotto: per la prima volta i grandi rivali si parlano su uno standard di provenienza dei contenuti AI. È più importante di quanto sembri.

Cosa portarsi a casa da Google I/O 2026

Per chi usa Gemini tutti i giorni, il cambiamento percepito sarà la proattività: Spark, Daily Brief e gli agenti informativi lavorano senza aspettare istruzioni puntuali. Passiamo dal Gemini “prompt e risposta” al Gemini Assistente che sa cosa stiamo facendo.

Per chi sviluppa, il combinato disposto di 3.5 Flash a prezzi aggressivi, Antigravity 2.0 come piattaforma per gestire flotte di agenti, e MCP come ponte verso il resto del mondo riduce drasticamente attrito e costi. Costruire qualcosa di agentico, fino a poco fa, costava molto in tempo e denaro. Ora un po’ meno.

Per le aziende, il messaggio è esplicito: Flash come leva di ottimizzazione dei costi AI, con risparmi potenzialmente enormi sui grandi carichi di lavoro. È un argomento che i CFO ascolteranno con interesse anche perchè i costi di Claude (usato molto nel B2B) stanno salendo!

Più in generale, il filo dell’I/O 2026 non è tanto il singolo modello nuovo, quanto la distribuzione su larga scala dell’AI agentica nei posti dove le persone già passano il tempo: nella Ricerca, dentro Chrome, in Workspace, sul telefono, presto sugli occhiali. Sarà l’estate a dire quanto della promessa regge nell’uso reale, ma la direzione è chiara: meno fatica per arrivare al risultato, più cose che succedono mentre facciamo altro.

Domande frequenti su Google I/O 2026

Quali sono state le principali novità di Google I/O maggio 2026?

Google ha presentato sette annunci chiave: il modello Gemini 3.5 Flash, il modello creativo Gemini Omni, l’agente personale Gemini Spark, una nuova Ricerca agentica con interfaccia generativa, le funzioni vocali in Workspace come Docs Live, gli occhiali smart in arrivo in autunno e il Carrello universale per lo shopping basato su agenti.

Cos’è e come funziona Gemini Spark?

Gemini Spark è l’agente AI personale dentro l’app Gemini. Gira sul cloud di Google, resta attivo 24 ore su 24 e svolge compiti complessi al posto dell’utente, sotto il suo controllo. Si integra con strumenti di terze parti tramite MCP e arriverà in Beta agli abbonati Google AI Ultra negli Stati Uniti la prossima settimana.

Quando arriva Gemini Omni e chi può usarlo?

Gemini Omni Flash, primo modello della famiglia, è in rilascio da oggi a livello globale per gli abbonati Google AI Pro e Ultra tramite l’app Gemini e Google Flow. Da questa settimana è disponibile gratuitamente anche su YouTube Shorts e nell’app YouTube Create. L’accesso via API per sviluppatori arriverà nelle settimane successive.

Cosa cambia nella Ricerca Google dopo l’I/O 2026?

La Ricerca diventa più conversazionale e agentica. Arrivano gli agenti informativi che lavorano in background, l’interfaccia generativa che crea layout dinamici su misura della domanda, e dashboard persistenti per i compiti che durano nel tempo. Si aggiungono Ask YouTube e Ask Maps per domande complesse su video e luoghi.

Source link