Tendenze e novità dal mondo dell'Intelligenza Artificiale

Quali saranno i modelli e le applicazioni al centro del settore nel prossimo anno?

Il 2023 è stato un anno cruciale nel mondo dell’IA: dal lancio di Chat-GPT, e con la diffusione dei modelli generativi sul mercato generalista, l’Intelligenza Artificiale ha catturato l’interesse dell’opinione pubblica ma anche delle aziende - incluse molte che fino a pochi mesi prima si ritenevano totalmente estranee al tema. Il momento di popolarità, inoltre, è coinciso con un rinnovato fermento nell’ambito della ricerca applicata: dall’affinamento delle architetture per le reti neurali alla sperimentazione di nuovi modelli per permettere ai robot di muoversi in autonomia, sono continui gli annunci di nuove tecniche e le presentazioni di nuovi strumenti innovativi basati sull’Intelligenza Artificiale. In un contesto così vivace, riesce difficile (ma fondamentale) mantenersi aggiornati su tutte le evoluzioni della tecnologia e individuare le applicazioni che si riveleranno più efficaci. Per questo, rifacendoci alle competenze accademiche e all’esperienza sul campo del team Aidia, abbiamo deciso di stilare una lista dei trend IA più rilevanti per il 2024: un punto degli aspetti del settore a cui prestare maggiore attenzione.

Le novità nella ricerca accademica

Dati i risvolti dell’ultimo anno, con il grandissimo interesse in ambito generativo e alcune innovazioni interessanti nel settore della robotica, è facile credere che i prossimi trend, per quanto concerne la creazione di nuovi modelli e tecniche, riguarderanno prima di tutto il settore generativo e in secondo luogo i sistemi di apprendimento pensati per la robotica. Altri aspetti da tenere d’occhio, nell’ambito della ricerca, saranno le sperimentazioni con nuovi tipi di architetture neurali (sempre più spesso ispirate dalla fisica e dai fenomeni naturali) e i tentativi di riunire le potenzialità del Quantum Computing con l’Intelligenza Artificiale.

Generative AI: la generazione di video e l’affinamento dei diffusion models

Nell’ambito più chiacchierato dell’IA, quello dell’IA Generativa, probabilmente vedremo emergere strumenti di generazione video sempre più sofisticati. I recenti sviluppi di Runaway, la startup co-creatrice di Stable Diffusion che ha lanciato a Novembre il primo modello che produce video realistici e il lancio, solo pochi giorni fa, di Sora, il modello di generazione video di OpenAI, fanno presagire che il 2024 sarà l’anno dell’IA generativa per la produzione di video. I prossimi prototipi di questi e di altri modelli (come Imagen e Make-A-Video) sapranno probabilmente produrre video più lunghi, più dettagliati e privi di alcune delle imperfezioni più vistose prodotte dai primi modelli. Probabilmente, cioè, si andranno a migliorare aspetti come la mancata permanenza dei soggetti che fuoriescono momentaneamente dalla scena o la capacità di mantenere una certa proporzione nella dimensione degli oggetti. Il miglioramento delle capacità di generare video (e immagini) di qualità andrà di pari passo con il miglioramento e l’affinamento dei diffusion models**: i modelli fondativi di questo tipo di Intelligenza Artificiale. I diffusion models (o “modelli probabilistici a diffusione”) imparano a generare immagini originali apprendendo, prima, come “degradare” e nascondere le immagini (inserendo rumore, cioè interferenze, nel dataset originale) e poi a decodificare e rendere di nuovo visibili gli stessi dataset, le stesse immagini, prima compromesse. Il processo, dopo molte iterazioni, permette di creare un sistema che riesce a generare nuove immagini a partire dal solo rumore. Per questo si pensa che le prossime innovazioni in questo campo si indirizzeranno ad accelerare i processi di campionamento: nuove tecniche per migliorare la comprensione della distribuzione specifica di un dataset e imparare a generare output coerenti, anche quando i dati a disposizione sono pochi. A questi sviluppi nell’ambito video si accompagneranno, certamente, **ulteriori affinamenti dei Large Language Models**- alla base di alcune delle applicazioni di gen IA più diffuse - basti pensare al nuovo modello di Google, *Gemini_, lanciato due mesi fa e a _Mixtral*, il più grande LLM europeo, che è stato presentato solo poche settimane fa: entrambi grandi passi avanti rispetto ai loro diretti predecessori.

L’IA per la robotica: i modelli multimodali e le nuove tecniche di apprendimento

La robotica, incalzata da innovazioni che riguardano il Machine Learning e l’IA, sta attraversando una fase di profondo rinnovamento - che potrebbe trasformarsi, in qualche anno, in una vera e propria rivoluzione tecnologica. Il rinnovamento prende le mosse, in particolare, da due aspetti della ricerca legati al Machine e al Deep Learning: le innovazioni relative al multimodal learning (una tipologia di Deep Learning che riesce a elaborare parallelamente varie tipologie di dati, ad esempio testi e immagini) e i progressi che riguardano i metodi di apprendimento. Negli ultimi sei mesi, ad esempio, sono state rese pubbliche varie sperimentazioni su nuovi tipi di framework e architetture, (come OK-Robot, che combina modelli di linguaggio e di riconoscimento visivo con algoritmi volti alla navigazione spaziale e alla manipolazione degli oggetti); ma anche vari metodi originali per “insegnare” ai modelli a fondamento dei robot come muoversi e manipolare il contesto intorno a sé. A ottobre, ad esempio, un gruppo di ricercatori di Berkeley e del MIT, in collaborazione con DeepMind, hanno ipotizzato l’utilizzo di simulatori realistici per addestrare i modelli per la robotica - mentre altri studi si sono concentrati su nuovi tipi di apprendimento, come il “self-supervised learning” o la “Human Guided Exploration (HuGE)”. Questi progressi, sempre più ravvicinati tra loro e con risvolti concreti, lasciano presagire che il prossimo anno sarà ricco di novità.

Applicazioni pratiche: trend ed evoluzioni

Dalla medicina alla ricerca scientifica, i risvolti pratici dell’Intelligenza Artificiale hanno, sempre più, conseguenze concrete nel mondo reale - ma tra questi, quali saranno i più importanti? Quali applicazioni avranno maggiori effetti? Posta la vastità della questione, le novità più interessanti potrebbero emergere sia nella ricerca scientifica, ad esempio nell’ambito relativo alla scoperta e sperimentazione di nuovi materiali, sia nel raffinamento di strumenti e applicazioni che migliorino tangibilmente la produttività aziendale - e altrettante grosse novità potrebbero emergere nell’ambito dei videogiochi e dell’intrattenimento e nel settore dedicato all’assistenza clienti. Molte delle novità sono legate a doppio filo ai progressi e alla raffinazione dei modelli generativi, che potrebbero aprire a nuovi spazi di personalizzazione e interazione, ma anche, semplicemente, a nuove potenzialità di calcolo.

Un nuovo tipo di produttività aziendale: l’augmented work

Se gli esseri umani sono più propensi agli errori, alla stanchezza e a variazioni imprevedibili di produttività, dall’altra parte i sistemi di IA risultano molto più limitati quando si tratta di risolvere in modo creativo un problema o inventare e intraprendere decisioni strategiche. Per questo le maggiori opportunità, nel mondo del lavoro, proverranno dalla possibilità di unire questi due elementi: fornire alla forza lavoro strumenti di agilità e rapidità che riducano al minimo le operazioni banali; affiancare all’IA un controllo e una guida umana, che possa indirizzarne e ottimizzarne il lavoro. Ai suoi albori lo scorso anno, il cosiddetto “augmented work” prenderà sempre più piede nei prossimi mesi, con l’affinamento effettivo di assistenti digitali e strumenti di automazione, ma anche con la formazione di nuovi paradigmi di lavoro - pensati e strutturati per mettere davvero a frutto la potenza dell’Intelligenza Artificiale.

Potenziare i videogiochi con l’IA

Tra le applicazioni più affascinanti e con maggiori prospettive di sviluppo ci sono quelle legate all’intrattenimento: il supporto alla creazione di contenuti grafici e la possibilità di generare storie, conversazioni e ambienti inediti, apre a nuove possibilità nel cinema, ma ancor più nel mondo dei videogiochi. Le case di produzione videoludica, infatti, già da anni cercano di garantire esperienze immersive e altamente personalizzate ai giocatori, con personaggi gestiti da bot e trame dinamiche che possono variare con il variare delle scelte del giocatore. Si tratta però, usualmente, di algoritmi di generazione procedurale che combinano la ripetizione di “pattern” creati da esseri umani, con elementi causali generati da algoritmi: tecniche che possono essere usate per allargare gli ambienti di gioco, ma non per fornire una vera esperienza su misura degli utenti. Le capacità delle IA generative, invece, potrebbero trasformare drasticamente l’esperienza di gioco: garantire dei dialoghi originali e interattivi con gli NPC (i personaggi guidati dai bot), generare mondi vastissimi o elaborare in tempo reale nuovi livelli e difficoltà di gioco. Data l’acerbità della tecnologia (la prima IA in grado di creare immagini non ha neanche 3 anni), però, finora, non si sono avute vere e proprie applicazioni concrete dei modelli generativi nei videogiochi: le prime potrebbero emergere nei prossimi mesi.