Meta Platforms giovedì ha rilasciato le prime versioni del suo ultimo modello linguistico di grandi dimensioni, Llama 3, e un generatore di immagini che aggiorna le immagini in tempo reale mentre gli utenti digitano le richieste, mentre corre per raggiungere il leader del mercato dell'AI generativa OpenAI.

I modelli saranno integrati nel suo assistente virtuale Meta AI, che l'azienda presenta come il più sofisticato tra i suoi colleghi gratuiti, citando i confronti delle prestazioni su argomenti come il ragionamento, il coding e la scrittura creativa rispetto alle offerte dei rivali, tra cui Google di Alphabet e la startup francese Mistral AI.

L'assistente Meta AI aggiornato avrà un ruolo più importante all'interno delle applicazioni Facebook, Instagram, WhatsApp e Messenger di Meta, oltre a un nuovo sito web autonomo che lo posiziona in modo da competere più direttamente con il successo di OpenAI, sostenuto da Microsoft, ChatGPT.

Una landing page che accoglie i visitatori su quel sito li invita a provare a far creare all'assistente una lista di valigie per le vacanze, a giocare con loro a trivia musicali degli anni '90, a fornire aiuto per i compiti e a dipingere immagini dello skyline di New York City.

Meta si è data da fare per spingere i prodotti di AI generativa ai suoi miliardi di utenti, per sfidare la posizione di leader di OpenAI in questa tecnologia, con una revisione costosa dell'infrastruttura informatica e il consolidamento di team di ricerca e di prodotto precedentemente distinti.

Il gigante dei social media ha rilasciato apertamente i suoi modelli Llama per l'uso da parte degli sviluppatori che costruiscono app di AI, come parte del suo sforzo di recupero, in quanto un'opzione potente e gratuita potrebbe ostacolare i piani dei rivali di ottenere ricavi dalla loro tecnologia proprietaria. La strategia ha suscitato preoccupazioni per la sicurezza da parte dei critici che temono che attori senza scrupoli possano utilizzare il modello per costruire.

Meta ha dotato Llama 3 di nuove capacità di codifica informatica e questa volta gli ha dato da mangiare immagini e testo durante l'addestramento, anche se per il momento il modello produrrà solo testo, ha detto Chris Cox, Chief Product Officer di Meta, in un'intervista.

Il ragionamento più avanzato, come la capacità di creare piani più lunghi in più fasi, seguirà nelle versioni successive, ha aggiunto. Le versioni previste per il rilascio nei prossimi mesi saranno anche in grado di "multimodalità", vale a dire che potranno generare sia testo che immagini, ha dichiarato Meta nei post sul blog.

"L'obiettivo, alla fine, è quello di aiutarla a togliere le incombenze, a semplificarle la vita, sia che si tratti di interagire con le aziende, sia che si tratti di scrivere qualcosa, sia che si tratti di pianificare un viaggio", ha detto Cox.

Cox ha detto che l'inclusione delle immagini nell'addestramento di Llama 3 migliorerà l'aggiornamento in arrivo quest'anno per gli occhiali intelligenti Ray-Ban Meta, un prodotto realizzato con il produttore di occhiali Essilor Luxoticca, che consente a Meta AI di identificare gli oggetti visti da chi li indossa e di rispondere alle domande su di essi.

Le azioni Meta erano in rialzo dell'1,8% giovedì.

Meta ha anche annunciato una partnership con Google per includere i suoi risultati di ricerca in tempo reale nelle risposte dell'assistente, integrando un accordo esistente con il motore di ricerca Bing di Microsoft.

Con l'aggiornamento, l'assistente Meta AI si espande a più di una dozzina di mercati al di fuori degli Stati Uniti, tra cui Australia, Canada, Singapore, Nigeria e Pakistan. Meta sta "ancora lavorando sul modo giusto per farlo in Europa", ha detto Cox, dove le regole sulla privacy sono più severe e la prossima legge sull'AI è pronta a imporre requisiti come la divulgazione dei dati di formazione dei modelli.

Il bisogno vorace di dati dei modelli di AI generativa è emerso come una delle principali fonti di tensione nello sviluppo della tecnologia.

Il CEO di Meta, Mark Zuckerberg, ha fatto un cenno alla competizione con OpenAI in un video che accompagna l'annuncio, in cui ha definito Meta AI "l'assistente AI più intelligente che si possa usare liberamente".

Zuckerberg ha detto che le due versioni più piccole di Llama 3 in uscita, con 8 miliardi di parametri e 70 miliardi di parametri, hanno ottenuto un punteggio favorevole rispetto ad altri modelli gratuiti nei benchmark di prestazioni comunemente utilizzati per valutare la qualità dei modelli. La versione più grande di Llama 3 è ancora in fase di addestramento, con 400 miliardi di parametri, ha detto.

Questi risultati sono "indubbiamente impressionanti", ma anche indicativi di un crescente divario di prestazioni tra i modelli gratuiti e quelli proprietari, ha affermato Nathan Benaich, fondatore della società di venture focalizzata sull'AI, Air Street Capital.

Gli sviluppatori si sono lamentati del fatto che la precedente versione di Llama 2 del modello non riusciva a comprendere il contesto di base, confondendo le richieste su come "uccidere" un programma informatico con le richieste di istruzioni per commettere un omicidio. La rivale Google ha incontrato problemi simili e recentemente ha sospeso l'uso del suo strumento di generazione di immagini Gemini AI dopo che ha attirato critiche per aver prodotto rappresentazioni imprecise di personaggi storici.

Meta ha dichiarato di aver ridotto questi problemi in Llama 3 utilizzando "dati di alta qualità" per far sì che il modello riconosca le sfumature. Non ha approfondito i set di dati utilizzati, anche se ha dichiarato di aver inserito in Llama 3 una quantità di dati sette volte superiore a quella utilizzata per Llama 2. (Servizio di Katie Paul a New York Servizio aggiuntivo di Jeffrey Dastin a San Francisco Redazione di Nick Zieminski e Matthew Lewis)