OpenAI ha presentato martedì una serie di nuovi strumenti che renderanno più facile per gli sviluppatori costruire modelli basati sulla sua tecnologia di intelligenza artificiale, mentre il produttore di ChatGPT lotta con i giganti della tecnologia per tenere il passo nella corsa all'AI generativa.

La startup sostenuta da Microsoft ha dichiarato che un nuovo strumento in tempo reale, in fase di lancio immediato per i test, consentirà agli sviluppatori di creare applicazioni vocali di AI utilizzando un unico set di istruzioni.

In precedenza, il processo richiedeva agli sviluppatori almeno tre passaggi: prima la trascrizione dell'audio, poi l'esecuzione del modello di testo generato per ottenere una risposta alla domanda e infine l'utilizzo di un modello di sintesi vocale separato.

Gran parte del fatturato di OpenAI proviene dalle aziende che utilizzano i suoi servizi per costruire le proprie applicazioni di AI, rendendo il lancio di funzionalità avanzate un punto di vendita chiave.

La concorrenza si è anche inasprita, in quanto i giganti della tecnologia, tra cui Alphabet, società madre di Google, integrano modelli di AI in grado di elaborare diverse forme di informazioni, come video, audio e testo, nelle loro aziende.

OpenAI prevede che il suo fatturato salirà a 11,6 miliardi di dollari il prossimo anno, rispetto ai 3,7 miliardi di dollari stimati per il 2024, come ha riportato Reuters il mese scorso. L'azienda è anche nel mezzo di una raccolta fondi da 6,5 miliardi di dollari che potrebbe valutarla 150 miliardi di dollari.

Nell'ambito del lancio di martedì, OpenAI ha introdotto uno strumento di messa a punto dei modelli dopo l'addestramento, che consentirà agli sviluppatori di migliorare le risposte generate dai loro modelli utilizzando immagini e testo.

Questo processo di perfezionamento può includere il feedback degli esseri umani che forniscono al modello esempi di risposte buone e cattive in base alle sue risposte.

L'uso delle immagini per mettere a punto i modelli conferirebbe loro maggiori capacità di comprensione delle immagini, consentendo applicazioni come la ricerca visiva migliorata e il rilevamento di oggetti per i veicoli autonomi, ha detto OpenAI.

La startup ha anche presentato uno strumento che consentirebbe ai modelli più piccoli di imparare da quelli più grandi e consolidati, insieme al "Prompt Caching" che dimezza alcuni costi di sviluppo riutilizzando parti del testo che l'AI ha precedentemente elaborato.