OpenAI lancia un modello più economico: GPT-4o Mini

open AI

OpenAI ha annunciato oggi il lancio di un nuovo modello, chiamato GPT-4o Mini, progettato per essere una versione più leggera e accessibile per gli sviluppatori. Questo modello, significativamente meno costoso rispetto ai modelli a grandezza completa, è destinato a superare le capacità di GPT-3.5.

La creazione di applicazioni utilizzando i modelli di OpenAI può comportare costi elevati, escludendo molti sviluppatori che potrebbero rivolgersi a modelli più economici come il Gemini 1.5 Flash di Google o il Claude 3 Haiku di Anthropic. Con GPT-4o Mini, OpenAI entra nel mercato dei modelli leggeri.

Olivier Godement, responsabile del prodotto della piattaforma API di OpenAI, ha dichiarato a The Verge: “Credo che GPT-4o Mini incarni veramente la missione di OpenAI di rendere l’IA più accessibile a tutti. Se vogliamo che l’IA benefici ogni angolo del mondo, ogni industria, ogni applicazione, dobbiamo renderla molto più economica”.

Capacità e prestazioni del modello

Il nuovo modello leggero supporta input e output testuali e visivi tramite l’API, e l’azienda prevede di estendere presto il supporto a tutti i tipi di input multimodali, inclusi video e audio. Queste funzionalità potrebbero dar vita ad assistenti virtuali più capaci, in grado di comprendere itinerari di viaggio e offrire suggerimenti. Tuttavia, il modello è progettato per compiti semplici, quindi non si tratta di costruire un assistente come Siri a basso costo.

GPT-4o Mini ha ottenuto un punteggio dell’82% nel Measuring Massive Multitask Language Understanding (MMLU), un esame di riferimento composto da circa 16.000 domande a scelta multipla su 57 materie accademiche. Quando il MMLU fu introdotto nel 2020, la maggior parte dei modelli aveva difficoltà a superarlo, poiché l’obiettivo era quello di sfidare modelli che erano diventati troppo avanzati per gli esami precedenti. GPT-3.5 ha ottenuto un punteggio del 70% in questo benchmark, mentre GPT-4o ha raggiunto l’88,7%. Google afferma che Gemini Ultra ha ottenuto il punteggio più alto di sempre con il 90%. In confronto, i modelli concorrenti Claude 3 Haiku e Gemini 1.5 Flash hanno ottenuto rispettivamente il 75,2% e il 78,9%.

Applicazioni pratiche di GPT-4o Mini

Per gli sviluppatori desiderosi di costruire applicazioni IA a basso costo, il lancio di GPT-4o Mini rappresenta un nuovo strumento a loro disposizione. OpenAI ha permesso alla startup fintech Ramp di testare il modello, utilizzando GPT-4o Mini per creare uno strumento che estrae dati di spesa dalle ricevute. Invece di compilare manualmente i campi di testo, un utente può caricare una foto della ricevuta e il modello si occupa di tutto. Anche Superhuman, un client email, ha testato GPT-4o Mini per creare una funzione di suggerimento automatico per le risposte email.

L’obiettivo è fornire qualcosa di leggero e conveniente per permettere agli sviluppatori di creare tutte quelle applicazioni e strumenti che non potevano permettersi di realizzare con un modello più grande e costoso come GPT-4. Molti sviluppatori avrebbero optato per Claude 3 Haiku o Gemini 1.5 Flash prima di affrontare i costi elevati del calcolo necessari per gestire uno dei modelli più robusti.

Priorità di OpenAI

Cosa ha trattenuto OpenAI così a lungo? Godement ha spiegato che si trattava di “pura prioritizzazione” poiché l’azienda era concentrata sulla creazione di modelli più grandi e migliori come GPT-4, che hanno richiesto molti “sforzi di persone e calcoli”. Col passare del tempo, OpenAI ha notato una tendenza tra gli sviluppatori desiderosi di utilizzare modelli più piccoli, quindi l’azienda ha deciso che era giunto il momento di investire risorse nella costruzione di GPT-4o Mini.

“Io credo che sarà molto popolare,” ha detto Godement. “Sia per le applicazioni esistenti che utilizzano tutta l’IA di OpenAI, sia per molte applicazioni che erano bloccate a causa dei costi.”

Con il lancio di GPT-4o Mini, OpenAI spera di democratizzare ulteriormente l’accesso all’intelligenza artificiale, rendendo possibile per più sviluppatori e aziende di varie dimensioni sfruttare le potenzialità dell’IA nelle loro applicazioni quotidiane.