Minerva, la prima famiglia di modelli linguistici di grandi dimensioni (LLM) completamente italiana. Sviluppata dal gruppo di ricerca Sapienza Natural Language Processing (NLP) all’interno di Fair – Future Artificial Intelligence Research, Minerva rappresenta un passo avanti significativo nel campo dell’intelligenza artificiale made in Italy.
- Un modello “da zero” per l’IA italiana
- 500 miliardi di parole per un’IA potente
- Tre modelli per diverse esigenze
- Un futuro promettente per l’IA italiana
- Le prossime tappe:
Un modello “da zero” per l’IA italiana
A differenza dei modelli italiani esistenti, basati sull’adattamento di modelli stranieri, Minerva è stata costruita e addestrata “da zero” utilizzando testi ad accesso aperto. Questo approccio garantisce una maggiore trasparenza e controllo sui dati utilizzati, oltre a permettere di adattare il modello alle specificità della lingua italiana.
500 miliardi di parole per un’IA potente
I modelli Minerva sono stati addestrati su un vasto insieme di fonti italiane e inglesi online e documentate, per un totale di oltre 500 miliardi di parole, l’equivalente di oltre 5 milioni di romanzi. Questa enorme quantità di dati permette ai modelli di acquisire una profonda conoscenza della lingua italiana e di svolgere una vasta gamma di compiti, tra cui:
- Completamento di frasi
- Risoluzione di ambiguità pronominali
- Comprensione del linguaggio naturale
- Generazione di testi
- Traduzione automatica
Tre modelli per diverse esigenze
Al momento sono disponibili tre modelli Minerva, con dimensioni e capacità differenti:
- 350 milioni di parametri: ideale per compiti semplici come la classificazione di testi o la generazione di riassunti automatici.
- 1 miliardo di parametri: adatto a compiti più complessi come la traduzione automatica o la generazione di testi creativi.
- 3 miliardi di parametri: il modello più potente, in grado di svolgere compiti di intelligenza artificiale generale (AGI).
Un futuro promettente per l’IA italiana
Lo sviluppo di Minerva rappresenta un passo importante per l’affermazione dell’intelligenza artificiale italiana nel panorama internazionale. I modelli Minerva saranno a disposizione della comunità scientifica e, in futuro, anche del pubblico, con l’obiettivo di promuovere la ricerca e l’innovazione in questo campo strategico.
Le prossime tappe:
- Benchmark di valutazione: un banco di prova per valutare le prestazioni dei modelli Minerva su una serie di task.
- Sviluppo di un modello da 7 miliardi di parametri: un modello ancora più potente per compiti di intelligenza artificiale generale.
- Instruction fine tuning: l’adattamento dei modelli a specifiche istruzioni per migliorare le loro prestazioni su compiti specifici.
Minerva rappresenta un’importante risorsa per l’Italia nel campo dell’intelligenza artificiale. Il suo sviluppo contribuirà a posizionare il Paese come leader in questo settore strategico e a promuovere l’innovazione in una vasta gamma di applicazioni.