Come allenare il mio ChatGPT
Ci viene presentato come se fossil solo a un paio di clic dal creare la nostra intelligenza artificiale. Basta aprire YouTube o leggere un blog di tecnologia per essere bombardato da annunci su come addestrare la tua intelligenza artificiale in pochi minuti. Che si tratti di ChatGPT, Gemini o Claude di Anthropic, sembra che l'IA sia alla portata di tutti. Ma quanto è importante questa percezione?
Dietro queste intelligenze artificiali si nasconde una realtà che pochi conoscono. Creare un modello di IA come ChatGPT o LLaMA di Meta non è qualcosa che chiunque possa fare su un computer desktop o anche su un server medio. La storia inizia con una domanda: da dove prendono tutte queste informazioni?
Fame di Dati: Rubando Conoscenza dal Web
Addestrare un'IA di linguaggio come ChatGPT non si tratta solo di ottenere un'enciclopedia o il contenuto di Wikipedia. Sebbene Wikipedia sia diventata un punto di riferimento per le informazioni generali, rappresenta meno dell'1% dei dati necessari per addestrare queste enormi reti neurali. Quindi, da dove ottengono il resto?
La risposta è piuttosto cruda: l'IA si nutre di tutto il web. I creatori di queste intelligenze artificiali costruiscono robot o "scraper" che perché la rete come ragni instancabili, tracciando, copiando e memorizzando tutto il testo che trovano lungo il percorso. Articoli di notizie, post su blog, commenti sui social media, recensioni di prodotti, persino i testi delle tue canzoni preferite. E non si limitano solo al testo. I video di YouTube vengono convertiti in testo tramite algoritmi di riconoscimento vocale, trasformando ore di contenuti visivi in righe e righe di informazioni processabili.
Il risultato di questa "fame di dati" è un enorme file di testo chiamato dataset. E quando dico enorme, intendo migliaia di terabyte di informazioni. Un dataset è, in sostanza, la materia prima con cui viene addestrata un'intelligenza artificiale. È come il cibo che consuma la rete neurale e l'IA sarà buona quanto la qualità e la quantità del dataset che la nutre.
Cosa Serve per Addestrare un'IA di Livello Mondiale?
Va bene, abbiamo i dati, ma cosa serve per addestrare un'intelligenza artificiale di questo tipo? È qui che le cose si complicano. Se pensavi che una buona CPU di ultima generazione e alcuni giorni di lavoro fossero sufficienti, ti ho delle brutte notizie: dimentica di addestrare una rete di questo livello sul tuo PC desktop.
Per addestrare un'IA di elaborazione del linguaggio naturale (NLP) come ChatGPT o LLaMA sono necessarie migliaia di schede grafiche di ultima tecnologia, come le GPU A100 di Nvidia. E non parlo di una o due GPU, parlo di fattorie di server, piene fino all'orlo di GPU connesse in parallelo. Ogni GPU è necessaria per eseguire migliaia di operazioni matematiche al secondo, consentendo all'IA di imparare da milioni di dati contemporaneamente. Un CPU non è adatto per questi compiti; semplicemente non ha la capacità di elaborare tante informazioni in parallelo.
Anche con tutta questa potenza di calcolo, addestrare un modello grande può richiedere settimane o mesi, con un costo di energia elettrica spropositato e una fattoria astronomica in cloud. Per darti un'idea, OpenAI ha speso milioni di dollari per addestrare i suoi modi GPT. È quindi fattibile per uno sviluppatore medio creare la propria IA da zero? Probabilmente no.
Quali Opzioni Rimangono per i "Mortali"?
Quindi, chi può addestrare un'IA? La realtà è che le grandi aziende tecnologiche come Google, Meta, OpenAI e Microsoft dominano questo campo perché hanno i mezzi necessari per farlo. Il resto di noi è in un gioco diverso: quello di usare modelli preaddestrati. Queste aziende hanno aperto i loro modelli in modo che altri sviluppatori li utilizzino, li adattino e li ottimizzino su scala ridotta.
In termini pratici, ciò significa che chiunque abbia conoscenze tecniche può utilizzare un modello come GPT per creare applicazioni personalizzate, senza doverlo addestrare da zero. Non è la stessa esperienza di sviluppare un'IA dalle basi, ma consente alle piccole imprese e agli imprenditori di beneficiare di questa tecnologia senza il costo proibitivo che comporta la creazione di un'IA da zero.
L'Illusione dell'Accesso: Perché Ci Fanno Credere che Chiunque Possa Creare la Propria IA?
Una buona parte della narrazione "chiunque può creare la propria IA" si basa su strategie di marketing. Google e OpenAI vogliono che più sviluppatori utilizzino i loro strumenti, perché ciò aumenta l'adozione dei loro prodotti e, a lungo termine, la loro redditività. Se un piccolo imprenditore crea un'app che utilizza il modello GPT di OpenAI, ad esempio, questo imprenditore continuerà a pagare OpenAI per l'utilizzo del modello. È un ecosistema che cerca di attirare sviluppatori, non perché creino la propria IA, ma perché si uniscano all'onda utilizzando ciò che già esiste.
È Realmente Possibile Creare la Propria IA?
Sì e no. Se parliamo di addestrare da zero un'IA con lo stesso livello di capacità delle grandi aziende tecnologiche, allora la risposta è un no categorico per la maggior parte di noi. Il costo, l'accesso ai dati e l'infrastruttura necessari sono fuori dalla portata della maggior parte degli sviluppatori indipendenti. Tuttavia, se si tratta di utilizzare modelli preaddestrati, adattarli e creare applicazioni che facciano uso di quella IA, allora la risposta cambia in un sì.
In definitiva, anche se ci fanno credere che siamo a una chiacchierata di caffè dal creare la nostra intelligenza artificiale, la verità è che il vero potere è ancora nelle mani di chi controlla le risorse: i dati e l'hardware. Quindi, prima di entusiasmarti con l'idea di "costruire la tua intelligenza artificiale", chiediti se hai davvero ciò che serve per farlo o se stai solo utilizzando una versione ridotta di qualcosa che già esiste.
Per ora, rimane un gioco dominato dai grandi, anche se con piccoli accessi per coloro che desiderano esplorare le sue possibilità.