Scopri come funzionano I modelli di intelligenza artificiale più recenti e quali sono le applicazioni più interessanti!
Chi inizia a cercare informazioni sull’intelligenza artificiale trova subito alcuni termini chiave: machine learning, deep learning, algoritmi e reti neurali. Si tratta di concetti un po’ astratti, per cui può essere difficile capire esattamente cosa siano e come funzionino, nonché differenziare i vari tipi di AI.
In questo post parliamo delle basi dell’intelligenza artificiale contemporanea e delle differenze tra machine learning e deep learning. Buona lettura!
L’intelligenza artificiale nel 2024
Una buona definizione di intelligenza artificiale è la seguente: simulare il ragionamento e l’attività cognitiva dell’essere umano. Questa definizione ha il pregio di limitare fin da subito la definizione di intelligenza al solo ambito cognitivo e al ragionamento. Lasciando a un lato l’intelligenza emotiva.
L’obiettivo è da sempre creare delle macchine che siano in grado di eseguire i compiti basati sul ragionamento umano, in modo da sollevare l’essere umano da questi compiti. Ad esempio, abbiamo creato i computer, che sono in grado di eseguire operazioni matematiche molto complesse. Per le quali anche le menti più geniali avrebbero bisogno di giorni per completarle.
I modelli di intelligenza artificiale contemporanea sono molto più evoluti rispetto all’idea di base e oggi sono in grado di eseguire compiti straordinari, come dialogare con l’utente o creare immagini e video.
I modelli di machine learning sono programmi che trovano tendenze e correlazioni nei dati e sono in grado di riprodurle grazie all’uso di algoritmi.
Machine learning
Spesso, machine learning e deep learning vengono presentati in contrapposizione, ma è un errore. Iniziamo subito dicendo che il deep learning è una branca del machine learning, che oggi rappresenta il modello generale di funzionamento dell’intelligenza artificiale.
Per machine learning si intendono modelli o programmi in grado di apprendere dai dati attraverso algoritmi. Apprendere dai dati significa che questi modelli sono in grado di analizzare grandi quantità di dati (chiamati data set) e trovare tendenze e correlazioni al loro interno, su cui basare previsioni.
Un esempio molto semplice di machine learning è un programma addestrato a distinguere le mele dalle arance. Dopo avergli fornito migliaia di esempi, l’algoritmo è in grado di esaminare una nuova immagine. E decidere con un buon margine di sicurezza se si tratta di una mela o di un’arancia.
Cos’è un algoritmo? Non è altro che una serie di istruzioni logiche che il programma deve seguire passo passo. Normalmente scritte in un linguaggio di programmazione come Python.
Deep learning
Il deep learning è un tipo di machine learning, ma con una particolarità: utilizza algoritmi molto complessi che suddividono ed elaborano i dati in più livelli. Deep, infatti, in inglese significa “profondo”. E questa branca dell’AI deve il suo nome proprio al fatto di elaborare i dati con strutture gerarchiche molto complesse.
Gli algoritmi di deep learning, inoltre, funzionano in un modo un po’ speciale, che simula il cervello umano: le reti neurali. I dati sono organizzati in nodi in una rete e collegati da connessioni simili alle sinapsi.
Ogni collegamento ha un peso diverso (che dipende dalla frequenza con cui si attiva). Per cui il risultato prodotto dall’algoritmo dipende dalle relazioni tra tutti i nodi della rete e dalla loro forza.
I modelli di deep learning sono molto potenti e vengono utilizzati per compiti complessi, come le previsioni del tempo o il controllo del traffico cittadino, ma anche dai cybercriminali per creare truffe con deepfake.
Differenze tra machine learning e deep learning
Se per machine learning intendiamo i modelli di base di intelligenza artificiale che apprendono dai dati. E per deep learning quelli avanzati che usano le reti neurali. Allora possiamo tracciare alcune differenze tra queste due categorie, pur ricordando che il deep learning è una branca del machine learning.
La prima grande differenza è che il deep learning utilizza algoritmi più complessi o combinazioni di algoritmi per elaborare i dati in più fasi (i livelli). Per questo motivo, le reti neurali e il deep learning in generale hanno bisogno di una potenza di calcolo molto alta. Che non è possibile ottenere con un normale computer. A questo scopo esistono i cosiddetti data center e i servizi di computing nel cloud, che consentono di affittare uno spazio su macchine virtuali gestite da grandi compagnie come Amazon o Google ed eseguire i modelli di AI.
I modelli di machine learning tradizionale sono più semplici e non sono in grado di elaborare grandi data set, ma quando si tratta di elaborare data set di piccole dimensioni, producono risultati migliori rispetto ai modelli di deep learning, che per loro natura hanno bisogno di grandi volumi di dati per essere addestrati.
Qualche esempio
Infine, facciamo alcuni esempi per capire meglio come funzionano. Un buon algoritmo di machine learning è la base di tutti i servizi di suggerimento di prodotti. Ad esempio, i siti come Amazon analizzano le pagine che visiti e i prodotti che acquisti. E, in base alle caratteristiche trovate dagli algoritmi, suggeriscono altri prodotti che potrebbero interessarti o delle alternative a quelli che stai considerando.
Per funzioni più complesse come il riconoscimento di oggetti in movimento, invece, è necessario un sistema di deep learning, che analizza le immagini in più fasi, ad esempio partendo dalle linee, poi le forme, poi i vettori di spostamento nello spazio di queste forme, poi i cambiamenti dell’aspetto delle forme e delle traiettorie di spostamento e così via.
In questo modo, un programma di sorveglianza è in grado di analizzare in tempo reale le immagini registrate dalle telecamere di sicurezza. Rilevare la presenza di oggetti in movimento, ad esempio un veicolo, e seguirli nei loro spostamenti affinché gli operatori possano capire se si tratta di un evento normale o di un’intrusione.
Un’altra applicazione interessante è quella degli antivirus moderni come Panda Dome. Questi software utilizzano modelli avanzati di machine learning per capire se il comportamento di un file o di una pagina web è potenzialmente pericoloso (analisi euristica). In questo modo, le suite di cybersecurity di oggi offrono un livello di protezione molto superiore a quello di pochi anni fa, in cui le uniche minacce rilevate erano quelle conosciute e documentate in un database.
Come imparano i modelli di AI
Una nota a parte è necessaria per spiegare come questi modelli riescono a “imparare” dai dati. In generale esistono due grandi categorie di apprendimento, quella con supervisione e quella senza.
Nell’apprendimento supervisionato, prima di essere elaborati, i dati vengono etichettati (dall’uomo o da un altro algoritmo più semplice). L’apprendimento non supervisionato è, invece, molto più interessante: in questo caso, gli ingegneri sviluppano algoritmi che sono in grado di trovare da soli tendenze, correlazioni e caratteristiche nei dati.
Affinché questi modelli di apprendimento funzionino, però, è fondamentale che ogni fase di apprendimento sia seguita da una fase di valutazione (umana e non), durante la quale i parametri del modello vengono ricalibrati dando vita a un ciclo che termina nel momento in cui il modello produce risultati considerati soddisfacenti.
Come funziona davvero l’intelligenza artificiale: le macchine non capiscono, perché non hanno coscienza. Sono “solo” modelli probabilistici molto potenti.
Applicazioni dell’AI
Questi modelli di machine e deep learning trovano applicazione in tutti gli ambiti della conoscenza umana, dalla cybersecurity alla ricerca medica, dallo studio dei cambiamenti climatici ai programmi di logistica per i trasporti. Tuttavia, l’applicazione più impressionante è quella degli LLM, i large language model, ovvero i modelli di linguaggio di grandi dimensioni, come ChatGPT.
Questi modelli di deep learning avanzatissimi utilizzano reti neurali di grande profondità che vengono addestrate con miliardi di documenti. In particolare, ChatGPT 4.0 utilizza un mix di modelli (chiamato MoE, Mixture of Experts), basato su 1760 miliardi di parametri, articolati su 120 livelli diversi.
In questo modo, il modello trova delle relazioni probabilistiche tra una parola e l’altra (ma anche tra una lettera e l’altra) in relazione al contesto. Così, quando una persona fa una domanda al chatbot, questo risponde usando le parole e le frasi che hanno più probabilità di trovarsi insieme nello stesso discorso.
Questa precisazione è importantissima, perché ci fa capire come funziona davvero l’intelligenza artificiale: le macchine non comprendono, perché non hanno coscienza. Sono “solo” modelli probabilistici molto potenti.
In questo post abbiamo visto una panoramica del machine learning e del deep learning, descrivendo le differenze principali tra queste due categorie dell’intelligenza artificiale. Se vuoi approfondire questo interessantissimo tema, ti consigliamo di cercare un corso online, ad esempio su una piattaforma come Coursera. Di solito, questi corsi utilizzano un mix di testo, video e risorse interattive che aiuta a comprendere i concetti più astratti e rende più coinvolgente l’apprendimento.
CONTINUA A LEGGERE: L’UE apre un’indagine su Meta per come tratta i minori
Buona navigazione e buona familiarizzazione con il machine learning e il deep learning!