L’intelligenza artificiale ci costringerà ad abbandonare i modelli teorici?

Il machine learning sta rivoluzionando la nostra stessa idea di “casualità” e “spiegazione”. Dobbiamo rinunciare all’idea di modello e alla semplificazione del mondo che questa implica?


IN COPERTINA: delle opere di Francesco D’Isa create con l’ausilio di reti GAN che lavorano col machine learning

Questo saggio è un estratto da Caos quotidiano Ringraziamo l’editore Codice per la gentile concessione.


di David Weinberger

Fino a quando un pulcino non ha cinque o sei settimane è praticamente impossibile distinguere le pollastre dai galletti (o i maschi dalle femmine, per chi non è del settore). E questo è un problema non da poco, se siete produttori di uova che vedono nei maschi nient’altro che uno spreco di mangime per polli.

Negli anni Venti del Novecento, i giapponesi hanno adottato una tecnica per affrontare questo problema. Esistono due modi per determinare il sesso di un pulcino: controllare le punte delle ali o le loro cloache, meglio conosciute come canali anali. I sessatori giapponesi di pulcini hanno optato per questo secondo approccio perché è più affidabile per più razze di polli. (Questa decisione spiega il titolo di un servizio del 2015 della NBC: Sessatore di pulcini: il lavoro da 60.000 dollari all’anno che nessuno vuole.) La cosa strana è che non c’è nulla nella cloaca di un pulcino maschio che lo differenzi in modo evidente da una femmina. O almeno non c’è nulla che qualcuno possa indicare o descrivere. Perciò, un principiante impara come distinguere i maschi dalle femmine cercando di indovinare quale sia il sesso, mentre un esperto conferma o rifiuta tale decisione. Dopo aver classificato così migliaia di pulcini, alla fine, in qualche modo, chi impara inizia a farlo in modo coerente, ma anche allora non sa spiegare come lo sa.

Addestrare le persone a riconoscere il sesso dei pulcini non è, dunque, come addestrare i soldati a identificare gli aerei nemici o insegnare alle persone come diventare bravi osservatori di uccelli, come sottolinea Richard Horsey in un suo articolo sul riconoscimento del sesso dei pulcini. Gli aerei e gli uccelli hanno caratteristiche distintive che possiamo imparare a identificare: il caccia giapponese Zero ha le punte delle ali arrotondate, mentre un pettirosso ha il petto arancione. I sessatori di pulcini non hanno nulla su cui puntare l’attenzione. Se chiedi loro come fanno a sapere che un dato pulcino sia maschio o femmina, non sono in grado di dirtelo. Tuttavia, un sessatore di pulcini addestrato è in grado di classificare fino a 1.200 pulcini all’ora, uno ogni tre secondi, con un margine di errore inferiore al 2 per cento.

I filosofi trovano tutto ciò affascinante. Poiché l’accuratezza delle previsioni dei sessatori di pulcini è così elevata (il record mondiale è di 1.682 pulcini sessati in un’ora, senza errori) le loro decisioni dimostrano che sanno riconoscere il sesso dei pulcini. Ma, a partire dagli antichi greci, noi sappiamo che la conoscenza non consiste soltanto in credenze vere, ma in credenze vere e verificabili. Dire “So che è una gallina, ma non sono in grado di dire come lo so o perché dovreste credermi” è come dire “So perfettamente che la prossima carta sarà un asso, ma non ho alcun motivo per pensarlo”; un esempio da manuale della differenza tra indovinare e conoscere, anche se alla fine viene fuori che avete ragione.

Chi per lavoro vende uova però non è particolarmente interessato ai dilemmi filosofici sul sesso dei pulcini. Si preoccupa di identificare i pulcini maschi in modo da poterli macinare vivi ed evitare così di sprecare cibo per loro. E dal momento che la gente non fa esattamente la fila per un lavoro che consiste nel guardare il didietro di centinaia di pulcini ogni ora, potremmo immaginare che si tratti di un processo maturo per una classica automazione computerizzata.

Be’, non lo è. Tradizionalmente, prima dell’avvento del machine learning, avremmo insegnato a un computer a riconoscere gli uccelli elaborando un programma basato su un modello di uccelli. Un modello di una cosa o di un sistema elenca le sue caratteristiche salienti e il modo in cui sono disposte le une rispetto alle altre. Ad esempio, per un programma computerizzato progettato per identificare gli uccelli, un modello potrebbe includere il genere di cose che troveremmo nelle illustrazioni di una guida: il becco, la forma della testa, la forma e il colore del corpo, la lunghezza e la forma delle ali rispetto al corpo, la lunghezza degli arti e la forma delle zampe. Il modello specifica, inoltre, dove si trova ciascuna di queste parti rispetto alle altre. Se il computer ha lo scopo di identificare le foto di uccelli appollaiati su un ramo, il suo modello non si preoccuperà di includere il modo in cui l’uccello plana o quale sia il suo verso. È anche probabile che il modello ignori se un uccello ha della sabbia sulle zampe, anche se in realtà potrebbe essere un indizio del suo habitat.

Il modello funziona se consente al computer di ordinare gli uccelli nelle corrette sottoclassi, impiegando lo stesso tipo di criteri che gli osservatori di uccelli avrebbero usato quando discutevano se quello che avevano appena visto era un picchio vellutato o un picchio villoso. “Il suo becco era lungo quanto la sua testa” è probabilmente un argomento convincente a favore del fatto che si tratti di quest’ultimo, poiché questo è ciò che i modelli di quei due uccelli raccontano ai loro osservatori che ne parlano così animatamente.

Questo è esattamente il tipo di modello concettuale che i sessatori di pulcini non possono offrire a se stessi o ai programmatori di computer che volessero elaborare un modello operativo in grado di permettere alla tecnologia di sostituire i sessatori. Un modello concettuale è l’idea delle parti di un sistema e delle relazioni al suo interno. Un modello operativo è una rappresentazione del modello concettuale, fatto da atomi o bit, ed è possibile manipolarlo per vedere come si comporta il sistema. Il sistema solare tridimensionale che ci hanno fatto costruire alle medie, fatto di palline che rappresentano il Sole e i pianeti, e che facevamo girare per osservare le loro posizioni relative, è un modello operativo. Rappresenta rozzamente il modello concettuale dell’astronomo che include le relazioni matematiche che esprimono la posizione, la massa e la velocità di ogni pianeta.

La mancanza di un modello concettuale da parte dei sessatori di pulcini potrebbe essere un freno per i computer di oggi, ma adesso abbiamo a disposizione un nuovo tipo di programma. Con il machine learning, in teoria potremmo costruire un computer che riconosca il sesso dei pulcini senza bisogno di un modello. Potremmo addestrarlo nello stesso modo in cui sono addestrati i sessatori di pulcini: fornendo numerosi esempi di pulcini con il loro sesso annotato e lasciando che il computer capisca da sé quali sono le differenze. Il risultato sarebbe un modello operativo, molto probabilmente privo di un modello concettuale. E, come vedremo in questo capitolo, ciò rischia di rovesciare uno dei presupposti di fondo relativi alla nostra condizione di esseri umani: essere le creature speciali che possono capire come funziona il mondo.

Modelli operativi, modelli concettuali

Buone notizie: adesso possiamo smettere di parlare del didietro dei pulcini, perché il riconoscimento della scrittura a mano è diventato il nuovo standard per capire il modo in cui i sistemi di machine learning acquisiscono nuove abilità.

Tradizionalmente, nel vecchio mondo dei modelli operativi basati su modelli concettuali, addestreremmo un computer a riconoscere i numeri scritti a mano, dicendogli quali sono le loro caratteristiche salienti. Ad esempio, per riconoscere un 8 cerca due cerchi messi uno sopra l’altro, con quello superiore della stessa dimensione o più piccolo di quello inferiore. Ai sistemi di machine learning, invece di indicare al computer la geometria degli 8, daremmo migliaia di esempi di 8 scritti a mano. Molti di questi violeranno la geometria della calligrafia che ci è stata insegnata a scuola: i cerchi potrebbero inclinarsi, raramente saranno cerchi perfetti, e molti non saranno completamente chiusi perché le persone scrivono in fretta. Gli algoritmi di machine learning analizzerebbero quei campioni scansionati come griglie di varie tonalità di grigio (perché i nostri strumenti di scrittura non producono sempre linee perfettamente nere) e troverebbero non tanto una regola sulla configurazione dei cerchi quanto piuttosto un modo per confrontare un nuovo campione con la distribuzione dei punti grigi in tutti i campioni. Se il nuovo campione è in realtà un 8, il sistema, se funziona, gli assegnerà un’elevata probabilità che sia un 8, forse una probabilità più bassa che sia un 3 o una B, e verosimilmente una probabilità molto bassa che sia un 1 o un 7.

È così che l’archivio nazionale del Regno Unito ha insegnato alle sue macchine a leggere antichi documenti scritti con penne d’oca in caratteri che per noi sono difficili da riconoscere e che sono cambiati nel tempo. Truppe di volontari hanno trascritto sessantamila parole – la lunghezza di un libro breve – da vecchi manoscritti per creare ciò che nel linguaggio del machine learning è definito base di verità: dal momento che sono stati degli esseri umani a identificare le lettere che rappresentano i tratti della penna, possiamo fidarci del fatto che quelle identificazioni siano corrette. Un sistema di machine learning chiamato Transkribus, finanziato dall’Unione Europea, ha analizzato i manoscritti scannerizzati, fatto suo il range di variazione per le lettere e quindi applicato ciò che ha appreso ai nuovi manoscritti. Il progetto pilota ha permesso alle macchine di individuare in modo corretto più dell’86 per cento dei caratteri: questo significa che per tale compito gli esseri umani sono tuttora più affidabili, ma molto più lenti. Anche con l’attuale livello di accuratezza di Transkribus, l’archivio nazionale è convinto di poter rendere consultabile per la prima volta la sua collezione di manoscritti, il che aprirà le porte ai ricercatori.

I sistemi di machine learning attualmente riconoscono con vari gradi di accuratezza i volti e gli oggetti nelle fotografie, traducono in più di cento lingue, identificano gli adolescenti che potrebbero contemplare ipotesi di suicidio e sono utilizzati per identificare gli imputati che probabilmente se la fileranno dopo essere stati rilasciati su cauzione (questa loro “competenza” è oggetto di animate discussioni). Lo fanno con diversi gradi di accuratezza, a volte senza aver ricevuto un modello concettuale e talvolta usando modelli che si sono autogenerati e che sono troppo complessi per noi.

L’inspiegabilità di alcuni modelli di machine learning potrebbe non avere importanza quando una macchina identifica il sesso dei pulcini o viene utilizzata per raccomandare un film, ma ce l’ha quando diagnostica la probabilità di una donna di sviluppare il cancro al seno o raccomanda una pena detentiva a un presunto criminale. Il paziente potrebbe voler sapere perché la macchina ha deciso che c’è bisogno di un intervento chirurgico preventivo, e l’imputato potrebbe voler sapere se la sua etnia ha avuto qualcosa a che fare con la decisione suggerita dal sistema. Si parla molto oggi del se e come vogliamo limitare l’uso di questa tecnologia in questi casi, e forse in tutti i casi.

A prescindere dalla soluzione che verrà trovata, questo scontro politico, culturale e intellettuale ci sta rendendo sempre più consapevoli del fatto che ciò che accade può talora essere previsto con maggiore accuratezza da modelli che potremmo non essere in grado di capire. Come abbiamo visto nel capitolo precedente, la previsione ci mostra la fonte del costante cambiamento che ci circonda: creature soprannaturali che possono essere influenzate sacrificando loro animali, relazioni nascoste che ci permettono di leggere il futuro in un mulinello di foglie di tè o leggi immutabili della fisica che possono essere espresse in equazioni matematiche. In questo capitolo vedremo che i modelli su cui ci basiamo quando facciamo delle previsioni danno per assodato non soltanto il modo in cui le cose accadono, ma anche che la nostra essenza umana risiede nella conoscenza del mondo. Ecco perché ci piace quando i nostri modelli operativi non solo funzionano ma confermano anche la validità dei nostri modelli concettuali.

Il successo ottenuto con i sistemi di machine learning ci sta insegnando a mettere in discussione questi assunti mostrandoci un nuovo modo di vedere come accadono le cose: un modo che cambia la nostra percezione di ciò che ci rende umani.

Modelli che possiamo capire

Va detto che non sempre abbiamo cercato di comprendere le nostre previsioni. Ad esempio, alcuni dei padri fondatori degli Stati Uniti annotarono quotidianamente le variazioni del clima e i fattori che pensavano fossero ad esso correlati: quando le piante iniziano a fiorire, il primo gelo e così via. Speravano che tali dati aggregati avrebbero rivelato correlazioni affidabili: la fioritura precoce dei narcisi, ad esempio, annuncia con buone probabilità l’arrivo di un’estate piovosa. Fino agli inizi del Novecento, questo tipo di previsioni meteorologiche funzionava meglio che non fare alcuna previsione.

Come spiega Nate Silver in Il segnale e il rumore, si tratta di previsioni statistiche: raccogliamo i dati e li usiamo per fare un’ipotesi informata su ciò che accadrà, in base al presupposto che i dati esprimano una certa regolarità. Silver dice che le previsioni degli uragani venivano fatte così fino a una trentina di anni fa. È un modo che funziona piuttosto bene, almeno finché il sistema naturale è abbastanza coerente.

La previsione statistica non necessita di un modello come quello proposto nel 1900 da Vilhelm Bjerknes, che abbiamo esaminato nel primo capitolo. Il modello di Bjerknes spiegava le variazioni del tempo meteorologico su scala globale usando sette variabili e la fisica newtoniana: fattori rilevanti collegati da regole che ne governano le interazioni. C’era un problema, però: anche usando solo sette variabili, i calcoli erano così complessi che nel 1922 un matematico di nome Lewis Fry Richardson trascorse sei settimane intere per svolgere il lavoro necessario a prevedere il tempo con un solo giorno di anticipo, in base ai dati raccolti nei giorni precedenti. Non ci andò neppure vicino: dopo tutta quella faticaccia, la pressione dell’aria calcolata da Richardson era 150 volte troppo alta13.

Attualmente monitoriamo centinaia di variabili per le previsioni del tempo e dei cambiamenti a lungo termine del clima. Lo facciamo servendoci di computer che si fanno beffe dei computer degli anni Quaranta – l’ENIAC (Electronic Numerical Integrator and Computer) – che impiegò ventiquattr’ore per prevedere il tempo del giorno successivo. Tuttavia, fino al machine learning, abbiamo fatto affidamento su un approccio (a sua volta basato su modelli) che rievoca il demone di Laplace: se conosciamo le regole che governano il comportamento dei sette fattori che determinano il tempo, e se disponiamo di dati costantemente aggiornati, dovremmo essere in grado di prevedere quale sarà il tempo in ogni momento del futuro prossimo.

Il problema è che sono molti i fattori che possono influenzare il tempo. Silver afferma, infatti, che l’intera disciplina della teoria del caos si è sviluppata da quelli che essenzialmente erano tentativi falliti di fare previsioni meteorologiche. Letteralmente tutto sulla faccia della Terra influenza il tempo, in un modo o nell’altro. Non è un caso che l’esempio tipico della teoria del caos è quello di una farfalla che crea un evento catastrofico a migliaia di chilometri di distanza.

Se vogliamo dunque elaborare una previsione su un sistema come il tempo meteorologico – un terzo livello di complessità predittiva, nei termini discussi nel capitolo precedente – a quanto pare finiamo per fare scelte sbagliate. Possiamo fare affidamento sulle statistiche e sperare di selezionare quelle pertinenti e che il futuro ripeta gli schemi del passato con la stessa sicurezza con cui il Nilo esonda con l’apparizione di Sirio. Oppure possiamo tentare di capire quali siano le leggi che regolano il cambiamento e sperare che il sistema sia semplice come il modello che stiamo usando… e che tale sistema non sia sovvertito, ad esempio, dal vulcano Krakatoa che eruttò nel 1883, producendo così tanta cenere da raffreddare le stagioni per un anno e gli oceani per un intero secolo.

Il modello meteorologico di Bjerknes ha il vantaggio di fornire un modello operativo che conferma almeno sommariamente la sua controparte concettuale. Ma non è sempre questo il caso.

——

I modelli presuppongono, perciò, che noi umani siamo in grado di identificare gli elementi rilevanti del sistema che stiamo modellando: i fattori, le regole e i principi che determinano il modo in cui esso si comporta. Persino il Mississippi River Basin Model, che non ha bisogno di capire la fluidodinamica, presuppone che le inondazioni siano influenzate dalle curve e dalle profondità del fiume e non dal fatto che la verbena blu che cresce sugli argini sia in fiore. Ciò implica anche che i modelli presuppongano un certo grado di regolarità. La sfera armillare assume che i corpi celesti continueranno a muoversi nei cieli secondo i loro percorsi abituali; la macchina per la predizione delle maree presume che la massa gravitazionale del Sole e la Luna rimarrà costante; il foglio di calcolo presuppone che a una vendita, in linea di massima, corrisponda un ricavo.

Poiché il processo di semplificazione viene svolto dagli esseri umani, i modelli riflettono i nostri punti di forza e le nostre debolezze. I punti di forza includono la nostra capacità di percepire l’ordine dietro un apparente flusso di cambiamento. Ma siamo anche inevitabilmente inclini a servirci di assunti non verificati, abbiamo ricordi limitati e pregiudizi intrinseci, e siamo disposti a semplificare il nostro mondo per poterlo capire.

Nonostante le inevitabili debolezze dei modelli dovute alla nostra natura imperfetta, questi modelli sono stati essenziali per comprendere e controllare il nostro mondo. Sono diventati i quadri di riferimento stabili che ci consentono di prevedere e spiegare il mondo travolgente e in continua evoluzione che corre intorno a noi.

0 comments on “L’intelligenza artificiale ci costringerà ad abbandonare i modelli teorici?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *