Il rimpianto dell’algoritmo

Chi avrebbe vinto la partita a scacchi se avessi mosso il cavallo al posto della torre? Difficile a dirsi. Eppure, se la decisione di spostare la torre si rivelasse perdente, è molto probabile che, in una situazione simile, muoverei il cavallo. Che le nostre scelte dipendano, almeno in parte, dal rimpianto, non è una riflessione filosofica, ma una constatazione dei recenti studi di neuro-imaging. Ed è a partire da questi che due ricercatori italiani hanno pensato bene di inserire il rimpianto nei loro modelli matematici di socio-economia, riuscendo a simulare il comportamento umano molto meglio di tutti gli altri modelli finora elaborati. La ricerca, apparsa su Science, è stata condotta da Davide Marchiori dell’Interdepartmental Center for Research Training in Economics and Management (Cifrem) dell’Università di Trento e Massimo Warglien dell’Advanced School of Economics dell’Università Ca’ Foscari di Venezia.

Come si legge nello studio, l’interesse crescente per le basi neurali del comportamento economico ha sollevato il problema di quanto le attuali teorie siano effettivamente in grado di spiegare i comportamenti umani di decision making. È ormai consolidato che le decisioni non vengono prese solo su una base razionale, e gli avanzamenti nello studio della psicologia economica e delle tecniche di studio del cervello hanno fortemente orientato le ricerche nel campo della teoria dei giochi, la scienza matematica che studia le dinamiche dei conflitti e le soluzioni cooperative e competitive.

La maggior parte del nostro apprendimento avviene in un contesto sociale. L’apprendimento interattivo differisce da quello individuale per il fatto che, dato un certo numero di giocatori, ognuno si adatta agli altri. In breve, siamo portati a modificare le nostre decisioni in base alle scelte di tutti i partecipanti. Una visione molto lontana da quella del matematico John Nash secondo cui quando ogni giocatore decide la sua mossa in modo da massimizzare il risultato, assumendo che il comportamento dei rivali non verrà influenzato dalla sua scelta, si realizza una situazione di equilibrio. Secondo i recenti modelli della teoria dei giochi, invece, ciò che un individuo impara  è imprescindibile da quello che anche gli altri stanno imparando nello stesso momento. “Questo è ovviamente rilevante nel contesto economico”, spiega Massimo Warglien: “Decenni di sperimentazioni hanno dimostrato che l’equilibrio di Nash non funziona: il comportamento umano è approssimato molto meglio da modelli di apprendimento interattivi, in cui gli individui imparano mentre giocano in un contesto sociale”. Diversamente però dagli attuali modelli, in cui i giocatori artificiali reagiscono a una statistica (come una misura di errore), i modelli sviluppati da Marchiori e Warglien  modificano di volta in volta le scelte sulla base di un sentimento.

Ma in che modo è possibile inserire il rimpianto all’interno di un algoritmo? “È dimostrato che questo sentimento può essere misurato abbastanza precisamente”, spiegano i ricercatori: “Esiste infatti una buona corrispondenza tra l’intensità del rimpianto provato, il guadagno mancato e l’attivazione che possiamo misurare in specifiche aree del cervello con tecniche di neuro-imaging, come ha dimostrato l’economista Giorgio Coricelli in un precedente studio, anch’esso pubblicato su Science”.

Marchiori e Warglien hanno sperimentato vari algoritmi che prevedono il rimpianto in 21 semplici giochi (in cui una singola scelta di entrambi i rivali stabilisce la vittoria). “In questo contesto”, continuano gli economisti, “il rimpianto è quantificato come  la differenza tra il risultato ottenuto e quello che avremmo  potuto ottenere se avessimo agito differentemente. I modelli in cui i due giocatori  artificiali si basano su questo semplice feedback hanno funzionato molto bene nell’approssimare le scelte umane. A ogni partita, i giocatori ‘aggiustano il tiro’, orientando le loro mosse sulla base di quelle che, nelle partite precedenti, sarebbero state le migliori”.

Questi modelli tentano di spiegare alcuni fenomeni apparentemente paradossali, dall’andamento delle borse alle aste, dove le persone tendono ad alzare l’offerta se ritengono di aver appena perso un’occasione, e potrebbero portare non tanto a computer imbattibili a scacchi, quanto a intelligenze artificiali in grado di anticipare il comportamento umano. “Partendo da questi modelli”, conclude Warglien, “stiamo ora  cercando di creare reti neurali in grado di trasferire ciò che si è apprende in un contesto a un altra situazione. Ovvero a discriminare e poi a generalizzare, come fa l’essere umano”.

LASCIA UN COMMENTO

Please enter your comment!
Please enter your name here