Ultimamente (da sempre?) trovo divertimento nell’applicare i metodi e le tecniche della matematica e dell’ingeneria ad ambiti che esulano decisamente dall’ambito scientifico. E’ un’abitudine che mi è stata trasmessa da alcuni professori particolarmente brillanti (???) di cui ho avuto il privilegio (!?) di essere alunno: essi non si limitavano a incancrenirsi tecnicamente sul piccolo e specifico ambito matematico/statistico in esame ma cercavano, almeno in potenzialità, di estendere quanto è vero nella scienza ad aree semantiche che tradizionalmente sono lontane dalla scienza, come i gusti, la socialità e i sentimenti. Sebbene nella maggior parte dei casi i canoni precisi e deterministici delle scienze esatte mal si adattino a settori che di esatto hanno ben poco, in alcuni casi effettivamente diversi comportamenti ricordano molto da vicino andamenti riconducibili a leggi matematiche.

Recentemente pensavo all’overfitting. Secondo la preziosa definizione di Wikipedia che trova sempre le parole giuste per esprimere i miei pensieri “In statistica, si parla di overfitting (eccessivo adattamento) quando un modello statistico si adatta ai dati osservati (il campione) usando un numero eccessivo di parametri.”. Chiaro no?

Sostanzialmente nella mia esperienza ho incontrato l’overfitting durante l’addestramento di sistemi di apprendimento automatico. Si tratta di modelli che sulla base di dati in ingresso producono altri dati come risultato ed è possibile fare in modo che tali modelli apprendano in modo automatico ad emettere i risultati corretti sulla base di una serie di esempi. Per concretizzare, poniamo che voglia addestrare un modello ad essere in grado di distinguere una macchina da un animale: gli darò in ingresso una Fiesta e gli dirò che è un’auto, poi un gatto dicendo che è un animale e così via ripetendo il processo opportunamente. Se il numero e la varietà di esempi sono sufficientemente alti, il risultato sarà probabilmente buono ed il sistema si adatterà a fornire risultati corretti anche per esempi che non ha visto. Ad esempio se al sistema precedente mostrerò un topo, sebbene non gli abbia detto prima che è un animale, sarà in grado di riconoscerlo come tale perchè identificherà una serie di caratteristiche in comune con gli esempi che ha visto in precedenza identificati come animali. Se però l’insieme degli esempi fosse troppo specifico, il sistema potrebbe non essere in grado di generalizzare a sufficienza. Concludendo l’esempio precedente, se il sistema fosse stato addestrato a riconoscere animali solo mediante mammiferi quadrupedi, potrebbe avere difficoltà a riconoscere una vespa, piuttosto che se avesse appreso la natura delle auto solo tramite utilitarie Ford, potrebbe non identificare correttamente una Smart od una limousine, che pure appartengono alla categoria a tutti gli effetti. Questo è l’overfitting, come nessun uomo di scienza mai avrà il coraggio di spiegarlo.

Ebbene, dopo questo lungo preambolo, mi è capitato di riconoscere le caratteristiche dell’overfitting in alcuni comportamenti umani. Mi piace parlare per figure retoriche ma sono sicuro che tutti possono comprendere come estendere i miei esempi a situazioni più significative della propria vita vissuta. Dunque, dicevo, ho rilevato overfitting nel come l’uomo si concentra spesso sul come ha raggiunto certe soddisfazioni, considerando il mezzo utilizzato per il raggiungimento dell’obiettivo come l’unico realmente disponibile. L’uomo ha fame, desidera ardentemente una torta, trova una Sacher e se la mangia tutta con gran gusto; è portato da questo momento in poi a credere che potrà sfamarsi solo attraverso torte, Sacher in particolare, ignorando il fatto che ha perseguito uno dei tanti modi, non necessariamente il migliore, per soddisfare la propria necessità. L’uomo ha la tendenza ad “overfittarsi” su alcune soluzioni considerandole le uniche possibili, solo perchè esse si sono rivelate efficaci in passato. Da un certo punto di vista affidarsi a ciò che già si conosce dà sicurezza e risparmia energie, dall’altro lato però questa politica di inerzia impedisce di migliorare e di trovare nuove migliori soluzioni a necessità già conosciute.

Volevo esprimere un concetto relativamente semplice e sono riuscito a complicare tutto tirando in ballo teorie ingegneristiche decisamente fuori luogo. Di certo in questo caso l’overfitting sull’efficacia dei discorsi semplici non ha avuto luogo.

Annunci