Digi Tales

Una teoria per l’apprendimento di gruppo

Ago
17

C’è una visione dell’apprendimento che si potrebbe descrivere partendo da questo schema di sapore informatico:

conoscenze = dati

abilità = algoritmi

competenze = saper applicare il corretto algoritmo ai dati relativi alla situazione attuale

L’apprendimento consiste nell’acquisizione dei dati, nell’elaborazione degli algoritmi e nell’accumulo dell’esperienza che consente di scegliere gli algoritmi più adatti.

Immagine tratta da https://ilmicroscopio.blogspot.com/2013_09_01_archive.html, blog del gruppo “Amici del Microscopio.” La foto mostra dei gruppi di fagocitazione con i ponti plasmatici.

E’ un modello pedagogico che chiamerei “tradizionale”, senza andare troppo a distinguere tra teorie diverse, perché mi sembra che sia presupposto implicito di molti discorsi, anche di quelli che non fanno riferimento ad una teoria precisa. Anzi, direi che sta dietro – sempre in maniera implicita – alle teorie dell’insegnamento di chi parla della difficoltà di trasmettere le conoscenze, di promuovere lo sviluppo di abilità e di valutare la presenza di competenze.

La formulazione in termini informatici invece l’ho inserita io, ma non mi sembra di aver forzato molto. Pensare uno studente in termini di computer è quello che si fa quando si parla di pensiero computazionale, sia che si voglia mettere l’accento sugli aspetti concreti della computazione (la calcolabilità, le risorse finite) sia che si pensi ad un elaboratore del tutto astratto che applica algoritmi per risolvere problemi.

In ogni caso: questo schema pensa l’apprendimento a partire dai meccanismi cognitivi superiori (memoria, elaborazione, selezione e applicazione), come fase necessaria perché l’individuo arrivi ad essere competente. L’apprendimento è un requisito per la performance. Il valore è la performance e l’apprendimento è una condizione. Le agenzie educative come la scuola sono la garanzia che l’apprendimento produca il risultato voluto – la competenza. La valutazione è principalmente la certificazione del raggiungimento del risultato finale.

Questa impostazione ha diversi punti oscuri: l’acquisizione delle conoscenze è basata sulla semplice esposizione? Come avviene la creazione degli algoritmi? Come si sceglie quale algoritmo applicare? Sono domande che la pedagogia lascia alla psicologia, secondo una piramide delle discipline accettata abbastanza universalmente.

E’ un modello che è costruito sulla cognizione, sulla memoria, sulla logica. Evidentemente presuppone un individuo normale, cioè che disponga di tutte queste funzioni superiori in maniera standard.

Non trovano posto, in questo modello, gli aspetti affettivi, la volontà, il bisogno. Se c’è un motore a muovere il tutto, è la società che definisce quali sono le competenze utili. E’ un vero “primum movens”, in cui esiste già in atto quello che negli studenti è solo in potenza.

E’ un modello che è costretto a procedere a ritroso nei casi in cui fallisce: se un individuo non è in grado di scegliere l’algoritmo giusto, o non si ricorda i passi, o i dati, significa, tornando indietro, che non ha appreso uno di questi elementi. Per questo occorre frammentare la formazione e inserire dei test che permettano subito di individuare l’elemento mancante.

Questo modello si sposa bene con una didattica basata su un sillabo e centrata sull’azione del docente. E’ il docente che sceglie i dati da registrare, gli algoritmi da costruire, e che mostra dei casi positivi di applicazione dell’algoritmo ai dati perché gli studenti siano in grado di riconoscere situazioni simili.

Naturalmente l’apprendimento riguarda solo l’individuo che apprende, nel senso che gli effetti sono misurabili da comportamenti esterni ma i meccanismi sono tutti interni alla mente dell’individuo. Se si potesse fare un apprendoencefalogramma si potrebbero vedere i dati e gli algoritmi ben allineati e pronti per il collegamento. La cosa più vicina che abbiamo immaginato a questo esame dell’interno dall’esterno sono appunto i test. Che sono, manco a dirlo, dei test individuali.

Questo modello riguarda infatti solo il singolo individuo. La didattica che ne risulta è prima di tutto una didattica individuale; tutte le tecniche rivolte al gruppo di individui sono fondate sull’esperienza, non sul modello che è stato descritto fin qui. Questo semplicemente perché sono gli individui che possono memorizzare dati, costruire algoritmi e applicarli, e non i gruppi. Si pensa l’apprendimento come fenomeno personale, individuale, al quale eventualmente si possono sovrapporre alcune tecniche di insegnamento relative al gruppo. Perché apprendere da soli è la regola.

Penso invece che sia vero il contrario: apprendere da soli non è la regola, è l’eccezione.

Apprendere in gruppo è normale. Norma nel senso della statistica: le modalità strutturate di insegnamento, per quel che ci racconta la storia della scuola, sono soprattutto di gruppo. Norma nel senso della scala: il gruppo fornisce dei riferimenti, delle possibilità di confronto: io sono qui, ma potrei essere lì insieme a quell’altro componente del gruppo. Quindi sto procedendo troppo piano, o troppo in fretta.

Il gruppo permette anche di apprendere per imitazione orizzontale, che è completamente diversa da quella verticale in cui il modello è lontano, competente per definizione. Il gruppo permette di elaborare algoritmi parziali e integrarli con frammenti costruiti da altri, alleggerendo il carico cognitivo. Il gruppo permette di confrontare la propria scelta di algoritmi con quella degli altri, e di fare così meta-apprendimento.

Insomma, apprendere in gruppo di solito funziona meglio. Le discipline sportive di squadra offrono tutte degli ottimi esempi di questa differenza: se l’allenatore punta solo alle eccellenze, e se gli stessi giocatori mirano solo al raggiungimento di obiettivi personali, la squadra ha un rendimento che dipende linearmente dalla somma delle competenze dei singoli. Se invece la squadra diventa il centro dei processi di insegnamento e apprendimento, e tutti investono del miglioramento della squadra, i risultati sono oggettivamente superiori.

Si tratta di considerazioni validissime, ma che partono appunto dalla pratica, non dalla teoria dell’apprendimento, e restano forse proprio per questo marginali nella prassi educativa scolastica. Inevitabilmente la parte relativa ai processi del gruppo è solo superficiale, incollata dall’alto. I processi di scambio di informazioni tra i partecipanti del gruppo sono forzati, scanditi da ritmi esteriori; sono considerati delle richieste a cui bisogna adeguarsi, non una necessità che viene dall’interno.

Facciamo resistenza a pensare in termini di analisi anziché di sintesi. Il gruppo lo costruiamo a partire dagli individui. Come se l’individuo fisico fosse più reale del gruppo.

Perché invece non si fonda la teoria dell’apprendimento sull’apprendimento di gruppo, per poi eventualmente ricadere su un caso particolare, in cui il gruppo è formato da un solo individuo, nei suoi diversi momenti? Perché non si progetta una didattica di gruppo, che ha davvero il gruppo come obiettivo, e non gli studenti? Perché non si immagina una valutazione di gruppo che non sia la media della valutazione dei singoli? Forse perché il modello di apprendimento che abbiamo in testa anche senza saperlo non è adatto.

Parecchi anni fa ho provato a disegnare un modello alternativo. Non tanto perché avessi le prove che questo che ho appena descritto non funzionasse, ma perché mi sembrava un modello debole, con troppi casi lasciati fuori come eccezioni. Non era centrato sull’apprendimento, ma sui risultati. Non rendeva possibile progettare del software educativo diverso da quello che circolava (eserciziari ripetitivi in cui si supponeva che le conoscenza dovessero essere apprese per semplice “esposizione” ripetuta). Anzi, questi esempi mi portavano a pormi la domanda: cosa rende un software davvero “educativo”? Il fatto di essere semplice, anzi banale? I colori sgargianti? La presenza di scoiattolini? I contenuti approvati da qualche centro di ricerca? Il test alla fine, con l’immancabile “Bravo!” ?

E difatti, sulla base di questo nuovo modello ho progettato e costruito, negli anni seguenti, un certo numero di software e ambienti “educativi”, ma in un senso diverso.

Il modello che ho immaginato, partendo certamente dalle letture di Dewey, Vygotskij e Bruner, ma senza cercare di derivarne formalmente una teoria, era molto semplice e in sostanza presentava l’interazione tra due elementi: il Soggetto e l’Ambiente. Il modello in questione descriveva l’apprendimento non come la condizione di qualcos’altro, ma a partire dal suo fine interno: il controllo di un ambiente. L’apprendimento è il processo nel quale il soggetto acquisisce il Controllo dell’ambiente. Di conseguenza, l’educazione consiste nell’assicurarsi che questa acquisizione si svolga in maniera efficace, attraverso la creazione di ambienti che sono progettati appositamente per cedere il controllo al soggetto. La valutazione è la parte del processo educativo che permette di rilasciare il controllo progressivamente, al momento giusto e nella misura giusta. Tutto qui. Ma da questi pochi concetti si possono trarre, a mio avviso, delle conclusioni interessanti soprattutto in termini di progetto didattico e di progetto valutativo, non solo legato ai software educativi.

Prima di tutto, si tratta di un modello che presuppone che l’apprendimento esista, che sia comune non solo ai cuccioli d’uomo, ma a tutte le persone, a qualsiasi età; e che non sia troppo diverso tra gli animali, scendendo via via alle specie meno complesso, e forse fino ai vegetali.

Non presuppone l’esistenza di facoltà cognitive superiori. Il che lo rende applicabile a molte più situazioni. Invece presuppone che ci sia un bisogno, una volontà, cieca quanto si vuole, che spinge il soggetto verso l’appropriazione dell’ambiente. Questa presupposizione è esterna al modello, ed è un modo diverso per descrivere un fatto dell’esperienza: c’è apprendimento quando esiste questa volontà. E difatti, ai cuccioli è quasi impossibile impedire di apprendere, e ai vecchietti quasi impossibile imporlo. L’educazione si svolge all’interno dei margini di questa disponibilità ad apprendere, altrimenti è destinata a fallire. Anche qui si tratta di un fenomeno evidente, ma che si spiega chiaramente: l’educazione è al servizio dell’apprendimento perché l’apprendimento è un processo naturale e l’educazione è solo il tentativo di rendere più efficace quel processo naturale all’interno di uno spazio artificiale.

Un aspetto importante del processo di apprendimento (come è descritto in questo modello) è che non solo il soggetto cambia, ma anche l’ambiente. Forse si tratta della differenza più grande rispetto al modello descritto sopra come tradizionale, ed è l’elemento che rende i due modelli incompatibili. Perché si possa dire che c’è apprendimento non basta andare a guardare nella testa del soggetto, ma occorre guardare gli effetti nell’ambiente. La modifica dell’ambiente è precisamente ciò che il soggetto si propone come fine nell’apprendimento. Non si tratta di una modifica necessariamente fisica (come non è necessariamente fisico l’ambiente): il passaggio del controllo dall’ambiente al soggetto significa che l’ambiente perde di libertà, di potere. Perciò non è pensabile, letteralmente, un apprendimento che non modifichi tanto il soggetto che l’ambiente.

È un modello filosofico, non psicologico. Non distingue tra dati e algoritmi, non si preoccupa di come vengono conservati gli uni e gli altri.

È un modello dinamico, non statico. Il controllo è il risultato della spinta reciproca di soggetto e ambiente; non è un terzo elemento ma solo il limite tra i due.

Resta anche qui da chiarire cosa significa controllo. Ma è un termine che ha un significato univoco: può valere, a seconda dei contesti, libertà, possibilità di agire, conoscenza, previsione, ….

Anche se non l’avevo specificato (o pensato) all’epoca in cui lo descrivevo, il soggetto non è necessariamente un individuo: può essere una parte di un individuo, oppure un gruppo di individui. È una descrizione di un processo partendo dai due elementi che si definiscono uno in relazione all’altro.

Questa possibilità di pensare il gruppo come soggetto di apprendimento a pieno titolo permette di studiare, progettare o verificare il processo anche al livello di gruppo e non solo di individuo. Si possono immaginare delle attività educative, cioè di supporto all’acquisizione del controllo del gruppo sull’ambiente. E, di conseguenza, si possono immaginare strumenti che mirano a fissare la posizione del limite tra soggetto e gruppo: una valutazione del gruppo come soggetto, e non (solo) dei singoli individualmente.

L’apprendimento del gruppo (non solo: in gruppo) non è la somma degli apprendimenti dei singoli. Il gruppo sa fare delle cose che i singoli non sanno fare, ma soprattutto il gruppo ha dei bisogni, degli obiettivi, una storia che sono diversi da quelli dei singoli.

Così l’ambiente di apprendimento del gruppo non è l’ambiente del singolo. E’ un ambiente collettivo dove si intrecciano le operazioni di tutti quelli che fanno parte del gruppo. E’ un ambiente che viene modificato dal gruppo, che si adatta ad esso (e non al singolo studente). E’ facile immaginare cosa significa pensare una piattaforma per l’e-learning in questi termini. In realtà, come si sarà capito, ADA è precisamente un ambiente di apprendimento di gruppo, è stata pensata in questo modo e funziona così. Senza questo modello non si capisce il senso di tante funzionalità, come quella che permette di modificare il contenuto di un corso da parte dei partecipanti del gruppo.

Ma quello che mi interessa soprattutto è che partire dal modello citato sopra permette di derivare una didattica coerente per il gruppo, senza dover aggiungere tecniche, suggerimenti, semplicemente perché l’esperienza ne ha confermato l’utilità. E’ la differenza tra una profilassi basata su una teoria biologica dei microorganismi e una profilassi basata sull’esperienza: fino ad un certo punto funzionano entrambe, ma la seconda finisce per dare origine ad una serie di pratiche magiche tramandate sulla base dell’autorità, alla nascita delle scuole e all’apparizione dei guru.

Basta coi dati, ancora più dati

Ago
15

Dati come algoritmi: ne parlano tutti, a qualsiasi proposito, a volte anche confondendoli. E si capisce, perché gli algoritmi senza dati girano a vuoto. Si legge e si ascolta sempre più spesso “I dati ci dicono che”, “Andiamo a vedere i dati”, “Ci vogliono nascondere i veri dati”. Ma a forza di citarli come risposta finale a tutte le domande, anche la pubblica amministrazione ha capito che si possono usare a fini di comunicazione.

Dalla sindaca di Roma che traccia le biciclette sulle piste ciclabili al software della sottosegretaria Floridia che “calcola il flusso dei tragitti che gli studenti fanno per venire a scuola”, sembra che la nuova tendenza non sia quella di aumentare l’apertura dei dati esistenti, ma di aumentare i dati raccolti da parte della PA.

Tracciare i movimenti e gli accessi, registrare i dati prodotti da azioni umane, è il nuovo dispositivo che da solo certifica l’approach modern e anche smart di una governance near ai citizens. Prima ancora di dire qual è il progetto generale e come quei dati verranno utilizzati, si annuncia la loro raccolta. Come se questa da sola fosse sufficiente; come se ogni raccolta non contemplasse un filtro e una trasformazione; come se i dati si potessero usare senza archiviarli, con il rischio che qualcuno se ne impadronisca (come è successo più volte).

Sul versante opposto, dopo aver richiesto a gran voce la pubblicazione dei dati del COVID, adesso le voci si alzano contro la registrazione dei dati (per esempio, contro il Green Pass) a volte anche senza sapere esattamente quali dati vengono raccolti, da chi vengono trattati, dove vengono archiviati e per quanto tempo. Cosa dice, esattamente, il QR Code? Anzi: cosa ci nasconde?

L’impressione è che da entrambe le parti ci sia superficialità e che tutto si svolga intorno alla parola “dati” più che intorno al concetto di raccolta di dati. Raccogliere i dati è segno di attenzione al territorio oppure è un furto di identità da parte di un sistema sempre più Grande Fratello?

Dal lato della PA, i proclami sono sempre molto opachi sul come quei dati potranno essere utili a tutti i cittadini, su come verranno protetti ora e i futuro, su quali flussi seguiranno. E’ facile pensare che ogni passo nella direzione del monitoraggio dei cittadini (o degli studenti) possa essere un precedente per altri passi più invasivi. Se un Comune può monitorare i passaggi delle biciclette (che per il momento non hanno una targa, e quindi non possono essere ricondotte ad un proprietario), cosa impedirà domani di costruire un Bicivelox che permetta di aggiungere entrate nella casse del Comune stesso? Se vengono tracciati i percorsi casa-scuola degli studenti, cosa impedisce di farlo anche per i docenti? Eccetera. Sono domande che sorgono spontanee nel momento in cui non c’è la necessaria trasparenza sull’uso di quei dati, sulla base legale, sui limiti non solo tecnici.


L’effetto di questo aumento della presenza dei dati come salvatori o come diabolici si mostrerà presto, a mio parere, in un movimento intellettual/popolare di ribellione all’acquisizione di dati. Un movimento che si presenterà come unito per poi spaccarsi in due ali francamente mosse da interessi diversi.

La parte intellettuale sosterrà che l’acquisizione dei dati (o la trasformazione in dati di azioni) è la nuova forma di creazione di valore a partire dalla vita delle persone. Che sia una processo gestito da grandi soggetti privati o da soggetti pubblici, e indipendentemente dalla finalità, si chiederà che nessun modello di machine learning possa essere addestrato sulla base di comportamenti ad alto valore professionale.

Un caso particolare di questa critica riguarderà i professionisti che vedranno scomparire il loro valore e sul mercato man mano che i dati del loro comportamento professionale saranno accumulati e utilizzati per il training di modelli di Machine Learning. Traduttori, programmatori, giornalisti per primi, poi in futuro docenti, medici, avvocati, architetti si renderanno conto che vanno incontro alla scomparsa come i panda. Anche l’università, e la formazione professionale in generale, si accorgeranno finalmente che rischiano un radicale ridimensionamento.

La parte popolare si limiterà a invocare il diritto all’opacità di ogni cittadino di fronte allo Stato, a difendere una generica libertà individuale. In un’unica rivendicazione verranno inclusi i dati fiscali, quelli produttivi, quelli formativi. Sarà facile per i movimenti politici che già fanno leva su questo tipo di istanze libertarie (nel senso della libertà del singolo individuo) cavalcare anche questa rivendicazione all’interno di un progetto politico liberista che punta a ridurre la presenza dello stato nella società.


Penso che questi movimenti vadano distinti, e le loro motivazioni analizzate con chiarezza. Se è vero che i dati sono il nuovo petrolio, nel senso che l’estrazione dei dati dalle azioni delle persone è la fonte principale di valore, questo valore va rivendicato sempre, soprattutto quando su quella base si costruiscono servizi che vanno a sostituire professioni avviando un percorso senza ritorno di rinuncia alla conoscenza teorica. Ma si tratta di un modo di raccogliere e usare i dati che è proprio primariamente di un numero ristretto di grandissime aziende, e che sta funzionando da modello e attrattore anche per le altre. Questo non ci esime dal cercare di ottenere da queste aziende una forma di autocontrollo; ma possiamo anche cominciare a pensare di usare meno servizi “gratuiti”, cioè pagati con i nostri dati, e usarne di nuovi a pagamento che però diano maggiori garanzie di trasparenza. Piccoli passi che ci aiuterebbero anche ad uscire dal sostanziale monopolio di servizi digitali in cui ci troviamo ora.

Per questo è necessario che la PA sia trasparente per quanto riguarda i percorsi di questi dati: perché anche se i suoi scopi sono diversi, la maniera di raggiungerli potrebbe implicare un passaggio (a costi limitati o addirittura senza costi) proprio per uno o più di questi fornitori di servizi.

Non si tratta tanto di proteggere il diritto del cittadino a nascondere alla PA i propri comportamenti, magari sul bordo dell’illegalità, ma di sancire il diritto di ogni cittadino, nei confronti della propria PA, di sapere cosa viene registrato, a chi viene consegnato e per quali usi, ed eventualmente limitare questi usi, così come si è fatto nel caso dei dati personali dal GDPR. Ma se il GDPR era nato per proteggere le economie dei Paesi europei contro la concorrenza di altri Paesi un po’ più leggeri nella gestione dei dati personali, stavolta si tratta di proteggere i diritti prodotti dai cittadini stessi, che non sono dati personali ma appartengono comunque alla sfera del valore e non solo a quella della tecnica.

Come per quanto riguarda i dati personali, la via più facile sarebbe quella di anonimizzare i dati, in modo che non sia possibile risalire al cittadino da cui sono stati prodotti. Purtroppo è una strada scivolosa e difficile. Facciamo un esempio: l’anonimizzazione può essere applicata per default oppure solo su richiesta del cittadino.

Nel primo caso, siccome i dati hanno senso soprattutto quando vengono incrociati, bisogna costruire un cittadino-doppio, un avatar anonimo su cui convergano tutti i dati raccolti. Questo doppio, identificato da un codice univoco all’interno della PA, non potrebbe davvero perdere il legame con il cittadino reale, altrimenti non sarebbe più possibile collegare i nuovi dati raccolti a quelli precedenti. Quindi il problema si sposta semplicemente dai dati al codice, dal tesoro alla chiave.

Nel secondo caso, quello di un’anonimizzazione su richiesta esplicita da parte dei cittadino, sorge il problema della propagazione a catena dell’anonimizzazione su tutte le repliche dei dati. Senza un protocollo che impone di tenere traccia di ogni replica, di ogni accesso in copia, sarebbe evidentemente impossibile assicurare il cittadino che tutte le copie sono state anonimizzate.

Insomma, in pratica i dati prodotti da un cittadino e quelli identificativi del cittadino restano connessi. E di qui il problema.


Spesso si dice che siccome le persone hanno già ceduto la maggior parte dei propri dati ad aziende private (l’uso della carta di credito, l’uso del telefono, gli spostamenti fisici, la navigazione web e in generale l’uso di servizi via Internet, i propri interessi e preferenze, la propria rubrica) non ha senso preoccuparsi dei dati forniti alla PA. E’ il tipo di critica che si riceve quando si parla di protezione dei dati all’interno di un social network. Fa venire in mente lo scrutatore non votante che “si fa la doccia dieci volte ma ha le formiche sulla tavola”.

Credo invece che i discorsi vadano tenuti separati. Da una parte è possibile, anche se difficile, condurre una vita senza cedere i propri dati ad aziende private, nel momento in cui si riesce a rinunciare ai servizi, a pagamento o gratuiti che siano, che queste offrono in cambio dei dati stessi. Si può vivere senza usare Google Maps, senza Gmail, senza Android, senza Windows e naturalmente senza social network centralizzati. Si possono cercare alternative, gratuite o a pagamento. Si possono fornire dati imprecisi, contraddittori o parziali.

Ma non si può vivere senza carta di identità, senza pagare le tasse, senza un fascicolo sanitario. In un caso c’è un contratto esplicito, accettato, che prevede uno scambio più o meno trasparente di dati contro servizi. Nell’altro caso, il contratto tra la persona e lo stato inizialmente non viene nemmeno firmato dalla persona, ma dai genitori al momento dell’iscrizione all’anagrafe. Quel contratto non specifica cosa lo stato possa fare in seguito con i dati del cittadino, ma fa riferimento alla Costituzione, alle Leggi statali e regionali. Da quel contratto si può uscire veramente solo rifiutando del tutto ogni nazionalità, o scegliendone una diversa.

Per questo è importante che la PA sia in grado di esporre un protocollo di raccolta dei dati che sia chiaro, inattaccabile, funzionale.


Una delle situazioni in cui questo problema potrebbe presentarsi improvvisamente (anche se le premesse sono presenti da anni) è quello della raccolta dei dati nella piattaforme di DaD, o di e-learning. Il tracciamento del comportamento degli studenti (non solo i voti o gli accessi, ma la navigazione fine, la consultazione dei link e degli allegati, la scrittura di testi, la comunicazione orizzontale) può essere più o meno spinto, e può essere più o meno usato a vantaggio degli studenti stessi, per esempio per arricchire la valutazione con dati che descrivono il comportamento degli studenti (o di un gruppo di studenti) in tempo reale, senza bisogno di aspettare il momento del test. Dati che permettono di confrontare quello che sta succedendo con quello che, in situazioni simili, ci si attende che succeda. Lo stesso potrebbe succedere, a breve, relativamente alla registrazione dei dati dei docenti: accessi, comunicazione con gli studenti, creazione di contenuti aggiuntivi, valutazione.

Da un lato è evidente che questi dati potrebbero essere usati per aiutare i docenti e i corsisti, o anche gli autori di contenuti, o i progettisti delle piattaforme; dall’altro, questi dati potrebbero essere usati per selezionare gli studenti ancora prima del termine del loro corso di formazione (come nel caso di alcuni MOOC), oppure per controllare il lavoro dei docenti e sanzionarne comportamenti inadeguati. O infine, e qui torniamo a quanto detto sopra, per costruire un modello di docente che sia in grado di fare lezione, correggere gli esercizi, assegnare voti.

Anche in questo caso occorrerebbe sbrigarsi a regolamentare cosa può essere raccolto, con che finalità, per quanto tempo.

Alcune ipotesi di lavoro.

1. Si può chiedere ad una PA di fornire un bilancio tra i servizi forniti grazie all’acquisizione di dati dei cittadini e la necessaria sottrazione di privacy dei cittadini stessi. Ci saranno casi in cui i vantaggi superano gli svantaggi, ed altri in cui l’acquisizione di dati non è giustificabile. Un bilancio che dovrebbe essere pubblico, facilmente leggibile dal maggior numero di cittadini, aggiornato frequentemente.

2. Si può chiedere ai poteri legislativi di stabilire, una volta per tutte, che i dati prodotti dalle azioni dei cittadini (come quelli che ne definiscono l’identità) vengano riconosciuti come di proprietà dei cittadini stessi. Non è un passo semplice, perché i dati non sono oggetti fisici che una volta ceduti non sono più di proprietà del precedente proprietario. I dati di cui parliamo non hanno nemmeno le caratteristiche dei prodotti dell’ingegno, che devono essere originali. Un’altra difficoltà deriva dal fatto che questa richiesta potrebbe andare in direzione opposta, almeno apparentemente, a quella dell’apertura dei dati pubblici. Andrebbe applicata una licenza permissiva ma con caratteristiche speciali: per esempio, dovrebbe essere possibile tracciare l’uso dei dati e rendere possibile la propagazione del blocco del loro utilizzo.

3. Questa legge dovrebbe anche stabilire che il trattamento di quei dati deve avere come finalità primaria il vantaggio dei cittadini e non del sistema organizzativo. I cittadini, attraverso i loro dati, dovrebbero sempre essere considerati un fine e mai un mezzo, come reciterebbe la versione moderna del principio regolativo kantiano.

Quali cittadini? Solo quelli a cui appartengono i dati, o tutti? E’ evidente che scienze come l’epidemiologia hanno bisogno dei dati di tutta la popolazione per provare a fare ipotesi significative.
Insomma, i principi non bastano, ci vuole ancora tanto lavoro. Ma sarebbe ora di iniziare a farlo.

La fine della formazione

Ago
14

La formazione professionale ha senso se esiste una professione d’arrivo, cioè se esiste il contesto in cui una certa competenza può essere esercitata, riconosciuta, richiesta, pagata. Quando il contesto scompare, scompare la professione, e scompare anche la formazione. E’ questo lo scenario che ci aspetta grazie alla creazione di modelli di Machine Learning addestrati a partire dai dati d’uso dei professionisti come traduttori, programmatori, giornalisti. Sembra curioso che il mondo della formazione non se ne renda pienamente conto.


1 “The grand object therefore of the modern manufacturer is, through the union of capital and science, to reduce the task of his work-people to the exercise of vigilance and dexterity” (Andrew Ure – The Philosophy of the Manufacturers (1835)

La fabbrica ottocentesca ha cancellato una serie di mestieri artigianali e la formazione relativa che avveniva nella bottega. Lo stesso è successo con l’agricoltura motorizzata che ha rimpiazzato i contadini e il passaggio delle competenza all’interno della famiglia. Si trattava di mestieri manuali che però richiedevano una competenza alta: zappare la terra, checché se ne dica, è operazione complessa oltre che faticosa. C’è stata una doppia sostituzione: la forza biologica è stata sostituita da forza inanimata (acqua, vento, vapore), mentre la mano è stata sostituita da un dispositivo meccanico. L’uomo serve ancora, ma solo come controllore di processo.

Questo processo è stato letto come un effetto della specifica maniera di produzione capitalista che ha condotto alla soppressione di milioni di posti di lavoro e alla miseria di milioni di famiglie; oppure come una generale promozione umana dal mondo del lavoro fisico a quello del lavoro intellettuale. Marx nel Capitale cita Aristotele: “se ogni strumento potesse compiere su comando o anche per previsione l’opera ad esso spettante, allo stesso modo che gli artifici di Dedalo si muovevano da sè o i tripodi di Efesto di proprio impulso intraprendevano il loro sacro lavoro, se in questo stesso modo le spole dei tessitori tessessero da sè, il maestro d’arte non avrebbe bisogno dei suoi aiutanti e il padrone non avrebbe bisogno dei suoi schiavi”. Non è la macchina in astratto a creare la disoccupazione e le condizioni di lavoro alienato, ma la maniera specifica in cui viene inserita nel processo produttivo.

Il fatto che il lavoro di aratura una volta fosse eseguito a mano, poi da una macchina semplice che usa un’energia non umana (un aratro mosso da un cavallo) e infine da un trattore, non ha cancellato il sapere sull’aratura: era comunque necessario che qualcuno sapesse come si deve arare, a che profondità, quando. La conoscenza teorica doveva esistere ed essere trasmessa e integrata nella macchina, mentre la competenza pratica poteva scomparire senza danni. Al posto dell’esperienza, trasmessa nella famiglia o nel laboratorio artigianale, arrivava la scienza, sulla base della quale si poteva progettare un algoritmo e costruire una macchina. Ma restava importante nella società il ruolo della formazione (dell’università, della scuola) come luogo di elaborazione e trasmissione di quella scienza.

2 Quello che sta succedendo oggi è qualcosa di diverso. Non è la mano con la pinza ad essere sostituita, ma la mano con la penna. Non sono i compiti di trasformazione della materia ad essere oggetto di ripensamento, ma quelli di trasformazione delle parole. Questo è reso possibile dall’inserimento di una macchina speciale (il computer) nel mercato del lavoro intellettuale. Anche la maniera in cui vengono inseriti è nuova.

I computer sono nati per fare calcoli complessi, calcoli che gli umani svolgevano in un tempo maggiore e con una possibilità di errore variabile. Tutti ormai conoscono la storia delle calcolatrici umane della NASA (“computer”). Il passo successivo è stato quello di collegare al computer un ricettore e un effettore fisico. In questo modo, oltre a fare i calcoli, il computer è diventato soprattutto un dispositivo che trasforma un algoritmo astratto in un gruppo di azioni fisiche, le quali vengono svolte non solo in una sequenza prefissata, come nel caso dei telai Jacquard, ma in base al presentarsi o meno di certe situazioni. Le lavabiancheria programmabili sono un buon esempio di questo livello di integrazione: un programma è costituito da una serie di controlli (livello dell’acqua, tempo trascorso, temperatura) e di azioni corrispondenti.

Ancora più avanti, i computer sono stati miniaturizzati e usati non direttamente per controllare macchine complesse, ma per supportare gli umani nel loro uso. Una autovettura moderna sarebbe difficile da guidare, ma anche da gestire, se non ci fosse un computer di bordo che raccoglie i dati, li elabora secondo modelli, e avverte il conduttore al superamento di condizioni di rischio (carburante in esaurimento entro X chilometri, pneumatici sgonfi, eccetera). In alcuni casi le autovetture sono in grado di effettuare da soli queste correzioni, come nel caso dell’intervento dell’ABS.

Tecnicamente cambia poco quando l’utente non è il consumatore ma il professionista, cioè quando è la sfera del lavoro ad essere investita dalla trasformazione. Anche i software di supporto alle professioni esistono da tempo: i meccanici usano software come supporto alla diagnosi delle autovetture, i giornalisti e i traduttori usano software che li aiutano nella scrittura, i docenti usano piattaforme che li aiutano a intercettare rapidamente un problema di apprendimento degli studenti. Anche in questo caso, si tratta di software che controllano i valori di alcuni parametri e sulla base di un modello di riferimento avvertono l’utente o gli forniscono suggerimenti di correzione. La differenza è che il computer è un ausilio del professionista nel suo operare verso terzi, quindi interviene mettendosi al suo stesso livello. E’ ancora un alleato, invisibile per il cliente.

3 Il passo successivo cambia completamente il quadro: il software si propone direttamente al cliente nella forma di servizio. Software che non si limitano a raccogliere dati, confrontarli con un riferimento atteso e suggerire eventuali correzioni, ma che sulla base di un modello addestrato a partire da un’enorme quantità di dati raccolti dalle performance di milioni di professionisti, e sulla base di tecnologie di machine learning, sono in grado di svolgere gli stessi compiti di questi professionisti e di offrirsi sul mercato in concorrenza.

Attualmente si vedono i primi esempi nei settori che sono circoscritti alla produzione di testi scritti: la creazione di riassunti o di brevi testi, la traduzione, la scrittura di programmi.

La traduzione automatica, il sogno fondante delle ricerche sull’Intelligenza Artificiale negli anni ’60, è ormai sufficientemente precisa da poter essere usata a livello semi-professionale. Non si possono ancora tradurre automaticamente romanzi in cui lo stile vada preservato, ma si possono tradurre brevi testi in cui il contenuto è quello che conta . Oltre ai più noti Bing Translator e Google Translate, ci sono software come DeepL, sviluppati da piccole aziende che restituiscono testi ben scritti, coerenti, fluidi. Ma mentre lo scopo principale di queste ultime è quello di vendere il proprio servizio come tale, lo scopo dei corrispondenti sevizi di Microsoft e Google è più ampio, e permette ai soggetti in questione di offrire gratuitamente, al momento, questo servizio; magari per inserirlo prossimamente come funzionalità aggiuntiva nelle suite di strumenti per l’ufficio che entrambi forniscono. Questo fa sì che studenti, professionisti, aziende che hanno bisogno di produrre un testo tradotto già oggi non fanno più ricorso ad un traduttore umano, che ha un costo che varia in base alla lingua (cioè alla disponibilità sul mercato di traduttori competenti nella coppia di lingue), ma si contentano della traduzione automatica. Così facendo, aumentano la base di dati su cui i modelli si addestrano, e migliorano la qualità del servizio.

I traduttori cominciano a soffrire per questa riduzione di lavoro e reagiscono difendendo “il plus umano”, specializzandosi in domini sempre più piccoli, volgendosi ai campi in cui lo stile è decisivo. Ma si tratta di strategie destinate a fallire: più aumenta il loro livello qualitativo e la loro specializzazione, più dati forniscono ai software di supporto alla traduzione, più diventano efficaci i software di traduzione automatica. Questa differenza è enorme, e rende la situazione molto diversa da quelle precedenti. Si crea un circolo vizioso da cui il professionista non può uscire. Attenzione: il circolo non dipende genericamente dall’uso di una macchina al posto di un uomo, o dall’uso della macchina computer in particolare, ma da questa particolare maniera di costruire competenza artificiale a partire dalla competenza umana.

L’aspetto che non è abbastanza sottolineato, a mio parere, è l’influsso che questa sostituzione ha sulla formazione professionale (nella quale è inclusa anche la formazione universitaria).

Man mano che si incrina il mestiere del traduttore, diventa inutile la formazione relativa, se non quella di altissimo livello (la traduzione letteraria, quella specialistica) che però farà fatica a trovare studenti che abbiano il livello necessario. Scompariranno i corsi base per interpreti e traduttori; ci si domanda se scompariranno anche i corsi di lingua, visto che per le necessità comuni tutto sommato un software è in grado anche da fungere da interprete. In ogni caso, già ora gli studenti di lingue sanno bene che il lavoro di traduttore è destinato a scomparire. I sottotitoli delle serie televisive vengono generati automaticamente (con qualità ancora scarsa); ma questo significa che non vale la pena per un ragazzo investire nell’apprendimento delle lingue pensando ad un futuro professionale in questo settore.

D’altra parte, i software di traduzione automatica non sono il frutto di un lavoro misto di linguisti e ingegneri, ma sono sempre di più basati su modelli costruiti sulla base di larghissimi esempi (machine learning). Questo renderà inutile la trasmissione alle generazioni future della conoscenza linguistica che sta alla base di un processo di traduzione umano. Dopo i corsi di traduzione e i corsi di lingua, scompariranno anche i corsi di linguistica e resteranno solo i corsi di machine learning.

4 Va beh, ma tradurre in fondo è semplice. La competenza della scrittura originale, quella, resterà sempre in mano agli umani. La creatività, ah la creatività.

Insomma. A prescindere dai software “tradizionali”, che sono in grado di creare plot narrativi a partire da personaggi e target (alcuni esempi sono raccolti qui), è il mondo del giornalismo che sta per essere investito dallo tsunami del machine learning. Non domani, adesso. Basta leggere quello che fa Asimov, un sistema della startup romana ASC27. Non sostituisce il giornalista (per ora), ma si presenta come il suo AI Collegue. Fa un sacco di lavoro sporco per i social network:: traduce il testo in audio, crea podcast oppure storie per Instagram; ma individua i trend di un settore, li traduce in strutture dati ed è in grado di scrivere dei drafts di articoli.

Se non ci credete, potete sempre provare con uno dei tanti colleghji di Asimov: per esempio, Sassbook Ai Writer.

5 La stessa cosa sta succedendo per la programmazione, come dimostra il caso di Microsoft AI Copilot. Nel primo periodo di test i programmatori saranno solo aiutati dal “copilota”, che si limiterà a suggerire il codice sorgente adatto al compito descritto dal programmatore. Ma una volta diffuso largamente, come plugin di Visual Studio, e una volta raccolti ancora più dati, AI Copilot si trasformerà in un servizio in grado di produrre autonomamente il codice sorgente.

A quel punto, non sarà più necessario per un’azienda assumere un programmatore senior o particolarmente creativo: qualunque junior potrà realizzare qualsiasi compito gli venga assegnato, esattamente come agli operai adulti e competenti si poteva sostituire un bambino nella fabbrica ottocentesca. E’ il sogno democratico americano: tutti possono diventare programmatori, con un po’ d’aiuto da parte di un guru, o di un modello di machine learning. L’arrivo sul mercato di un’ondata di programmatori junior, sempre più giovani, sempre meno formati ufficialmente, avrà l’effetto di cacciare fuori i programmatori senior, di abbassare il costo del lavoro del programmatore, di rendere inutili i corsi di formazione avanzati e i diplomi universitari. Si può anche discutere sul fatto che la qualità media del codice prodotto si abbassi: potrebbe anche darsi che il livello medio resti costante o addirittura salga. Viceversa, si potrebbe ipotizzare una standardizzazione che non presenterà picchi né in alto, né in basso. Codice corretto, funzionante, ma non innovativo, perché discendente da codice sorgente scritto in precedenza (per il momento, quello pubblicato in GitHub). Se a regime tutte le aziende usassero Ai Copilot, o un suo equivalente targato Google, anche la base di partenza su cui viene costruito il modello si uniformerebbe, con conseguente appiattimento del codice prodotto.

6 Ma senza proseguire in questa direzione, che è specifica del mondo della creazione del software in cui il prodotto di un software è esso stesso un software, in tutti gli altri casi possiamo fermarci alla fase 1: quella per cui ogni lavoro di produzione intellettuale che possa essere sostituito del tutto o in parte da un software andrà a scendere di posizione sociale, e quindi di valore economico, rendendo di conseguenza poco attraente la formazione relativa, che finirà per scomparire.

Una versione fantascientifica di questo processo prevede che ci sia una fase 2, in cui non sarà più necessario che ci siano programmatori umani a scrivere codice sorgente sulla base delle specifiche fornite dall’analista sulla base dei bisogni raccolti, ma sarà sufficiente che l’esperto del dominio applicativo di quel software descriva suoi bisogni perché l’AI Coder produca il software finale. Verrà quindi eliminata anche la figura dell’analista, e l’autore del software sarà un esperto che non ha le competenze per scriverlo o leggerlo. Ma poiché questa attività (scrivere il codice sorgente necessario per un certo compito) fa parte delle cose che sanno fare i software, il passo successivo sarà quello per cui l’idea stessa di scrittura del codice come atto separato sarà sostituita da una funzionalità aggiuntiva di ogni software, attivabile in continuo e non solo in certi momenti particolari. Tutti i software saranno dotati della capacità di crescere, di ripararsi, ed eventualmente generare cloni. E’ curioso, se ci si pensa, che lo scenario apocalittico di tanti film sul AI che prende il sopravvento della macchina sull’umano abbia come protagonisti i robot, e non i software, che sono molto più diffusi e molto più vicini all’autonomia.

Questo processo è diverso dal corrispondente processo di sostituzione dell’operaio competente con una macchina, perché in questo caso – grazie al Machine Learning che impara dati dati, non applica una teoria – anche la conoscenza teorica che permetteva di disegnare l’automazione verrà resa inutile. Non soltanto non sarà più necessario che sia un essere umano a scrivere un programma (o a effettuare una traduzione o scrivere un articolo); ma ad un livello superiore, non ci sarà nessuno in grado di verificare un testo, di correggerlo, di deciderne l’applicabilità ad un contesto.

Si può immaginare che per un certo periodo resti attiva una formazione ultra-specifica, riservata a pochissimi eletti, che sfoci in una nuova professione: il controllore umano. Si tratterebbe peraltro di un periodo di transizione, in attesa che anche questa competenza possa essere imitata ad un software.

Sul piano sociale, un effetto prevedibile potrebbe essere la nascita di un movimento neoluddista (sulla scorta del movimento che ha accompagnato la diffusione delle fabbriche), a cui parteciperebbero tutti i professionisti formati tradizionalmente, i quali si rifiuterebbero di fornire i propri prodotti come sorgente di apprendimento per i modelli di ML. Qui non siamo nella fantascienza ma nella storia: è quello che hanno cominciato a dire alcuni programmatori a proposito dell’uso del codice sorgente di Github da parte di Microsoft per nutrire il modello di AI Copilot: o GitHub cambia licenza, oppure togliamo il nostro codice da lì.

7 Se si trattasse di un processo naturale, di un movimento universale e necessario, potremmo pensare che l’umanità – o almeno la sua parte più ricca – dopo aver smesso di compiere lavori fisici smetterà anche di compiere lavori intellettuali, e si trasformerà in una specie dedita al godimento estetica, cancellando finalmente l’etica del lavoro e del merito.

Più realisticamente, potremmo immaginare che in aree geografiche del mondo in cui le persone che hanno delle competenze di valore sono rare – perché manca la formazione, perché non c’è un mercato, perché sono aree a rischio, perché i numeri sono troppo grandi – il software potrebbe sostituirle. In Paesi in stato perenne di guerra o di carestia è difficile trovare traduttori, giornalisti, programmatori (ma soprattutto docenti, medici, avvocati).

Allora ecco che il surplus tecnologico andrebbe a colmare quei vuoti.

Certo, ci sarebbe sempre una distanza: i Paesi ricchi si potrebbero permettere dei professionisti “veri”, supportati dai vari Collegues, Companions, Copilots, mentre i Paesi poveri avrebbero a disposizione solo quelli “artificiali”. Ma la crescita culturale che ne seguirebbe potrebbe anche modificare gli equilibri e creare più cultura a livello mondiale.

Il problema è proprio che questo non è un fenomeno naturale. C’è di mezzo la volontà precisa di alcune imprese di indirizzare in quella direzione l’uso dell’informatica, di fare profitto in questo specifico modo. Queste imprese intendono sostituirsi su scala planetaria al “motore della storia della tecnica” facendo delle scelte che tendono all’eliminazione delle professioni nelle aree ricche del mondo, e alla loro sostituzione da parte di “servizi”.

Inoltre, non cercano semplicemente il guadagno, come fa ogni impresa for profit, ma cercano di semplificare e controllare tutti gli aspetti della vita umana, per il bene dell’umanità. Già oggi non serve saper leggere una mappa, non serve sapere le lingue; e presto non servirà rivolgersi ad un programmatore. Basta affidarsi all’assistente privato, che si chiami Alexa, Siri, Cortana.

E’ importante vedere la non naturalità di questo processo, perché solo così si può pensare di invertirlo o almeno creare delle alternative (come, ad esempio Mycroft che si presenta come alternativa opensource agli assistenti vocali). Non è l’unica maniera in cui il digitale può evolversi, anche se è al momento quella più probabile. Bisogna riuscire a pensare una differenza.

E’ la differenza che è presente nell’analisi contenuta nel Capitale delle macchine ottocentesche tra strumenti usati nella manifattura e macchinario nella fabbrica:

“Nella manifattura e nell’artigianato l’operaio si serve dello strumento, nella fabbrica è l’operaio che serve la macchina. Là dall’operaio parte il movimento del mezzo di lavoro, il cui movimento qui egli deve seguire. Nella manifattura gli operai costituiscono le articolazioni di un meccanismo vivente. Nella fabbrica esiste un meccanismo morto indipendente da essi, e gli operai gli sono incorporati come appendici umane” (Libro I, Sez. IV, Cap 13).

E’ la differenza tra software come strumento (pannello di controllo, verifica, etc ) che aiuta e il software come macchinario che sostituisce.

Non è necessario che il software debba trasformarsi in macchina di cui le persone sono appendici. Si può ancora puntare a realizzare software che seguano il movimento delle persone, e non che lo impongano. Si può ancora immaginare una produzione di software che è volta al profitto – cioè al sostentamento di chi ci lavora – ma non al dominio totale di ogni aspetto della società.

E’ questa mancanza di pensiero alternativo che ci sta consegnando con le mani legate ad un futuro agghiacciante.