Digi Tales

Intellig-enti

Parto invitandovi a leggere questo articolo di Wired in cui Andrea Indiano dà conto della moda recente di usare generatori automatici di immagini a partire da testo per “arredare visivamente” clip audio.

https://www.youtube.com/watch?v=tgBHgmMI4kU

I generatori di immagini da una descrizione (txt2img) sono un po’ l’inverso dei software che riconoscono soggetti all’interno di foto. Questi ultimi sono diventati quasi standard (anche le immagini caricate su Facebook passano per questo tipo di analisi) e se ne parla solo a proposito della liceità dell’uso di questi algoritmi nel caso del riconoscimento dei volti umani in regimi totalitari. O in regimi. Insomma, ovunque.
Qui invece di solito si parte da un testo che descrive una situazione un po’ come i sottotitoli per non udenti. Solo che qui la descrizione non è limitata dalla realtà, anzi non descrive ma crea. Ad esempio: “un cerbiatto rosa sulla luna che sorseggia una coca-cola.” Qualche filosofo direbbe che è un caso eclatante del potere del linguaggio che non rappresenta il mondo ma lo porta all’esistenza.
L’idea è provare a utilizzare lo stesso strumento non con un testo descrittivo fatto apposta, ma con le parole di una canzone. Un esempio: The Sound of Silence, di Simon&Garfunkel. Oppure: Space Oddity di David Bowie.
L’uso di immagini per riempire il vuoto visivo di una canzone pubblicata in un canale video-centrico come Youtube non è una novità. E’ sempre più difficile imbattersi in un clip video che ripropone una vecchia canzone di Fabrizio De André con l’immagine fissa della copertina del disco originale. Se c’è, è stato pubblicato parecchi anni fa. Come minimo oggi ci sarebbero le sequenze in dissolvenza delle foto dei concerti oppure delle immagini “di repertorio” rubate qua e là (una stazione per “Bocca di Rosa”, un mucchietto di diamanti per “Città vecchia”, eccetera). Se non siete boomer, non potete capire.
La novità è invece che si comincia a trovare un uso sensato di questa funzione di “frullatore intelligente di immagini”. Come spesso succede, non si tratta di un uso davvero nuovo di una funzione nuova, ma della replica accelerata di qualcosa che esisteva. Nella versione tradizionale c’è un umano che gira per depositi di immagini free (come Pixabay o Unsplash), cerca e seleziona immagini sulla base delle parole del testo; nella versione AI questo processo viene coagulato in un’azione singola affidata ad un software. En passant viene anche risolto il problema del copyright generando immagini nuove che superano il vincolo della licenza d’uso (almeno per ora: il diritto d’autore dovrà aggiornarsi).

Sembra che i generatori più usati per dare una controparte visiva ai clip audio siano Dall-E, Midjourney ma anche Stable Diffusion . Magari a voi sembrano tutti uguali, ma non lo sono: per quanto quasi tutti siano gratuiti almeno nella versione limitata, alcuni sono anche scaricabili e utilizzabili sul proprio PC, o persino modificabili, grazie ad una licenza opensource, mentre altri sono proprietà dell’azienda che li ha sviluppati e che ne permette l’uso come servizio web, più o meno gratuito, più o meno vincolato. Però una cosa è un ragazzetto del Minnesota che si diverte a creare videoclip a partire dai suoi brani preferiti e una cosa sarebbe Youtube che introducesse una funzione che associa automaticamente le immagini a qualsiasi clip audio caricato dagli utenti. Nel primo caso il controllo finale è ancora in mano all’utente/cliente, nell’altro sarebbe completamente in mano del fornitore di servizi. Non della “rete”, soggetto generico onnipresente, ma di un determinato attore del mercato globale che persegue suoi obbiettivi economici, di comunicazione, di ricerca etc. in totale (e legittima) autonomia. Per esempio, Youtube potrebbe usare una qualità più bassa, oppure delle immagini leggermente sgradevoli, in associazione a certi clip audio per scoraggiarne l’uso o per indurre un sentimento negativo negli spettatori.
Era questo l’obiettivo dei ricercatori che hanno messo a punto Dall-e o Midjourney? Credo di no. OpenAI, la società californiana che sviluppa Dall-e 2, è stata fondata da Elon Musk ed è finanziata da Microsoft; Imagen è sviluppato da Google.
Magari il prossimo passo sarà la produzione di un cartone animato o di un videogioco, visto che cinema e videogiochi sono un mercato enorme e che hanno dei costi di produzione legati alla manodopera specializzata umana ancora altissimi. Per un buon “training” dei modelli però non basta avere sterminati archivi di immagini a disposizione: occorre anche la valutazione degli utenti finali. Di qui l’interesse a permettere l’uso delle versioni beta di questi software a più persone possibile. Più giochiamo con Dall-E, più aiutiamo Microsoft, gratis.
Quindi usare l’uno o l’altro è anche una questione di scelta politica, non solo estetica. Tenere conto di questi aspetti quando si riflette e si scrive di applicazioni dell’IA alla vita dovrebbe essere ovvio; a giudicare da quel che si legge invece non lo è.




Potremmo fermarci qui e invece andiamo avanti. “Questa non è intelligenza!“: può darsi che questa frase vi sia venuta in mente guardando i videoclip.
Non siete i soli. Ci sono state discussioni infinite sull’intelligenza della macchina, o del software che l’ha prodotta, o del gruppo di programmatori che ha scritto il software. Infatti la prima domanda è: chi è il soggetto in questo caso? Chi è l’ente che si nasconde dentro l’intelligente?
La sorgente di queste discussioni sta nel fatto che questi software sono applicazioni di machine learning, ovvero non sono intelligenti nella interpretazione consueta dell’aggettivo. Non ragionano sulla base di regole, non deducono, non cercano percorsi alternativi.
Quello che farebbe un software tradizionale è costruire una query (una stringa di ricerca) basata sulle parole fornite dall’utente (nel caso di sopra, il verso della canzone) e sulle loro relazioni. La query verrebbe passata ad un motore inferenziale capace di astrazione (per esempio, da “Bambi” sarebbe in grado di dedurre cerbiatto, cervo, mammifero, quadrupede, animale). Applicata ad un archivio di miliardi di immagini la query restituirebbe un certo numero di immagini che poi sarebbero state mixate, filtrate, adattate in base anche allo stile impostato dall’utente-creatore.
Invece le applicazioni di machine learning funzionano diversamente. Partono direttamente dall’archivio di immagini marcate con parole o valutazione di utenti umani (prese da Pinterest, Flickr, Wikipedia etc) e le utilizzano per costruire dei modelli; poi analizzano il testo di input e lo forniscono come filtro al modello che produce letteralmente la nuova immagine. Tutto sta nel modello, e infatti è la parte più complicata e costosa da produrre.
Un modello è sostanzialmente costituito da un numero enorme di parametri, cioè di coppie proprietà/valore. Un triangolo è un tipo di modello, ma ha solo sei parametri: la misura degli angoli e la lunghezza dei lati. Se si volesse costruire un modello di un triangolo fisico occorrerebbe aggiungere altri parametri: la posizione nello spazio, il peso, il tipo di materiale, il colore. Un modello di una perturbazione meteorologica è molto, molto più complesso. I modelli usati dai software di machine learning possono avere miliardi (letteralmente) di parametri.
E’ fondamentale, nella prima fase, l’utilizzo dei commenti da parte di umani per la marcatura delle immagini. Qui l’aspetto quantitativo è vincente, e come è ovvio introduce enormi bias culturali: se si prendono solo i commenti in inglese, si replica la maniera di vedere il mondo degli umani anglofoni, se non statunitensi o britannici.

E’ la fine dell’arte, è la fine delle scuole d’arte? Dopo gli autori di traduzioni, di recensioni, di musica, ora gli autori di quadri andranno in pensione anticipata? Ne abbiamo già parlato qui.
Torniamo alla nostra frase: “Questa non è intelligenza”.

In questa frase ci sono, a mio parere, tre errori; errori che non fanno sicuramente (più) gli scienziati che si occupano di intelligenza, dagli psicologi ai neurobiologi, ma che facciamo più o meno tutti quando ragioniamo affacciati alla finestra di qualche social network, cioè la maggior parte del tempo:

  1. che l’intelligenza sia innata, data una volta per sempre agli umani (e non alle macchine), purtroppo in maniera variabile;
  2. che l’intelligenza sia assoluta e non relativa ad un contesto, ad una situazione;
  3. che l’intelligenza tout court coincida con la forma di intelligenza codificata nel mondo adulto occidentale.

A questo punto la tradizione vuole che ci si interroghi sul significato della parola. Cos’è l’intelligenza? Domanda a cui sono state date tante risposte quanti erano i contesti storici, politici, sociali in cui è stata posta. Difficile dire quale sia quella corretta in assoluto, difficile persino parlare di correttezza e scientificità per una definizione di qualcosa che assomiglia più ad un assioma che ad un teorema, nel senso che è un presupposto e non qualcosa di dimostrabile. Probabilmente è uno dei costrutti chiave del Novecento, così come nell’Ottocento un costrutto fondamentale era “lavoro”. Anzi, si potrebbe forse dire che una delle differenze tra Ottocento e Novecento è proprio il passaggio dall’organizzazione e efficientamento del lavoro degli operai potenziando i loro muscoli con quelli della macchina a vapore alla sostituzione dell’intero lavoro fisico con l’intelligenza; passaggio che sfrutta il concetto di macchina e lo trasforma in quello di automa. Ma qui divagheremmo troppo.
Molte sono le definizioni che, a mio parere, si limitano a spostare il problema, cioè usano nella definizione termini che a loro volta dovrebbero essere definiti (“the capacity… to think rationally“, Wechsler; “the ability to deal with cognitive complexity”, Gottfredson) fino a quelle ricorsive (“L’intelligenza è ciò che è misurato dai test di intelligenza”, Boring). Ci sono le definizioni che puntano sull’adattamento all’ambiente (Binet, Feuerstein) e quelle che sottolineano il raggiungimento di obiettivi (Legg e Hutter, Stemberg e Salter). Tutto questo lo potevate trovare su Wikipedia ma vi ho risparmiato la fatica di cercarlo.
Quella che mi convince di più è una definizione più filosofica che psicologica: “L’intelligenza è l’abilità di mettere ordine in una situazione complessa con il minimo consumo di risorse“. Questa definizione si basa su due valori molto generali: l’ordine è preferibile al caos, da un lato, e il risparmio di energie è preferibile allo spreco. Il primo valore ha a che fare con l’ambiente, il secondo con il soggetto che si trova in quell’ambiente. L’intelligenza mette in relazione questi due valori, ne cerca un equilibrio. Come dire: sarebbe bellissimo avere una situazione perfettamente ordinata, ma non al prezzo di consumare tutte le risorse disponibili. Una situazione ordinata è una situazione prevedibile, con meno rischi; non sprecare risorse e tenersene da parte un po’ per i giorni di pioggia è un altro modo di ridurre i rischi. Inutile ridurre da una parte e aumentare dall’altra. Oppure sì, ma va tenuto d’occhio l’ago della bilancia.
E’ una definizione di chiaro sapore evoluzionistico, ma avevo avvertito che si trattava di una definizione filosofica, non scientifica.
A mio parere ha diversi vantaggi. Intanto è un modo di ricordarsi che l’intelligenza non è buona o cattiva in sé, ma solo in un contesto determinato, come meta-strumento per ottenere risultati che – loro – sono considerati positivi: la conservazione in vita dell’individuo, la trasmissione del patrimonio genetico.
Non fa riferimento a concetti legati alla mente, ma solo al fatto (puramente organico) che usare i muscoli per spostare un masso consuma più energie che immaginare di farlo. Una volta ho letto un romanzo fantasy in cui fare una magia “costava” al mago, non proprio lo stesso sforzo dell’azione reale ma qualcosa di proporzionale. Non è un paragone fuori luogo: la magia è una forma di intelligenza.

Questa abilità è considerata un valore dal punto di vista dell’individuo, al punto da cercare di misurarla con dei test, perché è un valore dal punto di vista della comunità. Una comunità fatta di persone intelligenti è più efficiente, si conserva meglio nel tempo, cresce.
La Grecia classica, Atene in particolare, aveva puntato su questo valore a livello di cultura: i sofisti, i retori, i filosofi sono un’immagine concreta del valore che si attribuiva alla capacità del cittadino di ragionare con la sua testa e decidere. La Grecia aveva portato questo valore anche a livello di politica estera, ritenendo possibile sconfiggere l’impero persiano, così tanto superiore per potenza di armi e uomini, con la strategia, gli accordi tra città e la pianificazione.
Ma si può leggere in questo modo l’intera evoluzione umana, raccontando una storiella come questa: tanti anni fa, puntando sull’intelligenza, sulla categorizzazione di situazioni apparentemente diverse, sulla previsione, sulla pianificazione, i primi umani riuscirono a sopravvivere in un contesto in cui c’erano animali ben più forti e resistenti. L’intelligenza si cristallizza in strumenti: un utensile non è altro che un’astrazione di infiniti possibili contesti d’uso. L’intelligenza si trasmette attraverso le generazioni, se nel frattempo si inventa un linguaggio.

Forse individualmente non siamo ancora perfettamente tranquilli nello scommettere sull’intelligenza contro la forza in tutte le occasioni. Non tutte le battaglie sono vinte grazie alla flessibilità della tattica o per merito della migliore armatura (come nel 490 a Maratona). Quando a Kinshasa nel 1974 Mohammad Alì vince contro George Foreman – che era dato per favorito 3:1 – fa scalpore e ce lo ricordiamo perché di solito quando si fa a pugni vince il più forte (che era Foreman: più giovane di sette anni, più alto, più pesante). Alì inventa una tecnica intelligente (rope-a-dope: usa le corde del ring per assorbire la forza dei pugni di Foreman) che dopo quella volta viene riusata anche da altri pugili.



Malgrado questo, come specie, siamo fondamentalmente convinti che l’intelligenza sia una strategia vincente, tant’è che ci affanniamo a insegnarla ai cuccioli d’uomo, anche quando non devono affrontare tigri e serpenti. Curiosamente, non lo facciamo frontalmente, ma per vie traverse. A scuola non si insegna intelligenza, ma matematica, fisica, magari coding. Certo si fa anche educazione motoria, ma non c’è paragone quanto a risorse dedicate.
Ma perché allora non puntare direttamente all’apprendimento dell’intelligenza? Perché ricorrere a giri di parole come “lo studio del Latino insegna a ragionare”? Credo che la risposta sia semplice: perché non abbiamo idea di come altro si possa fare. Non abbiamo idea di come insegnare la capacità di risolvere problemi senza dei problemi concreti da cui partire. Pensiamo di poter dire che l’esercizio della traduzione, o quello della soluzione di equazioni, favorisce l’abilità generale che chiamiamo intelligenza: ci sembra che chi lo pratica per un certo tempo poi sia in grado di affrontare anche altri tipi di problemi e inventare soluzioni economiche. In questa prospettiva si spiega la posizione privilegiata di matematica, fisica e oggi di informatica nei curriculum scolastici di mezzo mondo. Non è tanto il fatto che le STEM (science, technology, engineering and mathematics) in quanto tali siano importati per la professione futura (anzi, forse lo sono sempre di meno), ma il fatto che grazie al loro insegnamento manteniamo e potenziamo l’intelligenza della specie.
La matematica è un’applicazione dell’intelligenza agli aspetti del mondo che si possono quantificare. Per scambiare pecore con orci d’olio ci sono due modi: uno richiede di accoppiare fisicamente le une e gli altri fino ad ottenere una parità; l’altro si limita a contare orci e pecore e a confrontare i numeri.
La fisica è un’applicazione dell’intelligenza alla previsione del comportamento di alcuni aspetti della materia, come la posizione, che cambiano spesso. Ci piacerebbe sapere in anticipo come cambiano questi aspetti; ma invece di aspettare e vedere che succede, si possono costruire delle regole, applicarle ripetutamente (simulazioni) e confrontare i numeri finali. Questi set di regole si chiamano “modelli”. Il risparmio, in questo caso, non è di fatica muscolare ma di tempo, che è comunque una risorsa fondamentale.
La chimica è una cuginetta più giovane della fisica: si occupa di trasformazioni profonde della materia, quelle per cui gli oggetti diventano altro. Lo fa allo stesso modo delle fisica, cercando di costruire modelli matematici unici di contesti che sembrano diversi, a costo di mettere in gioco elementi invisibili ma che hanno un peso. Lo sforzo di pensare la struttura profonda della materia è ricompensato con una capacità di produrre materia nuova usando quella che esiste. Rinunciando a vedere la materia, mettendo tra parentesi i sensi, facciamo un’ottimizzazione che ci consegna un maggior poter sul mondo.
La teoria generale dell’insegnamento dell’intelligenza è dunque questa: fare pratica dell’uso di schemi di ordinamento di situazioni complesse in domini limitati, ristretti, sperando che questa esperienza si coaguli in competenza, cioè in capacità di riapplicare al momento giusto alcuni degli schemi che abbiamo sperimentato positivamente in passato. Non si offendano i docenti di matematica e scienze: non c’è una grande evidenza sperimentale che questo metodo funzioni, ma è talmente diffuso che non lo mettiamo nemmeno in discussione.
Anche l’informatica è un’applicazione dell’intelligenza agli aspetti del mondo, sulla stessa strada di matematica, fisica e chimica. Solo che non esclude nessun oggetto e nessun aspetto: prende luci, suoni, movimenti e trasforma tutto i numeri. Ambisce a costruire modelli di tutto ciò che ha una forma: dalla forma degli oggetti allo schema delle relazioni sociali, da quella del territorio al profilo dei clienti. Su questi modelli applica algoritmi che consentono di misurare, prevedere cosa succederà, creare oggetti nuovi (anche se solo virtuali). Il doppione del mondo che mira a costruire è un’incarnazione perfetta dell’intelligenza: tutto forma e niente materia, replicabile, indistruttibile, pulito, razionale.
Naturalmente, con buona pace di Leibiniz che sperava che un giorno tutti i filosofi si sarebbero messi a calcolare invece di discutere vanamente, gli algoritmi informatici richiedono un velocità di calcolo che i nostri cervelli singoli non hanno. Per quanto un famoso teorico dal cognome impronunciabile abbia detto che “L’informatica non riguarda i computer più di quanto l’astronomia riguardi i telescopi”, invece l’informatica senza i computer – computer sempre più veloci – non servirebbe a nulla.


Qui si apre un bivio tra apocalittici e integrati. C’è chi ritiene che per renderci davvero intelligenti l’informatica ci chiede di rinunciare non solo ai muscoli, ma a tutto il corpo, fino a sostituire il soggetto organico con un agente meccanico capace di mettere ordine consumando pochissime risorse (così almeno promette; in realtà si comincia a capire che il consumo di elettricità dei centri di calcolo dove risiedono le applicazioni e i dati che insieme costituiscono il “cloud” dovrebbe essere tenuto sotto controllo). Quindi insegnare il coding a scuola è inutile e contraddittorio: mentre insegniamo l’informatica ai bambini, l’informatica si sta sviluppando nella direzione di rendere vano questo sforzo didattico. E’ lo spettro evocato da tanti romanzi e film di fantascienza: quando i robot diventeranno intelligenti non avranno più bisogno di noi.
C’è chi invece pensa che l’informatica si limiti a supportarci, come un’estensione buona della nostra intelligenza ma all’esterno del nostro corpo. Non sostituisce ma potenzia. Ci permette finalmente di trasformare dati in informazioni, in conoscenze e forse in sapere. Ci rende la vita più piacevole, ci libera dalla fatica di ricordare. Come diceva in una delle sue battute meno riuscite Aristotele: gli schiavi (digitali) permettono agli uomini liberi di avere più tempo da dedicare alla filosofia. Quindi insegnare coding a scuola e fuori fa bene all’intelligenza dei ragazzi, che impareranno finalmente a pensare in maniera razionale, logica, senza errori, come dei bravi computer.

Entrambe queste visioni, a mio parere, sono astratte. L’informatica non è un soggetto, non ha obiettivi, non va da nessuna parte da sola. Le ricerche più avanzate nei domini dell’intelligenza artificiale si fanno fuori dalle università. Le sperimentazione con miliardi di utenti vengono gestite da aziende che hanno un obiettivo di business immediato e un piano più generale di conquista dei mercati.
Sono aziende guidate da persone che rispondono agli azionisti.
D’altra parte, come detto prima, l’informatica ha bisogno di hardware e l’hardware costa. Il supercomputer Leonardo, inaugurato a Bologna pochi giorni fa, è capace di un miliardo di miliardi di operazioni al secondo ma è costato 240 milioni di euro. Però il costo maggiore non è quello dei transistor: è quello dell’elettricità che serve per farli funzionare. E’ noto che Alphabet, l’azienda che è proprietaria di Google, ha coperto i suoi centri di calcolo di pannelli fotovoltaici per prodursi in casa l’energia necessaria e non doverla comprare da nessuno. Una buona cosa, no? Certo, basta sapere che fine faranno quei pannelli quando non saranno più produttivi. O, da un altro punto di vista, basta sapere l’impatto che può avere sull’economia di un Paese l’arrivo di una google-farm che comincia a produrre e a rivendere energia elettrica ad un costo competitivo rispetto a tutti gli altri attori del mercato, fino a conquistare il monopolio.
Cosa c’entra il coding? Beh, il coding non andrebbe né rigettato come contagioso, né sposato come strada maestra per insegnare l’intelligenza ai bimbi. Dovrebbe essere appreso come un mezzo particolarmente efficace didatticamente per simulare il mondo (matematico, fisico, chimico, biologico, linguistico,musicale,geografico,…), fare ipotesi e verificarle senza necessariamente andare dietro alle ultime opinioni che abbiamo sentito in giro; ma anche un modo per capire come funziona il mondo sociale: che società ci aspetta? chi decide cosa possiamo vedere e sentire, cosa possiamo leggere, con chi possiamo comunicare? Usare i robot in classe dovrebbe permettere di interrogarsi insieme su cosa succederà quando tutti i lavori saranno svolti da robot. Andare a caccia di dati (per esempio, sull’ambiente) dovrebbe essere un modo per rendersi conto del loro valore e scoprire che non tutti li rilasciano allo stesso modo, o che non tutti i motori di ricerca sono agnostici. Scrivere piccoli programmi potrebbe essere un modo per riappropriarsi dei computer e sfruttarli per fare qualcosa di utile prima di tutto per noi, come speravano negli anni sessanta gli inventori degli home computer e dei linguaggi di programmazione per tutti.
Potremmo ancora dire che fare coding aumenta l’intelligenza? Senz’altro, anche se non nel senso che insegna a diventare computer. Anzi, insegna a non farsi programmare.



Ma quale intelligenza?
La forma di intelligenza che prevale nella nostra culture è quella adulta e formalizzata. Quella che si può descrivere mentre si applica, in cui i passi sono consapevoli e si possono identificare ed etichettare. E’ l’intelligenza formalizzata, la logica. Il meccanismo principale, potremmo dire il motore che la fa girare e che produce risultati, si chiama “deduzione”. I filosofi hanno passato duemila anni a raffinarla, a porre dei limiti a cosa può fare o non fare, fino a dire che se è definita proprio precisamente potrebbe applicarla anche una macchina. La possiamo chiamare intelligenza di tipo B.

Perché B? perché i bambini appena nati non hanno questo tipo di intelligenza, ma iniziano a cercare di categorizzare il mondo e a selezionare le risposte che mettono ordine. Categorizzano milioni di aspetti e situazioni, ipotizzano azioni, le sperimentano, le scartano. Questo è il mondo fondamentale con cui la specie umana (e probabilmente tutte le specie animali superiori, e forse anche tutte le specie viventi) acquisiscono intelligenza. Questa la chiamiamo intelligenza di tipo A. E’ il tipo di intelligenza che ci appartiene di più, come essere umani, perché non ce la deve insegnare nessuno. Anzi, senza di lei, non sapremmo neppure che ascoltare un adulto esperto in generale è una buona idea, perché se è ancora vivo forse può insegnarci qualcosa che non sappiamo.

Decisamente curioso allora è il fatto che quando parliamo di intelligenza per sottrazione (“i computer non sono veramente intelligenti, gli manca A B e C”) facciamo riferimento ad una forma di intelligenza che tutto sommato è più loro che nostra.

Fatto sta che l’industria dei computer non poteva fermarsi. Tutti i dispositivi elettronici sono un po’ intelligenti, nel senso che sanno fare velocemente cose molto complicate, adattandosi al contesto, soprattutto se sono connessi tra loro. Ma insomma i PC non hanno realizzato quell’eden che ci avevano promesso: ci tocca ancora alzarci la mattina per lavorare, anche se da casa. Però un produttore di hardware non può smettere di creare macchine sempre più veloci e potenti per il solo motivo che alle persone comuni non servono a nulla. Tra l’altro qualcuno quelle macchine se l’era comprate davvero: tante macchine, molto grosse. Una volta impiegato il 10% della loro potenza per fare ricerche o vendere libri col restante 90% qualcosa dovevano pure farci.
Insomma, dopo aver fallito nel dare l’intelligenza di tipo B alle macchine (cioè a formalizzare comportamenti intelligenti per compiti non banali o non quantitativi in modo da renderli eseguibili da macchine), siamo tornati al tipo A e abbiamo “riscoperto” il machine learning: un soggetto che cerca di categorizzare il mondo sperimentando risposte organizzative. Mentre però una specie animale impiega milioni di anni, e un individuo parecchi anni, le grosse macchine attuali impiegano molto meno tempo, ore o al massimo giorni. Diciamo che i muscoli, in questo caso, sono al servizio dell’intelligenza, nel senso che la crescita della pura potenza di calcolo di un computer nel corso degli ultimi settant’anni è stata molto, ma molto superiore a quella di qualsiasi organismo vivente. La cosiddetta Legge di Moore ipotizza che la potenza di calcolo dei computer raddoppi ogni due anni. E’ una legge empirica che non tiene conto di tantissimi altri fattori, ma indicativamente significa che dai primi computer degli anni ’50 ad oggi la potenza è raddoppiata 35 volte. 2 alla 35 fa 34 miliardi e spicci: è la misura di quanto i computer di oggi sono più potenti dei primi.

http://www.ozengenharia.com.br/blog/tag/corvo-albino/


Va detto a onore dei filosofi che questa prima forma di intelligenza l’avevano definita da un pezzo: si chiamava “induzione”. Piaceva tanto agli inglesi nel ‘600: se vedo un corvo nero, può essere un caso. Se ne vedo 10, comincio ad avere dei dubbi. Se tutti i corvi che vedo sono neri, allora è un complotto oppure tutti i corvi sono neri, cioè “nero” è una proprietà necessaria dei corvi. Però già sapevano che è un’intelligenza un po’ rozza, approssimativa, non porta sempre a risultati corretti: esistono i corvi albini. Anzi il problema è proprio che non si sa se i risultati sono corretti. Inoltre il risultato dipende fortemente dalle prime osservazioni, che portano a puntare in una certa direzione, cioè a cercare animali alati e neri. Non possiamo fare ameno di usare l’induzione ma sappiamo che non ci possiamo fidare completamente.
E’ di qualche giorno fa la notizia che Meta ha temporaneamente ritirato Galactica, un motore di ricerca “intelligente” specializzato nelle produzione di abstract da pubblicazioni scientifiche, basato ovviamente sul machine learning, perché produceva dei risultati falsi.
Ancora una volta i filosofi, nella loro passeggiata guardando le stelle, un attimo prima di cadere in un pozzo, avevano scritto che siamo incastrati tra due forme di intelligenza limitate: la deduzione che non porta niente di creativo e l’induzione che non porta niente di sicuro. Poi hanno provato a definire forme nuove di intelligenza, con risultati un po’ dubbi. Ma almeno hanno indicato una direzione, ci hanno suggerito di cercare di non restare bloccati nel dilemma, o per lo meno di cercare di non prenderci per dèi.

Tanto per riassumere, all’americana: l’intelligenza è un’abilità che si acquisisce, si perfeziona. Certo occorrono delle basi neurologiche, come occorre un contesto stimolante. Ma il processo di acquisizione non si può bloccare, neanche volendo, perché funzioniamo così.
L’intelligenza non è un’abilità assoluta, indipendente dalla cultura, dalla lingua, dall’età. L’intelligenza assume forme diverse in funzione della situazione problematica che va affrontata.

Abbiamo deciso, come specie e come continente, di privilegiare una certa forma di intelligenza, che è facilmente riconoscibile e (pare) facilmente insegnabile. Ne abbiamo fatto un valore a sé, dimenticando che è solo un mezzo conveniente, efficace fino ad un certo punto. Ce ne siamo accorti quando abbiamo tentato di concedere questo tipo di intelligenza a certe macchine, con risultati così così.

Allora qualcuno si è ricordato che c’è almeno un’altra forma di intelligenza, che dovremmo conoscere molto bene ma che tendiamo a scordare, che si può cablare nelle macchine. Così sono stati creati dei bambini digitali che pasticciano, scarabocchiano, cantano imparando da noi. Staremo a vedere quanto ci mettono a diventare adulti. Poi se li chiudiamo in una stanza e gli diamo da vedere solo cartoni animati, beh forse adulti non ci diventeranno mai.

Infine: si sviluppa la propria intelligenza in tante maniere, e tra queste c’è quella di creare mondi virtuali, fare ipotesi e verificarle immediatamente tramite la programmazione dei computer. Magari applicando questa tecnica anche agli stessi computer, le reti e ai servizi che passano attraverso: come funziona? dove va a finire questo filo? chi c’è dall’altra parte dell’antenna?


Ah, a proposito: l’informatica non è un prodotto dello spirito del tempo.

Contro le competenze

Faccio coming out: sono una persona competitiva.

Lo sono da quando ero piccolo. Non sugli oggetti fisici, che si possono comprare, ma sulle competenze, che si possono acquisire. Voglio fare le cose meglio, sempre meglio. Vorrei sempre essere più competente degli altri, o avere più competenze. Soprattutto voglio che la competenza mi venga riconosciuta come qualità, voglio che tutti mi apprezzino e mi vogliano bene per questo.

Normale? Secondo l’autore anonimo responsabile della pagina “Competenza” su Wikipedia sì: “Qualsiasi percorso si scelga nella vita la competizione è inevitabile, poiché solo attraverso di essa si selezionano i migliori”. Il legame tra competizione e competenza non è solo etimologico, allora.

Positivo? Beh, dipende.

E’ una faticaccia, che mi stressa, mi costringe a tenere sempre alta l’attenzione. Non posso farmi trovare impreparato o stanco, se entro nell’agone poi devo vincere. Mi rende anche antipatico: non solo a quelli che competono e perdono, ma anche a quelli che vincono (che sono miei simili e quindi, giustamente, diffidano di me per il futuro). Per non parlare di quelli che non amano le competizioni e che si annoiano quando gli tocca di assistere. Mi fa dormire male, perché mi pare sempre che mi manca qualcosa, come nei sogni in cui si entra in una stanza affollata in mutande.

Per fortuna (!), anni di educazione cattolica messi a bagno nel magma della politica giovanile degli anni ’70 qualche effetto lo hanno prodotto: la forza, il successo, il potere non erano dei valori da ricercare, mi dicevano: e io ci ho creduto.

Di conseguenza qualche dubbio sull’etica della competizione ce l’avevo, anche se non riuscivo a risolverlo. Per esempio, quando col biliardino si rigiocavano i mondiali del ’70, tutti volevano essere il Brasile. Io invece volevo essere il Belgio, che tanto si sapeva che sarebbe arrivata ultima malgrado i suoi arrembaggi (all’epoca non era ancora una squadra di professionisti). Non che volessi perdere, non ero masochista; ma non volevo vincere da favorito. E se succedeva che vincevo troppe partite – quindi il Belgio diventava favorito del nostro mini-mondiale – allora volevo cambiare squadra. Il mio ideale di partita era senza tempo, senza termine: una partita eterna. Risultato: una contraddizione che non mi rendeva mai completamente felice, né nelle vittorie né nelle sconfitte.

Di chi era la colpa? Della scuola?

Il mio amatissimo maestro Biagio alla fine del quadrimestre regalava libri (le avventura di Sandokan, per lo più) a quelli che erano andati meglio. Era un modo per incitarci a studiare, ma dopo un po’ era chiaro che alcuni non avrebbero mai avuti libri e altri li avrebbero sempre avuti. In mezzo c’era una zona grigia dove raramente accadevano sorprese.

Più avanti mi fu chiaro che l’importante era essere i primi, non solo della classe, ma possibilmente della scuola. Anche e soprattutto nello sport, quello di De Coubertin, quello di Jules Rimet, insomma quello del motto “l’importante è partecipare”: il professore di ginnastica se ne fregava del tuo voto in latino se sapevi murare bene e schiacciare ancora meglio. Quando c’era la partita, veniva in classe e “pescava” i due tre che gli servivano, sottraendoli a compiti in classe e interrogazioni senza nessun imbarazzo e con flebili proteste dei professori di latino. Lo so, non siamo negli Stati Uniti, ma insomma succedeva pure qui.

Per fortuna la scuola non è solo un ambiente di formazione formale, ma è anche un grande laboratorio sociale, dove si impara ad avere relazioni con persone della propria età, ma anche più grandi e più piccole. Sostanzialmente a scuola cercavo di stare bene, non di competere, malgrado quello che dicevano e facevano gli insegnanti. Ad ogni ingresso in una nuova scuola faticavo a liberarmi dall’etichetta di “secchione” che mi veniva affibbiata dopo i primi compiti in classe. Questa liberazione coincideva col momento in cui dall’esercizio delle competenze negli ambiti ufficiali (le materie) si passava a quelle sociali (suonare, giocare a calcio, correre in motorino, bere birra), in cui contava più la soddisfazione collettiva che arrivare primi. In questo contesto ho imparato il concetto di “interruzione dell’esercizio della competenza”. Se si giocava a pallone e una delle due squadre vinceva sei a zero, si rifaevano le squadre. Se si andava al mare in motorino, era inutile lasciare indietro quello che aveva più chili e meno cavalli. Se si andava in birreria, si ordinava un giro per tutti finché qualcuno non dava segni evidenti di percezione alterata della realtà, e alla fine si divideva il conto. Probabilmente ho avuto solo la fortuna di passare quella fase della vita in un contesto sociale borghese e poco competitivo.

Allora colpa della famiglia? Sì e no. A casa mia era importante fare le cose bene, in assoluto, per le cose stesse, non per farle meglio degli altri. Non mi hanno mai incitato a competere ma a cercare la qualità. Nessun premio per i voti di fine anno o per le interrogazioni andate bene. Semplicemente perché non era concepibile prendere un brutto voto: avevo le risorse, il tempo, le capacità e le richieste erano quelle di una scuola pubblica standard. Perché mai avrei dovuto “andare male”? Poi c’era dietro la storia personale di mio padre, nato in un secolo contadino, da cui era uscito grazie alla scuola. Un diritto che si era dovuto conquistare facendo ogni giorno chilometri a piedi e studiando al lume di candela. Il tipo di storie da libro Cuore, insomma. Prendere un brutto voto sarebbe stata veramente un tradimento nei suoi confronti, soprattutto visto che nella vita lui aveva fatto proprio l’insegnante.

Colpa del lavoro? Altro caso particolare: avrei voluto lavorare in maniera stabile all’università, dove probabilmente la competizione l’avrei incrociata ad ogni passo. A posteriori, dopo tante “esplorazioni” in facoltà e università differenti, a volte come docente e a volte come ricercatore, devo riconoscere che evidentemente non avevo le competenze giuste. Invece ho passato quasi trent’anni in una società (quindi nel mondo degli affari, dell’impresa, del guadagno… il male assoluto) in cui non esisteva la possibilità di promozioni e in cui le decisioni si prendevano insieme; talmente piccola che per completare un progetto erano sempre necessarie le competenze di tutti. Continuo ad essere una persona competitiva, ma ho avuto la fortuna di non dover sfruttare la competizione per sopravvivere.

In sostanza, oggi direi che anche senza una volontà precisa di qualcuno è stata semplicemente la società in cui ho vissuto questi primi sessant’anni che mi ha modellato come un essere competitivo. Il momento storico, la collocazione geografica, il profilo culturale ed economico della mia famiglia. Cose su cui non avevo controllo e di cui non ero consapevole.

Questa stessa società, però, mi ha lasciato la possibilità di sviluppare degli anticorpi. Anticorpi che in buona sostanza mi hanno permesso di interrompere l’esercizio di una competenza nel momento in cui questa non era più necessaria.

Col tempo ho anche imparato che le competenze si perdono, sfumano, invecchiano. Insomma le competenze che ho appreso formalmente non hanno più tutta questa importanza, almeno in questa fase della vita. Come è normale che sia, adesso me ne interessano altre.

A me è andata tutto sommato bene; ma ai ragazzi di oggi? Cosa gli proponiamo? Quali competenze devono imparare? Qual è lo schema di fondo a cui si devono adattare?

Oggi mi pare che di competenze si parli davvero tanto, soprattutto nei discorsi di politica educativa, se possibile in connessione con “innovazione” e “futuro”.

Anche quando il modello di società (e scuola) competitiva viene formalmente rifiutato, quasi tutti sostengono l’importanza dell’acquisizione delle competenze innovative fondamentali per il futuro. La competenza non viene mai messa in discussione, a nessuna età: dalla scuola dell’infanzia all’università, fino alla formazione degli adulti e degli anziani. Da quando nasciamo a quando moriamo abbiamo davanti un imperativo categorico: “tu acquisirai competenze!”. Più dure, più morbide, STEM o sociali, ma insomma bisogna mettersi a tavola e mangiare, avidamente, come diceva Steve Jobs, per diventare qualcuno.

Ma siamo sicuri che tutto questo parlare di competenze non sia un errore madornale che produce solo competizione selvaggia?

Non sarà che organizzare tutta la formazione e (peggio) tutti i contesti di apprendimento formale come macchine che spingono tutte e tutti a primeggiare, a competere, ad avere più competenze e in un grado ancora maggiore si rivelerà prima o poi una svista a livello mondiale?

Non sarà che tutto questo ripetere il mantra delle competenze che salvano i giovani finirà per generare solo una guerra dei poveri – una guerra che si combatte sulle competenze, cioè sulle risorse cognitive invece che sulle risorse fisiche?

Attenzione: non voglio difendere le conoscenze contro le abilità, il teorico contro il pratico. Si può essere competenti a leggere poesie. Ma il punto è: dobbiamo formare Mario ad essere competente a leggere poesie meglio di Anna? Dobbiamo dire alla mamma di Mario che se riempie il suo zaino di competenze più di Anna, da grande sarà ricco e felice? Dobbiamo mettere davanti a Mario e Anna un orizzonte fatto di scuole, certificati, quadri, diplomi?

Evidentemente questo tipo di competizione è utile a qualcuno (chi? beh, chi tiene il banco, come sempre); ma è utile a chi compete, sia che vinca sia che perda? Forse alla fine no, o per lo meno non così tanto come si vorrebbe. I danni che questa guerra silenziona provoca sono piuttosto visibili, dagli abbandoni ai suicidi, passando per un meno eclatante totale disamore per ogni forma di apprendimento formale.

Dulcis in fundo: ha senso puntare oggi ad una classifica di persone in aree di competenza che domani saranno completamente dimenticate, magari perché coperte perfettamente da software più competenti di noi?

Credo di no.

D’altra parte, mi rendo conto che per il momento non si può smettere di insegnare, ovvero non si può smettere di facilitare l’apprendimento lasciando che ogni nuovo piccolo umano se la cavi da solo, perché non sopravviveremmo come specie. Per il momento, in attesa dei robot tuttofare, come comunità umane abbiamo bisogna di persone capaci di svolgere certe attività bene; e siccome la nostra vita è troppo complessa, non possiamo immaginare che tutti siano in grado di far tutto ed essere così autosufficienti. Quindi non possiamo rinunciare alle competenze. Ma forse possiamo limitare questo modello ultra-competitivo che ne costituisce lo sfondo.

Come?

Vedo due possibili soluzioni.

La prima è legata alla maniera in cui si definisce “competenza”.

Competenza non significa solo sapere quali risorse vanno impiegate in un certo contesto e quando vanno impiegate, ma anche per quanto, fino a quando. Dentro la definizione di una competenza dovrebbe esserci il suo limite applicativo. Non si dovrebbe dimenticare di dotare ogni competenza delle sue condizioni di applicabilità, che comprendono quelle di interruzione. Ad esempio: quando si gioca a pallone, se si superano i cinque goal di scarto si interrompe la partita. Dico che andrebbe definita (e non semplicemente scoperta) perché così entrerebbe a far parte dei processi di apprendimento e insegnamento della competenza stessa, fin dall’inizio. Si dovrebbe insegnare che nessuna competenza è assolutamente positiva per sé stessa e nessuna competenza può essere esercitata all’infinito. Rovesciando quello che diceva Kant: le competenze devono essere mezzi, non fini.

La seconda soluzione è legata ad una possibile distinzione fra competenze.

Vorrei provare a distinguere tra competenze competitive e competenze non competitive.

Le prime sono quelle che troviamo in ogni discorso: come fine della formazione, come risultato dell’apprendimento, come premessa di una performance. Come richieste dalla società, dal Paese, dal continente. Certo, da questa società, da questo Paese e da questo continente. Quando si dice che “l’Europa deve diventare l’economia basata sulla conoscenza più competitiva del pianeta” si sta appunto parlando di competenza competitiva. Non è importante di cosa è fatta esattamente questa competenza, ma solo che se ne abbia più degli altri. Competenza come moneta.

Le seconde sono quelle che non si definiscono in rapporto a quelle degli altri. Sono quelle che producono la soddisfazione di saper fare bene una cosa, non quella di farla meglio di qualcun altro. Sono competente quando riesco a fare esattamente quello che voglio, a completare il disegno, a far star su la costruzione, a cadere in terra con elasticità per poi rialzarmi senza traumi. C’è un aspetto temporale: immaginare e poi aver conferma. C’è un aspetto valoriale: il mondo dopo l’esercizio della competenza è un po’ meno confuso.

Per esempio, improvvisare.

E’ una competenza un po’ particolare, lo riconosco: non è tra le prime che verrebbero in mente. Intanto è tra quelle meno insegnabili. Certo esistono metodi, lezioni, regole, trucchi: ma sono del tutto empirici. Basta riflettere un po’ per riconoscere che la capacità di generare musica sempre nuova a partire da uno schema noto è difficilmente riconducibile ad uno schema. Verrebbe da dire che improvvisare è uscire dagli schemi, e che uno schema per uscire dagli schemi sembra un po’ paradossale.

Ma forse improvvisare non è una competenza così particolare. Se si potessero combinare in maniera meccanica il riconoscimento delle caratteristiche di una situazione con la capacità di eseguire azioni non ci sarebbe bisogno degli umani, e nemmeno dell’intelligenza artificiale, per esibire comportamenti competenti. Ogni competenza richiede improvvisazione, se non altro nello scegliere la risorsa più adatta e cambiare rapidamente strada quando quella si rivela inadatta. Nel caso dell’improvvisazione, ci sono tutti gli elementi canonici: le risorse, le abilità, il riconoscimento della situazione e l’applicazione della soluzione migliore. Tutto questo accade velocemente, con un continuo cambiamento di strada, con l’impossibilità di fermarsi per correggersi. Incidentalmente, o forse no, il risultato percepibile produce piacere nel pubblico.

Per me, però, improvvisare è un ottimo esempio di quel particolare tipo di competenza “non competitiva” perché lo faccio ma in maniera assolutamente privata. Se improvviso al piano (digitale) lo faccio con le cuffie, oppure aspetto che non ci sia nessuno in casa. Non sono troppo interessato a sapere se improvviso bene o male, meglio di Keith Jarrett o di Bill Evans. Tuttavia, in quei rari momenti, sperimento la soddisfazione di “fare esattamente quello che voglio”, con le dita che vanno dove dovrebbero andare per risolvere la situazione sospesa creata un attimo prima.

Forse si potrebbe provare a distinguere due versioni della stessa competenza, un po’ come le molecole destrogire e levogire hanno gli stessi atomi, gli stessi legami, eppure si comportano in maniera diversa. Suonare il piano per sé stessi e suonare per un pubblico. Ma non è solo una questione di grado, anzi. La competenza di scrivere software nel linguaggio di programmazione Scala può essere qualcosa che mi permette di realizzare i programmi che mi interessano; oppure ciò che mi permette di ottenere un lavoro al posto di un altro programmatore che Scala lo conosce meno bene. Non è detto che la seconda sia superiore alla prima (superiore, poi, in che senso?).

Sono la stessa cosa? No. Non si ottengono allo stesso modo e non si mantengono allo stesso modo. Nel primo caso, sono un appassionato, ho scoperto Scala per caso e l’ho trovato geniale; mi sono comprato del libri e seguo i tutorial. Per gioco ho scritto un’applicazione che mi gestisce la lista della spesa. Sto valutando se partecipare al prossimo evento internazionale che si terrà a Londra.

Nel secondo caso non mi importa di Scala in sé stesso, di chi l’ha inventato (il signor Odersky), quando e perché, non mi importa che sia bello o brutto, ma solo che chi mi fa il colloquio si convinca che io faccio al caso suo. Se si sbaglia, perché ho imbrogliato sul test, è un problema suo. (Detto tra parentesi, perché ci porterebbe lontano, un’intera cultura della valutazione è basata su questo modello).

Una volta assunto, “Ciao ciao Scala, per i dubbi c’è Stack Overflow“.

Naturalmente sarebbe fortemente auspicabile che il dentista che mi cura fosse competente nel primo senso (assoluto) e non solo nel secondo (relativo). E’ il caso degli “artisti”, che malgrado il fatto che facciano un lavoro come gli altri, che vendano il loro tempo o i loro prodotti, sembrano differenziarsi dagli altri proprio perché l’esercizio delle loro competenze gli procura piacere in qualche misura indipendente dal risultato. Purtroppo non è così che viene insegnata l’arte da noi: il violino a cinque anni per essere il prossimo Mozart, non per imparare a trovare un angolo di paradiso in terra, quando serve, fino a che le dita reggono.

Eppure non è detto che sia vero l’inverso, cioè che chi si è dimostrato relativamente più competente di qualcun altro sia anche competente in assoluto. Lo sappiamo e ne ascriviamo la responsabilità ai concorsi truccati, alle raccomandazioni, alle mazzette; senza mai mettere in discussione il modello che sta sullo sfondo.

Almeno nella progettazione della formazione si potrebbero fare questi due passi.

  1. Chiarire di che tipo di competenza si sta parlando, se è per lo sviluppo della propria persona o per guadagnarsi la vita arrivando prima degli altri. Magari non è necessario insegnare il “coding” alla scuola primaria per allevare generazioni di futuri programmatori, ma si può invece farlo perché costruire un mondo e vederlo evolvere è uno dei piaceri più grandi che un essere umano possa provare.
  2. Definire i limiti delle competenze che si insegnano, cioè insegnare ad evitare di esercitare le competenze semplicemente perché si può farlo, cioè come puro esercizio di potere. Non è questione di buonismo, non si tratta solo delle competenze soft: qualunque competenza, esercitata all’infinito, distrugge invece di creare. Perché il mondo in cui la applichiamo non è infinito, è strutturato in relazioni che hanno dei limiti e che possono rompersi se insistiamo troppo nella stessa direzione. Perché ogni esercizio di competenza che non si limiti ha come effetto collaterale proprio l’elevarsi del livello di competizione di cui sopra.

Parlavo sopra del piacere di riuscire a fare qualcosa. E’ naturale, cioè lo provano tutti? Forse.

Va almeno coltivato? E’ probabile. Come? Con l’esempio.

Quando un esperto mostra il piacere che prova nel riuscire di solito ottiene per induzione un effetto di attrazione sull’apprendista. Un insegnante potrebbe senz’altro mostrare come traduce, come recupera un’informazione storica o come risolve un problema di programmazione, e mostrare tutta la soddisfazione che prova nel riuscirci. Non per esibirsi e mostrare che è più bravo degli studenti (bella forza!), ma per dimostrare che quando si arriva in cima alla montagna ci si siede e si è contenti, anche se si è arrivati ultimi.

Se questo piacere non viene nemmeno mai esibito (magari perché il sedicente esperto non si cimenta mai con la risoluzione di un problema davanti agli apprendisti) ma ci si limita a pretendere uno sforzo per raggiungere un risultato, sancito da un voto, allora la competenza che si raggiunge è solo quella relativa e mai quella assoluta.

Io però continuo a sperare che al mio dentista piaccia il lavoro che fa.

La Babele delle API

No, non faccio il filosofo di mestiere. Però ho studiato filosofia a tre riprese.
La prima a scuola, per tre anni, in maniera sistematica e lineare. Purtroppo di quello studio non mi è rimasto molto, forse perché l’unico tentativo del professore (avvocato di mestiere) di coinvolgere la nostra classe è stato il primo giorno del primo anno ed è fallito miseramente (“Un uomo vale per me diecimila se è il migliore”: noi, classe autarchica e extraparlamentare, immediatamente bocciammo Eraclito).
Da quel momento si limitò a fare lezione in maniera tradizionale, ovvero recitando un discorso che sembrava lui stesso aver imparato a memoria e chiedendoci di fare lo stesso alle interrogazioni, senza leggere altro che i suoi appunti, senza approfondire, senza discutere.

La seconda all’università, per quattro anni, in maniera randomica. Ma non era colpa mia: non mi orientavo facilmente tra le “storie della filosofia X” e le “filosofia Y”. Anche perché mentre X era tutto sommato una categoria omogenea, temporale, Y invece poteva essere un settore, un ambito culturale, una facoltà cognitiva. Dopo un po’ ho capito che mi interessava di più una terza categoria: la “filosofia di Z”, cioè le filosofie applicate, per così dire: la filosofia del linguaggio (ho studiato alla Sapienza di Roma in un periodo dove “filosofia del linguaggio” significava De Mauro) e soprattutto la filosofia della scienza. C’era una scienza, con un suo percorso storico, e si poteva analizzare in termini di concetti impliciti, di pretese, di fallacie nascoste.
Il periodo più fruttuoso è però il terzo, che è durato trent’anni, ed è quello in cui ho cercato di applicare quello che avevo studiato al mio campo professionale, cioè l’informatica. Ho cercato di ripensare concetti come interfaccia, oggetto, dialogo, apprendimento sulla base delle esperienze che man mano facevo. Ho preso appunti, ho scritto qualcosa qua e là, senza pretese e più per me che per gli altri.


Mi pare che oggi – con una maggiore attenzione mediatica, positiva e negativa, sulla filosofia, e una sempre maggior inconsapevolezza nell’uso degli strumenti informatici – sarebbe utile provare a raccogliere questi tentativi in una forma più strutturata. Non per chiudere il discorso, ma per iniziare una conversazione a più voci con chi ne avrà voglia.

La forma che dovrebbero avere questi saggi di filosofia del digitale non può essere, per quanto mi riguarda, quella apodittica: il digitale è qui, il digitale è là. Non solo perché “digitale” non è un concetto monolitico, e anzi parlarne in termini di oggetto unico è parte del problema. Non è un soggetto metafisico dotato di identità e di volontà proprie, come sembra a volte di capire. Non più di quanto non siano soggetti metafisici gli “algoritmi“: i quali, incolpevoli capri espiatori, sono pensati da persone e realizzati in programmi scritti per uno scopo preciso.
Il digitale non è e non fa: ci sono strumenti e oggetti digitali, progettati e realizzati da persone, che però condividono alcune caratteristiche fondamentali, talmente fondamentali che se non si parte da lì non si capisce come funzionano. Solo che il discorso su questi oggetti non può essere esclusivamente tecnico, perché va a toccare la maniera con cui pensiamo le cose con cui abbiamo a che fare tutti i giorni.
Ma nemmeno, credo io, si può parlare del digitale solo in una prospettiva di “teoria dei media digitali”, partendo solo dagli usi che se ne fanno, come se fossimo etnologi alle prese con popolazioni selvagge (i “nativi” digitali) o esobiologi davanti alla fauna di un pianeta lontano (la “rete”). Non che non sia importante studiare anche questi aspetti, che ci riguardano da vicino, ma non si può partire da lì e ignorare quello che c’è sotto, le caratteristiche intrinseche che facilitano certe relazioni e ne impediscono altre. Queste caratteristiche non determinano le relazioni più di quanto la macchina a vapore abbia determinato la relazione tra operaio e proprietario della fabbrica; ma ignorarle significa fare un atto di fede sulla naturalità delle “digisfera” (non esiste? beh, l’ho inventata proprio ora).

Perché fare questi ragionamenti ad alta voce, insomma pubblicarli? E’ una forma di terapia. Certe difficoltà che incontriamo, certe ansie, certe paure dipendono in fondo dal fatto che di questi oggetti digitali sappiamo poco, capiamo poco, e anche se siamo costretti ad usarli lo facciamo come se fossero i vecchi, rassicuranti oggetti analogici. Ma non lo sono. Per rassicurarci, tendiamo a immaginare il futuro davanti a noi estendendo il presente, stirandolo, prolungandolo, con un’operazione analogica, appunto. Invece ci sono già delle cesure enormi tra come era e come è e sarà. Ci sono dei salti nei modelli economici, delle trasformazioni radicali nelle relazioni tra persone.
Una analisi filosofica degli artefatti digitali ci potrebbe aiutare a capire queste trasformazioni, potrebbe insegnarci a trattare con quelle paure, se non proprio a superarle.

E’ anche possibile che questi ragionamenti possano portare qualche novità proprio nel cuore della filosofia. In fondo la filosofia ha costruito i suoi concetti a partire dagli oggetti analogici, costruiti attraverso i nostri cinque sensi, e utilizzando il linguaggio naturale come unico collante. Il fatto che esista una nuova “specie” di oggetti che sono costituiti solo da informazione e che esistano linguaggi artificiali con cui questi oggetti possono essere creati e manipolati potrebbe insegnare qualcosa anche ai filosofi.

Filosofico non deve significare difficile, contorto, pieno di rimandi ad autori classici e meno classici in nota. Non deve nemmeno significare astratto, generale, che si arresta alle grandi domande: è un modo dell’indagine e del discorso, quello che sale e riscende, come indicano i pupazzetti di Platone e Aristotele nella Scuola di Atene di Raffaello.
E’ anche il modo che mi si addice di più: quella artigianale. Una filosofia che nasce dalla prassi, diventa teoria e poi cerca una validazione di nuovo nell’esperienza.

La forma potrebbe essere quella di una serie di racconti che partono ogni volta da un’esperienza pratica e su questa provano a esercitare un’analisi, a estrarre dei concetti generali, fino a vederne altri effetti, anche e soprattutto attraversando i confini disciplinari.
Quello che segue è un esempio.


In questi ultimi sei mesi sto lavorando nel tempo libero (rileggete: sto lavorando nel tempo libero) ad un’applicazione web che permette di consultare dei contenuti strutturati in capitoli e pagine (per la precisione: stanze e pannelli, visto che si tratta di una Mostra online). Ho scritto i codici sorgenti dell’applicazione web, ma anche i testi, per via del fatto che per dimostrare la validità di un’idea ho capito che occorre mostrarne almeno una prima realizzazione. Siccome penso che le cose che ho scritto potrebbero interessare anche persone che non parlano italiano, ho pensato di tradurre 135 pagine HTML dall’italiano al francese, all’inglese e allo spagnolo. Le pagine HTML non hanno una grande formattazione (grassetti, corsivi, dimensioni dei titolo) ma hanno delle tag interne (come <wikipedia> o <data-time>) che servono a fare in modo che l’applicazione possa estrarre informazioni per indicizzare le pagine, oppure a permettere l’espansione automatica di una parola in un link ad una pagina di Wikipedia o ad un video su Yotube.

Le pagine in media sono piccole, tra le 500 e le 1000 parole. Non possedendo io le competenze linguistiche necessarie, né potendo sfruttare quelle familiari, mi sono rivolto alle agenzie di traduttori. Un costo standard per una traduzione non tecnica di una pagina di queste dimensioni dall’italiano alle principali lingue europee mi pare essere tra 10 € e i 40 €. Sale anche a 150-200 € se si richiede una revisione di qualità. Non è tanto, anzi a me pare molto poco. Significa che il traduttore è pagato una miseria, e avendo assistito mia moglie nella traduzione di uno scenario di film posso dire che è un lavoro bellissimo ma ingrato e infinito.

135 pagine x 20 € x 3 lingue però fa oltre 8000 €, che sono molto, molto al di là di quello che mi posso permettere, perché il progetto non è finanziato da nessuno. Rinuncio? Faccio tradurre solo un piccolo sottoinsieme delle pagine? Chiedo aiuto a volontari con un crowdtranslating? .

C’è una alternativa che senz’altro conoscete tutti: i traduttori automatici su web. Ho una precedente esperienza sia con Bing che con Google, che ho provato per tradurre delle etichette e dei messaggi di un’altra applicazione web. Siccome in quel caso evidentemente il contesto linguistico di ogni elemento era limitato (un grosso file in cui ogni riga si poteva riferire ad argomenti diversi), il sistema di traduzione di entrambi prendeva cantonate notevoli. Qui forse le cose andrebbero meglio perché ogni pagina parla di un determinato argomento, e poi è passato del tempo.

Mi consiglia un amico di lasciar perdere Google e Bing provare DeepL, che è un servizio di una società tedesca. DeepL è basato su reti neurali convolutive, che naturalmente tutti noi conosciamo e mangiamo a colazione. Il nome fa riferimento al deep learning, che è un tipo di machine learning, quella parte dell’intelligenza artificiale in cui si cerca di riconoscere strutture non sulla base di definizioni formali, ma sulla base di somiglianze. In sostanza, grandi moli di testi vengono raccolte e utilizzate per costruire e addestrare modelli di traduzione. La storia di DeepL è abbastanza tipica per il settore: inizia nel 2007 come Linguee, una società tedesca fondata da un ex-dipendente di Google che raccoglie milioni di testi in giro per il web (anche quelli del Parlamento Europeo, che sono multilingue e ben tradotti) e offre un servizio di concordanze online. Dieci anni dopo, sulla base dell’enorme materiale raccolto e di una rete neurale, la società cambia nome e lancia il primo servizio free di traduzione con sette lingue, per un totale di 42 coppie.

Esporto quindi tutte le mie pagine in un unico file PDF e lo carico. E’ troppo grosso, la traduzione automatica non arriva in porto. Ma anche se avesse funzionato, avrei avuto due problemi : dividere di nuovo il file in 135 file HTML e salvarli nel posto giusto col nome giusto; soprattutto avrei dovuto ripristinare a mano tutte le tag eliminate nella conversione in PDF. Non praticabile.

A questo punto mi viene in mente – perché sono un po’ tardo e lento come i passi di Petrarca – che sto trattando il problema in maniera “analogica”. Sto pensando il testo in termini di libro. Per tradurre un libro si prende il testo, lo si manda ad un traduttore; poi comincia un ciclo di revisioni; poi si prende la traduzione finale e la si impagina. Alla fine si distribuisce il libro tradotto nei mercati esteri. E’ un processo sequenziale con un “loop”, un ciclo di ripetizioni interno, per la parte di revisione. Ma è lineare e ogni parte presuppone quella precedente: non si può distribuire il libro se non è stato tradotto, e non si può tradurre se non è stato scritto.

Ma la mia è un’applicazione web, che non ha un momento finale: sarà sempre in pubblicazione. Non deve essere fissata in un certo momento per poi essere inviata ai distributori e poi alle librerie. Non serve a niente tradurre tutto: basta tradurre quello che le persone vogliono visualizzare. E non serve a niente tradurlo prima: basta tradurlo un attimo prima di quando qualcuno vuole visualizzare una pagina. E infine: potrebbe essere necessario tradurre nuove pagine man mano che si aggiungono, o ritradurre alcune pagine che sono state modificate.

Quindi cerco meglio e scopro che DeepL (come probabilmente ogni altro servizio del genere) offre delle API, cioè degli indirizzi HTTP a cui si possono inviare testi da tradurre e che restituiscono la traduzione immediatamente, senza bisogno di intervento umano. Inoltre si può specificare che non si desidera tradurre un romanzo, ma una pagina HTML, escludendo dalla traduzione certe particolari tag (che è proprio quello che mi serve).

Inserisco perciò nel codice sorgente dell’applicazione un test: se l’utente ha scelto l’inglese (o il francese, o lo spagnolo), e il file HTML corrispondente non esiste, viene inviata la pagina italiana e ne viene chiesta la traduzione alle API di DeepL. Tempo due secondi, arriva la pagina tradotta, viene mostrata al visitatore e salvata. L’utente non si accorge quasi di nulla. Al prossimo accesso, quella pagina esiste e il risultato è immediato. Insomma, non sono io che mi occupo della traduzione, ma l’applicazione stessa che risponde alle esigenze dell’utente in maniera automatica, esattamente come gli restituisce i risultati di una ricerca. Contemporaneamente, l’applicazione confronta la data della versione originale (in italiano) e quella della versione tradotta: se la prima è più recente della seconda, richiede una nuova traduzione.

Adesso provo a dire in termini più generali perché un documento digitale non è un libro.

L’uso del servizio online ha trasformato un processo sequenziale in un processo “just in time”, spezzandolo non in funzione della struttura o dell’organizzazione della produzione, ma in funzione del suo utilizzo. Non mi devo procurare una bicicletta in previsione di quando smetterà di piovere e avrò voglia di fare una passeggiata, ma mi trovo una sella sotto il sedere quel giorno lì, appena uscito di casa, e mentre comincio a pedalare appaiono le ruote. Magie digitali? No, è solo che i servizi che chiamiamo “immateriali” (ma che non lo sono, visto che richiedono sempre hardware per essere fruiti) non hanno bisogno di mimare completamente quelli analogici. Se lo fanno, è solo in un momento iniziale, per non confonderci le idee. Bolter e Grusin parlavano di “remediation” per indicare questa capacità di un medium di citare e riassorbirne un altro: beh, di sicuro i servizi digitali rimediano quelli analogici e inizialmente passano inosservati, come ho scritto anche qui. Ma sotto sotto funzionano diversamente.

Il motivo generale per cui è possibile questo andamento dinamico è la caratteristica fluidità degli oggetti digitali. Mentre le pagine di un libro (meglio, di una certa edizione di un libro) sono fisse, hanno una dimensione, un numero di righe, di parole e di lettere, un colore, un carattere e una dimensione, le pagine di un e-book no. La pagina dell’ebook si crea quando viene visualizzata, in funzione di tre livelli di impostazioni: quella iniziale, voluta dall’editore (un certo carattere, per esempio Arial, una certa dimensione delle lettere); quella del dispositivo (una certa dimensione dello schermo, una certa risoluzione in termini di punti per centimetro quadrato); quella decisa dal lettore umano (un carattere diverso, una dimensioni più grande, un’interlinea maggiore). L’ultima vince sulla seconda che vince sulla prima. Da questa trattativa risulta una disposizione del flusso di lettere particolare, probabilmente unica, modificabile in ogni momento. E’ per questo che dire “pagina 3” di un ebook non significa niente, perché cosa viene mostrato dipende dalle impostazioni, dalle scelte, dalle possibilità previste. Uno dei miei primi tentativi di creare un software “educativo” è stato Scribo. Era un software per la videoscrittura semplificato che avevo scritto col linguaggio Pascal. La cosa su cui ho perso più tempo è stata proprio la continua ritrasformazione del flusso lineare del testo in una matrice righe x colonne. Lì ho capito che “pagina numero 3” non significa nulla, mentre “lettera numero 240” invece sì. Ho capito anche quanto la pagina (e lo schermo, che la mima) fosse un’unità completamente arbitraria. La stessa cosa vale ovviamente per le immagini e i suoni, ma per adesso lasciamo questo discorso.

C’è un altro senso per cui un testo digitale non è un libro: perché in fondo non ha un’esistenza propria, se non nel momento in cui qualcuno la vuole ritrovare, consultare, stampare. Non ha senso dire che un testo digitale “sta” da qualche parte, come un libro in una biblioteca o in un archivio che c’è anche quando la biblioteca è chiusa, quando nessuno lo cerca. Un testo digitale è “file” cioè una sequenza di bytes immersa in una sequenza più grande (una tamburo magnetico, un nastro, un disco: non è importante). Quel file però non esiste se non perché è indicizzato, inizia qui e finisce lì; altrimenti è solo una massa informe di bytes indistinguibili da quello che c’è prima e quello che c’è dopo. Questa è una delle caratteristiche primarie degli oggetti digitali: non sono oggetti, ma sono finestre, viste, inquadrature applicate su una sequenza di simboli. L’accesso ai file di un disco è realizzato tramite un indice, che in certi vecchi sistemi operativi si chiamava FAT (File Allocation Table: tabella di posizionamento dei file). Se la FAT si rovinava, era impossibile recuperare i file e il disco era praticamente inutile (per questo ce n’erano due). Certo le sequenze sono diverse, e hanno delle caratteristiche intrinseche che le individuano, cioè l’ordine in cui sono disposti i bytes. Questo ordine è ciò che permette ad un programma antivirus di andare a caccia della “firma” caratteristica di un virus anche senza sapere dov’è.

Una seconda caratteristica importante di un documento digitale, che lo differenzia da un libro, è che la forma con cui lo vediamo o lo pensiamo dipende sempre da qualche operazione che ci facciamo sopra: lo vogliamo tradurre in punti neri su uno schermo bianco o sulla carta, o lo vogliamo tradurre, o analizzare per contare le occorrenze di certe parole. Il documento non esiste in sé e per sé, ma in funzione di quello che ci si fa. Volendo si potrebbe forzare il discorso fino a dire che ogni documento digitale è un programma, nel senso che è una descrizione di azioni possibili, più che di proprietà. Come se ogni documento fosse una ricetta o uno spartito. Ma in realtà di solito ci limitiamo a pensare a certi file come composti da dati, inerti, passivi, e certi altri come programmi, solerti, attivi. E’ una scelta nostra, di convenienza, che però non ha un vero fondamento. Anche i programmi sono dati, e si possono leggere, scrivere, trasformare, tradurre, disegnare, suonare, oltre che eseguire.

E’ per questo che per il servizio di DeepL tradurre un testo in HTML non è un problema: quello che traduce non è il testo che leggiamo noi umani che traduce – un testo che ha un significato per noi perché fatto di parole e segni di interpunzione – ma il documento digitale corrispondente, che strutturato come un albero di tag. Su quest’albero vengono effettuate delle operazioni di ricerca, estrazione, messa fra parentesi. Lo fa DeepL per tradurlo, ma lo fa un browser qualsiasi come Firefox o Edge per mostrarmelo, lo fa un motore di ricerca per indicizzarlo. Per essere ancora più precisi, noi non vediamo mai la cosa digitale, nemmeno quando spiamo il codice sorgente di una pagina web, ma vediamo il risultato di qualche operazione su di essa.

Se ogni volta che abbiamo a che fare con un documento digitale in realtà interagiamo con un programma che lo trasforma, allora dovrebbe essere chiaro è sempre con agenti digitali che abbiamo a che fare. Quando parliamo del web come di una “Internet dei Documenti” tra cui saltabecchiamo in funzioni dei nostri interessi del momento, seguendo link o risultati di ricerca, dovremmo piuttosto parlare di una “Internet degli Agenti”: programmi che parlano tra loro, quando e se lo ritengono opportuno. Un dialogo invisibile agli umani, che continuano ad essere convinti di “navigare la rete”, come se fosse la superficie di un mare, magari sconosciuto, ma naturale. Non è un mare, è una conversazione, un bisbiglio continuo di cui non capiamo nulla ma ogni tanto percepiamo delle increspature e riconosciamo parole. Sono agenti che non hanno bisogno di essere tutti intelligenti, ma solo di essere stati programmati con un compito, lanciati e messi in comunicazione tramite qualche protocollo. Di protocolli ce ne sono tanti, antichi, nuovi, superati, contraddittori: eccola, la vera Babele.

Più ottimisticamente, quando Pierre Lévy (studioso della metafisica araba medievale) parlava di intelligenza connettiva utilizzava un concetto filosofico (l’intelletto agente di Averroè, che non è personale) per descrivere con una metafora questo dialogo che non è fra intelligenze, ma è una forma di intelligenza. Non: l’intelligenza artificiale è all’origine del dialogo, ma: l’intelligenza artificiale è la forma che assume per noi questo dialogo. Quando si parla di aspetti etici dell’intelligenza artificiale occorrerebbe pensare in questi termini: non entità superiori, ma agenti computazionali limitati. Come fa da tempo Salvatore Iaconesi.

Questo dialogo ci è utile, anzi non sapremmo più farne a meno (pur non accorgendocene). Ma ha anche degli effetti più sgradevoli per alcuni di noi: il servizio di traduzione just in time rende il traduttore umano un po’ meno utile se non addirittura inutile. Certo è ancora utile per chi ha bisogno di una vera traduzione letteraria, artistica, legale. Ma per le piccole aziende che vogliono provare a esplorare i mercati mondiali, per le associazioni no profit che si occupano di intercultura e migranti, per gli studenti di ogni disciplina, per chi come me ha bisogno di comunicare al di fuori del suo piccolo angolo di mondo: per tutti noi i traduttori umani diventano un’opzione perfettamente rinunciabile. Per noi la qualità della traduzione di DeepL è più che accettabile. Ma non lo dico io: qui potete leggere uno studio che confronta i risultati della traduzione dall’italiano al tedesco in ambito giuridico, tecnico e promozionale di DeepL con altri sistemi. E non può che migliorare: DeepL, come molti altri, mette i suoi servizi a disposizione non solo del pubblico generico, ma anche dei traduttori umani. Perché? perché più viene usato, più aumentano le dimensioni dei dati su cui viene fatto il training dei modelli di machine learning, più migliora la qualità. Non è lontano il giorno in cui la qualità di una traduzione automatica sarà indistinguibile da quella umana; o meglio, il giorno in cui la qualità sarà variabile a piacere, in funzione del prezzo che si è disposti a pagare. A quel punto, i traduttori umani potranno cambiare mestiere. Già prima, scompariranno gli istituti di formazione linguistica che già ora cominciano ad avere difficoltà a trovare studenti: a che serve studiare da traduttore se poi questo lavoro sta per scomparire? Ne parlo un po’ più a lungo qui.

Insomma la IoA (la Internet of Agents) non è un fatto naturale o un sottoprodotto che il meraviglioso progresso della scienza ci regala: è il risultato preciso di un modello di società fortemente voluto non solo dai Grandi Cattivi, ma un po’ da tutti: le competenze professionali tradizionali vengono acquisite da sistemi digitali e le persone vengono sostituite da servizi sempre più piccoli, specializzati, mirati al bisogno nel momento in cui viene espresso (o anche prima: dove vuoi andare oggi?).

Ecco che mi trovo in una bella contraddizione: rinuncio alle mie bellissime traduzioni, e mi chiudo in un eremitaggio a-tecnologico, da dove naturalmente la mia voce non esce, oppure chiudo gli occhi e partecipo alla fine di una professione su scala planetaria? E se non faccio nulla, ho qualche garanzia che le cose andranno diversamente?

Ecco anche perché capire come funziona il “digitale” è fondamentale per ri/progettare il futuro. Perché viviamo dentro una contraddizione e dobbiamo imparare ad farci i conti.