Chi scrive Wikipedia?

Post originale: Who Writes Wikipedia?, dal blog Raw Thought, 04/09/2006. Traduzione di Elena Corradini.

Ho incontrato per la prima volta Jimbo Wales, il volto di Wikipedia, quando venne a parlare a Stanford. Wales ci raccontò la storia, la tecnologia e la cultura di Wikipedia, ma una delle cose che disse mi restò particolarmente impressa.

«L'idea che molti hanno di Wikipedia è che si tratta di un fenomeno emergente – la saggezza o l'intelligenza della folla, o cose simili – con migliaia e migliaia di singoli utenti, ognuno dei quali aggiunge un pezzetto di contenuto, da cui emerge un lavoro complessivo coerente».

Tuttavia, ci tenne a chiarire, la verità era ben diversa: di fatto le voci di Wikipedia venivano compilate da «una comunità … un gruppo composto da poche centinaia di volontari appassionati … tutta gente che conosco personalmente e che si conosce fra loro». In realtà, «è piuttosto simile a un'organizzazione tradizionale».

Ovviamente esiste una differenza fondamentale. Non solo per il pubblico, che vuole sapere in che modo viene davvero prodotta una cosa straordinaria come Wikipedia, ma anche per lo stesso Wales, interessato a capire come far funzionare al meglio il sito. «Per me quest'aspetto è importante, perché passo tantissimo tempo ad ascoltare quei quattro o cinquecento [volontari] e se... costoro fossero soltanto un gruppo di persone che parlano... forse potrei ignorarli tranquillamente quando butto giù le regole di scrittura», per concentrarmi invece su «quei milioni di persone che inseriscono una riga ciascuno».

Ma allora, davvero Wikipedia viene redatta dalla Banda dei 500? Wales decise di fare una piccola ricerca per verificarlo, prendendo nota di quanti avevano apportato il maggior numero di modifiche sul sito [inglese]. «Mi aspettavo di trovare qualcosa tipo la regola dell'80-20: 80% del lavoro svolto dal 20% degli utenti, solo perché sembra sia una percentuale alquanto frequente. Di fatto però [la proporzione] è molto, ma molto più ridotta: è venuto fuori che oltre il 50% delle modifiche viene fatto da appena il 7% degli utenti... 524 persone. ...E anzi i più attivi, circa il 2%, ossia 1.400 persone, sono responsabili del 73,4% di tutte le modifiche. Il restante 25% delle modifiche, aggiunse «era dovuto a persone che apportano minime revisioni… correggono i dettagli minori di un evento o qualche refuso ... o cose simili».

Stanford non era l'unico posto dove Wales aveva suggerito un'osservazione simile, che è piuttosto parte del discorso standard che propone in tutto il mondo. «È un gruppo di circa mille persone a essere veramente importante», ci disse a Stanford. «C'è questa comunità molto unita che, di fatto, produce la gran parte delle modifiche», spiegò all'Oxford Internet Institute.

«Si tratta di un gruppo composto tra le mille e le duemila persone», confermò al pubblico del GEL 2005. Questi sono i tre interventi a cui ho assistito personalmente, ma Wales ne ha fatti altre centinaia con affermazioni analoghe.

Gli studenti di Stanford apparivano scettici. Wales aveva contato soltanto la quantità di modifiche – il numero di volte che un utente aveva cambiato qualcosa per poi cliccare su “salva”. Sarebbe stato forse diverso se avesse contato la quantità di testo inserita da ciascun utente? Wales disse che lo avrebbe fatto «nella revisione successiva», ma era sicuro che «i miei dati saranno ancor più convincenti», perché non avrebbe conteggiato le modifiche per vandalismo e altri cambiamenti che poi erano stati rimossi.

Wales presenta queste affermazioni come qualcosa di confortante. Non preoccupatevi, dice al mondo, Wikipedia non è così scioccante come si crede. In realtà non differisce granché da qualsiasi altro progetto: un piccolo gruppo di colleghi che lavorano insieme per uno scopo comune. Ma se ci pensiamo bene, però, è la visione delle cose proposta da Wales ad apparire ben più scandalosa: è stato solo un migliaio di persone ad aver compilato gratuitamente la più grande enciclopedia al mondo in quattro anni? Sarà mica vero?

Visto che sono un tipo curioso e scettico, ho deciso di compiere qualche ricerca. Ho preso una voce a caso (“Alan Alda”) per vedere come era stata scritta. Oggi la pagina [inglese] su Alan Alda è abbastanza standard: un paio di foto, diverse sezioni, notizie di contesto e una serie di link. Ma quando venne creata per la prima volta, comprendeva appena due frasi: «Alan Alda è un attore divenuto famoso per aver impersonato Hawkeye Pierce nella serie televisiva MASH. Recentemente interpreta ruoli di uomini sensibili in film drammatici». Quali i passaggi per arrivare da questa prima versione a quella attuale?

Modifica dopo modifica, ne ho visualizzato l'evoluzione. I cambiamenti che ho visto possono essere raggruppare in tre nuclei. Un piccolissimo numero – all'incirca 5 su quasi 400 – erano “atti di vandalismo" di gente confusa o maliziosa che aggiungeva cose che semplicemente non c'entravano nulla, seguite da qualcuno che poi le eliminava. Per la gran parte si trattava di piccole revisioni: persone che sistemavano i caratteri, la formattazione, i link, le categorie, e così via, rendendo la voce un po' più godibile senza però aggiungere granché d'importante. Infine, una quantità di modifiche assai più ridotta rivelava le novità vere e proprie: un paio di frasi o di paragrafi con nuove informazioni aggiunte man mano alla pagina.

Sembra che secondo Wales in gran parte gli utenti facciano le prime due cose (vandalismi o piccole correzioni), mentre sarebbe il gruppo principale dei Wikipediani a stilare il nucleo portante dell'articolo. Ma ho scoperto anche altro. Quasi sempre, quando trovavo una modifica sostanziale, ho potuto verificare che l'autore non era un utente attivo del sito. In genere, questi avevano apportato meno di 50 modifiche (tipicamente circa 10), e di solito su pagine correlate. La maggior parte non aveva neppure pensato ad aprirsi un proprio account.

Per una ricerca più approfondita, decisi di ricorrere a un sistema in rete più potente per scaricarvi una copia degli archivi di Wikipedia. Poi ho compilato un programmino per verificare in dettaglio ogni modifica e calcolarne il contenuto che rimaneva nella versione più recente [dettagli tecnici: ho scaricato una copia del file enwiki-20060717-pages-meta-history.xml.bz2, l'ho scomposto in diverse pagine, ripetendo l'operazione sulle revisioni e applicando ripetutamente a ogni revisione e all'ultima versione il comando Python difflib.SequenceMatcher.find_longest_match. Ho usato quest'ultimo perché get_matching_blocks non gestiva bene i blocchi di informazione riorganizzati. E ho contato soltanto i caratteri che non erano già stati riconosciuti nella versione precedente.]

Invece di contare le modifiche, come aveva fatto Wales, ho contato il numero di lettere che un utente aveva realmente corretto nella versione attuale della pagina.

Contando soltanto le modifiche, risulta che i maggiori contributori all'articolo di Alan Alda (7 dei primi 10) erano utenti più incalliti, (tutti tranne 2) che avevano già apportato migliaia di cambiamenti al sito in generale. Infatti il n.4 aveva prodotto oltre 7.000 modifiche e il n.7 più di 25.000. In altre parole, se si segue il metodo di Wales, i risultati sono quelli di Wales: la maggior parte dei contenuti sembra essere prodotto da pochi utenti assai attivi.

Contando però le singole lettere, il quadro cambia totalmente: pochi tra gli autori (2 dei primi 10) sono utenti registrati e la maggior parte (6 dei primi 10) hanno curato meno di 25 modifiche nell'intero sito. Ovvero, il n.9 ha fatto esattamente una modifica – questa! Con un sistema di calcolo più ragionevole

– cioè nella «nella revisione successiva» a cui si riferiva lo stesso Wales i – risultati vengono completamente ribaltati.

Non ho risorse sufficienti per ampliare questi calcoli sull'intero sito di Wikipedia (che comprende oltre 60 milioni di modifiche!), ma li ho verificati su diversi articoli selezionati casualmente e i risultati sono stati abbastanza simili. Per esempio, la maggior parte della voce relativa alla “Anaconda” è stata inserita da un utente che ha fatto soltanto due modifiche all'articolo (e appena 100 sull'intero sito). Al contrario, la maggior parte delle modifiche sono dovute a un altro utente che non ha inserito nuovi contenuti rispetto alla versione finale (le modifiche erano tutte relative a cancellazioni e spostamenti di parti di testo).

Se mettiamo insieme questi risultati, la questione diventa chiara: un utente esterno fa una modifica aggiungendo una serie di informazioni, poi altri utenti più interni procedono agli ulteriori aggiustamenti ricucendo e riformattando il testo. Inoltre, questi ultimi accumulano migliaia di modifiche facendo cose come cambiare il nome di una categoria in tutto il sito – quel tipo di cose che soltanto gli utenti più fedeli hanno profondamente a cuore. Ne consegue che sembrano costoro a curare la maggior parte delle modifiche. Ma in realtà sono gli utenti esterni a compilare quasi tutti i contenuti.

E pensandoci bene, questo quadro è perfettamente logico. Non è certo facile compilare le voci di un'enciclopedia. Per fare un lavoro che si possa dire decente, bisogna avere un'ottima conoscenza riguardo a una notevole e ampia varietà di discipline. È già difficile riuscire a scrivere così tanto, ma diventa impossibile fare tutte le necessarie ricerche di supporto

D'altra parte, ciascuno di noi impara a conoscere piuttosto bene, per un motivo o per l'altro, qualcosa di poco noto in giro. Così decidiamo di condividerlo, facendo clic sul link “modifica (edit)” e aggiungendo un paio di paragrafi su Wikipedia. Al contempo, un piccolo gruppo di utenti è particolarmente appassionato a Wikipedia, avendo fatto proprie le modalità operative e la sintassi speciale, passando il tempo a sistemare i contributi di tutti gli altri.

Altre enciclopedie operano in modo analogo, pur se su scala minore: un ampio numero di persone scrive articoli su argomenti che conoscono bene, mentre uno staff ristretto li formatta in un contesto unitario. Chiaramente, questo secondo gruppo riveste parecchia importanza – è grazie a loro che le enciclopedie si presentano in maniera coerente – ma è alquanto esagerato sostenere che sono loro a scrivere i contenuti dell'enciclopedia. È logico pensare che i responsabili della Britannica si preoccupino più degli autori che dei revisori delle loro voci.

Lo stesso dicasi per Wikipedia. Anche se tutti i revisori lasciassero il progetto domattina, Wikipedia avrebbe comunque un valore incommensurabile. Per la maggior parte, la gente la usa perché contiene le informazioni che stiamo cercando, non perché ha un aspetto coerente. Sicuramente non sarebbe così ben fatta, ma probabilmente quanti hanno a cuore queste cose (come il sottoscritto) si farebbero avanti per prendere il posto di chi ha abbandonato il progetto. Sono i revisori ad aiutare gli autori, non viceversa.

Tuttavia, Wales ha ragione su un punto. Questo fatto ha implicazioni enormi sulle decisioni operative. Se Wikipedia viene scritta da autori occasionali, allora la sua crescita richiede che l'inserimento di contributi occasionali divenga più semplice e soddisfacente. Anziché cercare di spremere ancor più quanti già passano la vita su Wikipedia, dobbiamo cercare di allargare la base di coloro che contribuiscono almeno ogni tanto.

Sfortunatamente, proprio perché questi ultimi sono degli autori occasionali, le loro opinioni non trovano spazio nell'attuale sistema di Wikipedia. Non vengono coinvolti nei dibattiti sulle politiche operative, non partecipano alle riunioni, non chiacchierano con Jimbo Wales. E così si evita di prendere in considerazione quelle opzioni che potrebbero aiutarli in tal senso, ammesso che vengano proposte.

Lontano dagli occhi, lontano dal cuore: basta poco per pensare che queste persone invisibili non siano particolarmente importanti. Ne deriva la convinzione di Wales che 500 utenti abbiano scritto mezza enciclopedia. Da qui la sua ipotesi che gli autori esterni contribuiscano soprattutto con vandalismi e cose senza senso. E da qui derivano quei commenti che si sentono a volte in giro, cioè che sarebbe positivo rendere più difficile apportare modifiche al sito.

«Non sono un amante del wiki che per caso è finito a lavorare su un'enciclopedia», spiegava Wales al pubblico di Oxford. «Sono un amante delle enciclopedie al quale è capitato di usare un wiki». Allora non sorprende la sua idea di una Wikipedia scritta in modo tradizionale. Purtroppo è un quadro pericoloso. Se Wikipedia continua a focalizzarsi sull'enciclopedia a scapito del wiki, potrebbe finire per non essere né l'uno né l'altra.