elaborando

Lavori socialmente utili


Si potrebbero recuperare quasi 28.000 giornate di lavoro, ogni giorno.Il conto è presto fatto, ma cominciamo dall'inizio, che aiuta sempre.Vi è capitato di registrarvi di recente ad un servizio web? Si? Bene.Allora è probabile che a un certo punto vi siete trovati davanti dei caratteri distorti da ricopiare diligentemente in una casellina.Lo scopo di questa strana procedura è impedire registrazioni non desiderate, effettuate mediante programmi automatici. E poiché questi ultimi non dovrebbero essere capace di riconoscere i caratteri distorti, mentre un essere umano si, il gioco è fatto.La procedura ha un nome: CAPTCHA, un acronimo che sta per: Completely Automatic Public Turing test to tell Computer and Humans Apart, cioè un sistema automatico per distinguere umani e macchine.Quanto ci impiegate a: visualizzare la pagina, capire la richiesta, interpretare i caratteri strani, ricopiarli e premere invio? Diciamo 10 secondi.Si stima che questa operazione sia eseguita nel mondo 60.000.000 di volte al giorno, e che quindi si consumino così 600 milioni di secondi. Divisi per una giornata di sei ore effettive, è il lavoro equivalente di 28.000 persone laboriose. Peccato che il risultato, la decifrazione dei caratteri, sia da buttare via.I ricercatori della Carnegie Mellon University hanno pensato di recuperare alla società questo sforzo.L'applicazione che hanno in mente è la digitalizzazione di vecchi libri, magari rovinati dal tempo. Perché serve un essere umano che legga, decifri e trascriva quelle parole che ingannano anche i più moderni sistemi di digitalizzazione (OCR).L'idea è semplice. Sistemo le parole elettronicamente illeggibili in due mucchi: quello delle parole decifrate da una parte e quelle ancora da decifrare dall'altra.Quando Tizio va sul web per registrarsi ad un servizio, gli propongo una parola dal primo mucchio e una dal secondo. Verifico che la prima sia riconosciuta correttamente (ok, è un essere umano, può iscriversi) e, solo in questo caso, annoto la sua intepretazione della seconda parola.Appena ho raccolto un numero sufficiente di "letture" concordanti della seconda parola, do per decifrata anche questa, e la sposto nel primo mucchio.Sarebbe possibile così, senza costi di lavoro umano, riuscire a portare in formato elettronico libri che altrimenti richiederebbero un paziente lavoro di trascrizione.Gli Internet Archive, ad esempio, ne digitalizza 12.000 al mese, molti vanno completati a mano. Con questo sistema potrebbero accelerare decisamente.Nell'immagine il mio saluto per oggi. Non è un CAPTCHA, è una CACCHIATA.