Recuperare testi antichi con i Captcha

captchaDa sempre si è pensato sia che la tecnologia avrebbe aiutato la letteratura, sia che l'avrebbe potuta distruggere, fornendo strumenti che, in base all'uso che se ne sarebbe fatto nel corso del tempo, avrebbero potuto aiutare la diffusione dei libri, o renderli desueti.

L'argomento è particolarmente d'attualità, e si è trattato spesso parlando di e-book e di altri tipi di rapporti tra letteratura e tecnologia. La notizia che si può leggere oggi sul sito di Repubblica dà ulteriore supporto alla teoria che la tecnologia possa salvare la letteratura.

Su numerosi siti, forum e blog occorre scrivere un codice di lettura umana (impossibile farlo effettuare a una macchina) di alcune lettere volutamente distorte, per evitare o rendere più difficile l'inserimento automatico di messaggi di spam.

Questo sistema si chiama Captcha, ed è oggi ritenuto uno dei sistemi anti-spam più efficaci. Ma secondo alcuni ricercatori della Carnegie Mellon University può anche essere un metodo per ottenere una quantità immane di forza lavoro gratuita per ridigitare informaticamente testi antichi poco chiari o rovinati. Per fare ciò è sufficiente utilizzare le parole dei testi antichi che i computer non riescono a leggere come parole da inserire a cura dell'utente nella verifica CAPTCHA di molti siti.

Con questo metodo, oltre 40.000 siti web sono serviti a far leggere e ridigitare parole di testi antichi non perfettamente chiari a milioni di utenti. A oggi sono state decifrate 440 milioni di parole con un'accuratezza del 99% (ci sono dei sistemi di verifica incrociati sia all'interno dello stesso CAPTCHA che con le risposte di altri utenti).

Se questo sistema si dimostrerà efficace, come finora sembra essere, milioni di libri potranno essere salvati dalla scomparsa e mantenuti "vivi" in forma digitale. Come commenta appropriatamente l'articolo di Repubblica "anche lo spam, in un modo o nell'altro, alla fine può rivelarsi utile".

Fonte: Repubblica

  • shares
  • Mail
5 commenti Aggiorna
Ordina: