Tutti coloro che lasciano commenti sui blog conosco i Chapta, sistemi che permettono di riconoscere se chi interagisce davanti allo schermo è un umano o un bot. Ad esempio, i Chapta sono usati per evitare lo spam (avete presente le immagini con le lettere distorte? Le suo anche io).

Partendo da questo assunto:

About 60 million CAPTCHAs are solved by humans around the world every day. In each case, roughly ten seconds of human time are being spent. Individually, that’s not a lot of time, but in aggregate these little puzzles consume more than 150,000 hours of work each day, il progetto reChapta prevede di utilizzare questo “sforzo umano” in modo utile.

In estrema sintesi, anzichè usare i Chapta classici (una sfilza di lettere senza senso), si userebbero frasi tratte da libri che i sistemi OCR non riescono a riconoscere. I sistemi di riconoscimento della scrittura infatti non sempre sono in grado di riconoscere le frasi in maniera corretta. E allora si possono usare come Chapta: l’occhio umano riconosce la frase e la “traduce” riuscendo dove l’OCR fallisce.

reCAPTCHA improves the process of digitizing books by sending words that cannot be read by computers to the Web in the form of CAPTCHAs for humans to decipher. More specifically, each word that cannot be read correctly by OCR is placed on an image and used as a CAPTCHA. This is possible because most OCR programs alert you when a word cannot be read correctly.

[via]