Оказывается, решая каптчи на большинстве сайтов, включая все гугловские сервисы, Фэйсбук и мн.др., мы невозбранно помогаем Гуглу и его клиентам распознавать труднораспознаваемые места архивных книг, газет и т.п. Прочитал в сегодняшней New York Times.

Сначала текст распознаётся двумя различными программами OCR. Те слова, распознать которые одна из программ или обе оказались бессильны, помечаются. Затем эти слова представляются миллионам пользователей сети в виде каптчи. Тонкость в том, что в каптче нераспознанное слово комбинируется с другим, распознанным программой уверенно. И проверяется только правильность распознавания пользователем второго слова, а распознавание первого просто записывается, программа отбирает, какой ответ встречается наиболее часто, и передаёт его заказчику.

Полезное знание здесь в том, что, если в каптче вы видите два слова, одно из которых легко можете прочитать, а со вторым затрудняетесь, пишите то слово, которое понимаете, а вместо другого - например, "чебурашка". (с)