D'après ce que je comprends, les captchas sont des textes qui ont été déformés par l'application de filtres, de bruit et d'autres algorithmes mal adaptés. Par conséquent, pour savoir si la capacité de lecture d'une personne est celle d'une personne, vous comparez ce qu'elle a répondu à la réponse connue.
Maintenant, en lisant sur ReCaptcha, il est dit que les mots affichés sont ceux qui ne peuvent pas être traduits par OCR. De plus, recaptcha est utilisé pour traduire ces images. Comment peut-il savoir si vous avez bien raison dans votre lecture ou si vous inventez simplement des trucs?
S'il savait ce qu'il disait, il ne serait pas utilisé dans recaptcha comme matériel de traduction. S'il ne sait pas ce que dit le texte, comment valide-t-il votre réponse?
Je suppose qu'il s'agit probablement d'une analyse basée sur les probabilités avec d'énormes tailles d'échantillon avant de signaler quoi que ce soit comme traduit.
Quelqu'un sait-il où est la réponse?
Réponses:
Les pages du livre sont essentiellement numérisées photographiquement, puis transformées en texte à l'aide de la «reconnaissance optique de caractères» (OCR) et transmises au Web sous la forme d'une image avec un mot connu du programme informatique derrière reCAPTCHA et un mot qui n'est pas encore connu.
L'utilisateur saisit ensuite les deux mots et s'il résout celui pour lequel la réponse est connue, le système suppose que sa réponse est correcte pour le nouveau. Le système donne ensuite la nouvelle image à un certain nombre d'autres personnes pour déterminer, avec une plus grande confiance, si la réponse originale était correcte. Par conséquent, le système est un service à amélioration automatique qui s'améliore avec le temps.
http://www.google.com/recaptcha/learnmore
la source
C'est pourquoi reCaptcha vous fait entrer deux mots. Un des mots est déjà connu et un des mots n'est pas connu. Que vous réussissiez ou échouiez le captcha dépend uniquement de la façon dont vous répondez au mot connu. Votre réponse pour l'autre mot (inconnu) sera utilisée, ainsi que d'autres réponses au même mot, pour le transformer également en mot connu.
la source