21 agosto 2008

Escravidão digital

Você pode não saber, mas está digitalizando livros e, pior, de graça!
Sabe aquelas imagens com letrinhas que você tem que digitar todas as vezes que quer enviar um link para alguém no Orkut, fazer download ou se cadastrar em algum serviço online? O nome daquilo é captcha e, teoricamente, elas servem para diferenciar você de um sistema computacional, ou seja, é muito mais difícil para um software reconhecer e "digitar" as letras na caixa de texto do que para você. Até aí nenhuma novidade, né?
Bem, acontece que até pouco tempo atrás, as letras das imagens captcha eram geradas aleatoriamente, sem nenhum significado específico. Agora, os cientistas da universidade de Carnegie Mellon, nos Estados Unidos, estão substituindo as letras aleatórias do captcha por palavras oriundas de livros digitalizados. Em outras palavras, eles “scanneiam” os livros e colocam as palavras pra você digitar (genial!). Com isso, eles já digitalizaram aproximadamente 17 mil livros.
O nome do sistema revolucionário (e oportunista) é reCaptcha e, para garantir que as palavras foram digitadas corretamente, elas são combinadas com palavras já conhecidas e submetidas a mais de um usuário. Assim, se o usuário acertou a palavra conhecida da imagem, presume-se que ele tenha acertado a palavra do livro também. Cada palavra deve ser digitada por vários usuários até que, estatisticamente, ela seja considerada válida.

Nenhum comentário: