reCAPTCHA防垃圾的同时还给OCR贡献一份力量

| 3 Comments | 1 TrackBack

如之前所说的,本站的在线工具采用了reCAPTCHA来防止spam。那么这个reCAPTCHA到底如何呢?让我用kxn的一段介绍来开始:

reCAPTCHA 是卡内基梅隆大学的一帮人搞出来的,它的技术并没有什么先进之处,但是创意有点意思。世界上面有很多将图书电子化的计划,基本是把书籍扫描了以后用 OCR 软件识别。有些情况下面 OCR 软件自己觉得某些词的识别结果并不是非常有把握。通常情况下面是通过雇佣劳力来肉眼校对。reCAPTCHA 项目认为这个工作不妨交给全世界大量填写认证码的人来完成。

一般图形认证码系统都是只生成一个单词的,reCAPTCHA 生成的图片里面有两个单词,其中一个是机器生成的,有正确结果的单词,另一个则是扫描出来的有问题的单词,这个词没有正确结果。如果用户提交上来的结果里面机器生成的那个是对的,那么系统就认为另外一个也很有可能是对的。一幅扫描图片展示给多个用户如果结果都是一样的,他就将这个结果作为最终校对结果。这样就实现了利用人力来分布式校对文稿的目的。更具体的细节可以看 http://recaptcha.net/learnmore.html

在使用中会显示两个单词,其中一个单词是已知正确的,必须输入正确,另外一个是未确定正确内容的,那么通过这个步骤,用户在输入验证码的过程中,就同时实现了两个功能,一个是防spam,另外一个就是人力OCR。

要安装这个工具步骤如下。
1)首先要注册获得帐号。


Hosting in Chinese

2)添加网站,因为reCAPTCHA是基于域名的,所以只需要添加一个域名就可以了,比如本站的网址是http://seo.g2soft.net/,我添加的就只要用g2soft.net就可以了,之后旗下的字域名都可以使用了。多个域名需要逐个添加。

3)获取公钥和私钥。在程序中会使用到。

4)程序,现在已经有很多现成的程序插件可以使用,比如针对Wordpress的插件MediaWiki的插件,也有如何在PHP下使用的说明,DavidYin就是按照这个说明来写的。
还有很多其他的Web程序插件在这里可以看到。

实际使用的过程毕竟简单,当图片实在看不清楚时,可以换图片,再不行,可以用语音提示。
总之,很好用。


作者: David Yin
原载: SEO 网站优化推广
版权所有。转载时必须以链接形式注明作者和及本声明。
请订阅Feed来获得最新文章,从下面选择你喜欢的阅读器来订阅全文输出的SEO 网站优化推广。

1 TrackBack

reCAPTCHA 是卡内基梅隆大学的一帮人搞出来的,它的技术并没有什么先进之处,但是创意有点意思。世界上面有很多将图书电子化的计划,基本是把书籍扫描了以后用 OCR 软件识别。有些情况下面 OCR 软件自己觉得某些词的识别结果并不是非常有把握。通常情况下面是通过雇佣劳力来肉眼校对。reCAPTCHA 项目认为这个工作不妨交给全世界大量填写认证码的人来完成。 Read More

blog comments powered by Disqus

3 Comments

Test comment with reCAPTCHA.

That's funny!
呵呵,拽句外语,这个功能确实很有创意,忍不住留个脚印,切身体验一下

不是说要用图片方向识别那种吗?

关于

David Yin
研究(SEO)搜索引擎优化排名和(PPC)竞价排名技术,总结搜索营销学的各种方法和趋势。
David Yin
Email:seo[AT]g2soft.net

Archives

Powered by Movable Type 5.12

关于本文

本文由 David Yin 发表于 March 10, 2008 3:02 PM

上一篇是图片搜索引擎优化

下一篇是被感冒击中

首页查看最新内容,或者到归档页面查看所有内容。

订阅SEO 网站优化推广