垃圾邮件

我想,大卫·克罗克(David H.Crocker)或者雷·汤姆林森(Ray.Tomlinson)在当初发明E-mail系统的时候,怎么也不会想到几十年后的今天,他们的技术结晶竟会被俄罗斯、美国和中国的“一小撮”人用来干“扰民发财”的事吧?!现在E-mail的状况,恐怕与他们当年的发明初衷是背道而驰的。

2000年第一次接触互联网的时候,没几个大的、吸引人的网站,搜狐是当时比较喜欢的站点之一,顺理成章地也就在那注册了我的第一个正式的电子邮件地址(之前注册了一个以sy163.com结尾的邮箱,但很快这个域名就消失了)。不过在随后的使用中,得益于我的一度兴奋和几度无知,将这个邮箱地址四处散发、填写,生怕别人不知道我有个邮箱,而且更追悔莫及的是在拥有了QQ号之后的一段时间里,这个邮箱地址所接触到的人就更多了,甚者大部分还是陌生人!

自作孽,真的是无话可说,几年之后,我确信我的邮箱地址已经被某个、甚至某几个垃圾邮件发送列表收录,再加上搜狐邮箱的反垃圾措施一直就是个摆设,所以在最高峰的时候,每天的垃圾邮件都有一百多封。一开始我还有心去清理下,毕竟这是我的第一个正式应用的邮箱,从感情上来说我还是很在乎它,但在一段时间的徒劳之后,还是放弃了。虽然在随后的几年里,搜狐的反垃圾措施有了些许加强,当仍不敢恭维,就在现在,这个邮箱的垃圾邮件,每周也得来个大几十封。

Continue reading

reCAPTCHA-抵御垃圾评论

既然选择Wordpress开了博,就免不了跟垃圾留言较劲,一天少则几条,多则几十上百条,诚然有Akismet这个东东,但毕竟这是“被动式”防御,如果让Akismet再加上一个留言“验证码”一类的东西,估计效果会更上一层楼。所以,我要给大家推荐一款由Google(收购)出品的“在防止垃圾留言的同时,亦可帮助一些组织完成大量电子扫描设备无法识别的古籍中的单词”的东东(这句有点长,下文解说)。

CAPTCHA是“Completely Automated Public Turing Test to tell Computers and Humans Apart”的简称,中文即“全自动区分计算机和人类的测试”,最初是由卡内基梅隆大学的学者提出,其是用来在电子时代区分人类和计算机的最好方法,原理就是让用户看图输入一组经变形或增加波浪线的字母组、单词组,这类经处理的图像是无法由计算机扫描识别的,只能由人类分辨读出,所以,这个特性催生了reCAPTCHA这个项目。即同时产生两个词组(一前一后),一个词组是已知答案的词组(已经过CAPTCHA技术处理,机器无法识别),如果能回答出这组词,那么reCAPTCHA服务器将获知这是一个人类,他的回答将是可信的; Continue reading