使用uBlacklist过滤Google搜索中文内容农场
使用uBlacklist过滤Google搜索中文内容农场
laoyee本文内容为Google搜索引擎使用中的一些实用技巧分享,不包含任何访问Google的方法以及工具!
中文的搜索引擎体验做的最好的居然都是国外的产品,喜欢折腾玩机或者找论文以及程序员大多数都喜爱Google搜索,而因为特殊原因Google是无法直接访问的,因此微软的必应搜索倒是不错的选择。而第一页全是竞价广告搜索结果牛头不对马嘴的某搜索这里就不点名了,好多时候我们搜一些软件的官网排在首位的大部分都是一些采集下载站,各种P2P下载器稍有不甚电脑就会中招,而移动端就更惨不忍睹了强制性引流跳转自家App,体验实在是一塌糊涂。
目前支持中文的国外搜索引擎不多,必应和Google算是符合我们习惯的最佳选择了,对于不喜欢折腾的小伙伴们来说必应还是非常好用的,应付日常基本上是没啥问题了。而找论文找文献以及码农找各种技术开发文档这类搜索需求时,Google搜索的强大就凸显出来了。
然而最近Google中文搜索被一些老鼠屎给搞的乌烟瘴气,某些投机取巧的大量购买新域名做站群,且正好利用搜索引擎的规则空子成功让Google搜索收录了大部分垃圾采集内容,这就导致了Google搜索一些关键字时出现了大量文不对题的结果。老夜正好也碰上了于是逛逛V站也看到不少人遇到此问题,为此一场浩浩荡荡的斗争展开了。
下图中这种小X百科网、小X知识网均是此次重点拦截屏蔽的对象
毕竟用户群体技术大佬还是比较多,一时间纷纷炸开了锅,于是没过多久就将某人的信息扒的一点都不剩,就差贴照片发家庭住址,虽然这种方式有些不妥但是对于破坏互联网中文搜索环境属实极其恶劣,只能说干的漂亮!
耐不住广大网友的亲切问候,迫于压力最终关闭服务器了,已经收录的内容会逐渐消失。互联网又恢复了往日的宁静祥和,仿佛什么都没有发生过,老夜在写文前也再次尝试搜索了一下确实恢复了好多但仍有一些还未清理干净,没事别得罪程序员系列故事将告一段落了。
为了杜绝此类现象的发生,我们可以防患于未然,相比病入膏肓无药可救的某知名搜索,Google搜索配合一些脚本插件还是非常好用的。
首先电脑浏览器肯定必推google浏览器了,需要前往官方的浏览器拓展市场下载“uBlacklist”,能用Google搜索想必不会不知道怎么找插件以及安装吧,这里操作步骤直接省略
然后进入uBlacklist的配置选项,如下图所示
如果在看的有程序猿一定不会不知道正则表达式,通过灵活的规则就可以过滤一些我们不想看到的搜索展现内容,老夜搜集的规则大家可以参考下
1 | *://*/so.php |
当然了光凭这样并不能一劳永逸,只要那些站点稍微变动个文章标题或者更换域名,相应的正则就没用了。但是民间的大佬们纷纷抱团共同维护中文互联网环境,真真切切用爱发电,不断的更新收集这些垃圾采集站的订阅源,且更新频率非常高基本上几天一更新,只要将订阅源添加到uBlacklist相应的位置就能享受更好的优质体验了
下面是比较推荐老夜在用的规则,Github上还有很多相应的拦截订阅源
1 | https://gcore.jsdelivr.net/gh/Paxxs/Google-Blocklist@develop/uBlacklist_subscription.txt |
然后我们重新搜索之前小X百科网、小X知识网泛滥的关键字,就明显的看到内容清爽多了,uBlacklist的功能仅仅是将那些符合拦截条件的搜索结果折叠不显示,对于其他的一些搜索结果不满意也可以点击标题右侧的“加入黑名单”就行了
当然了可能存在误判的时候,我们可以在顶部将屏蔽的内容标记并展示出来,如果存在误伤的结果可以选择“不再屏蔽这个网站”,灰常的银杏话!
Google的中文搜索因为用户群体少肯定没有其他语言搜索那样重视,不少人发现通过更该地区为漂亮国所展现的搜索结果也会干净不少,老夜实测居然还真是这样,操作同样很简单
看图就知道怎么操作了,先这样再那样,最后在这样就完事了
一番调教下Google搜索似乎变的更好用了呢
补充:
文章开头就说了仅仅是一个Google搜索的实用技巧分享,不提供任何访问帮助性的工具。当然了除了安装浏览器拓展之外,油猴插件也是能实现上面的效果的,规则订阅源还是可以跟上面的共用,效果类似,找到“Google Hit Hider by Domain”这个油猴脚本就可以了,无论是文章所讲的插件以及油猴插件都不支持某度的相关过滤功能。
如果真的需要可以搜索“AC-baidu”这个油猴脚本,下面附上Github相关的详细介绍地址,喜欢折腾的小伙伴们可以参照一下
https://github.com/cobaltdisco/Google-Chinese-Results-Blocklist
最后附上一些可能用到的教程文章: