1、随机模版
方法:你多复制N多模版,在body标记附近稍微修改一下。只要你的模版够多,人家就失去耐性,放过你了。
缺点:就是要复制N多模版,麻烦

2、防采集字符混淆
方法:在body表示是插入大量混淆字符别人采集也一并把混淆字符采集过去了。
缺点:有可能对SEO造成影响,对于图片站来说,假如别人不在乎你的混淆字符的话,人家照样采集,别人下载你的图片给你带来过大的流量。

3、还有一个好的解决办法
方法:在body标记附近的
修改成
注意是空格+{dede:field.id/},这样div的class还是没有变,但产生了
或者在html标记里插入id={dede:field.id/},比如
注意如果当前的html标记有存在的ID最好不要再插入了。
让采集者写规则的时候没办法找到相同的,他就没办法写了,如果他连
也采集进去的话,你就在
前面的有class的地方照样这样做。
当然,别人可以使用过滤规则来去掉,但是假如我在所有的class里插入文档ID,或者插入id=文档ID这样的。那他就采集整个页面然后再过滤吧。
缺点:如果插入{dede:field.id/}不够多的话别人可以用过滤规则过滤掉。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Search

日历

最新评论及回复

最近发表

网站分类

文章归档

Powered By vs 注册香港公司

Copyright 2008-2009 你的鱼(Your fish). Some Rights Reserved.