网站要想排名好,首先的一个前提就是你的网站的所有内容必须能够让百度所收录,其实这不是件容易的事情,尤其是到达一定了规模之后网站的收录问题就是一个颇令人头疼的问题了,当然这只是针对于那些大型行业站来说。但是对于我们做些中小型的企业站论坛网站我们同样要纠结于这个问题,有的网站页面多达几千几万,无论网站怎么构架怎么优化外链,要想达到百分百的收录根本就是不可能的事情,所以只能尽量提高收录量。想要被搜索引擎收录是一个问题,同样好多网站的信息不想被搜索引擎收录也是一个问题,比如需要阻止收录的情况如保密信息、复制内容、广告链接等。过去过去常用的阻止收录方法包括密码保护、把内容放在表格后面、使用JS/Ajax、使用Flash等。今天看到Google网管博客一篇文章,这些方法都不保险。下面上海企业网站建设把这篇文章里关于网站不被收录所采取的措施漏洞给大家说一说。
使用Flash
Google几年前就开始尝试抓取Flash内容了,简单文字性内容已经能抓取。Flash里面的链接也能被跟踪。
表格
Google蜘蛛也能填表,也能抓取POST请求页面。这个早就能从日志中看到。
JS/Ajax
使用JS链接一直以来被当作不搜索引擎友好的方法,因此可以阻止蜘蛛爬行,但两三年前我就看到JS链接不能阻止Google蜘蛛抓取,不仅JS中出现的URL会被爬,简单的JS还能被执行找到更多URL。
前几天有人发现很多网站使用的Facebook评论插件里的评论被爬、被收录,插件本身是个AJAX。这是个好消息。我的一个上海企业网站建设网站产品 评论功能就因为这个费了不少心思,用Facebook comments插件好处大大的,具体什么好处以后有时间再说,唯一的问题就是评论是AJAX实现的,不能被抓取,而产品评论被收录是目的之一(产生原创内容)。我当时想了半天也没有解决方法,只好先傻傻地既放上Facebook comments插件又打开购物车本身的评论功能。现在好了,Facebook comments里的评论能被收录,就不用两套评论功能了。
Robots文件
目前唯一确保内容不被收录的方法是robots文件禁止。但也有个坏处,会流失权重,虽然内容是不能收录了,但页面成了只接受链接权重、不流出权重的无底洞。
Nofollow
Nofollow并不能保证不被收录。就算自己网站所有指向页面的链接都加了NF,也不能保证别人网站不给这个页面弄个链接,搜索引擎还是能发现这个页面。
怎样使页面不被收录是个值得思考的问题,没意识到严重性的做上海seo童鞋可以想想自己网站上有多少复制内容、低质量内容、各种无搜索价值(但用户觉得方便、有用所以又不能拿掉)的分类、过滤URL。
0 Comments