协策网络,专业做网站,优秀上海网站制作公司,提供企业建站、网站设计、网页制作,专业网页设计师和网站制作技术工程师为您量身打造个性企业电子商务网站。

此页面上的内容需要较新版本的 Adobe Flash Player。

获取 Adobe Flash Player

  文章汇总 Article Summary
当前位置:协策网络 >> 文章中心 >> 网站优化 >> 浏览文章
 

网站内容是怎样被抓取的

作者:zhangting    标签:上海seo优化 上海网站制作公司     日期:2014年10月20日    类别:网站优化

 

 

    相信大家都知道,众多站长每天想着怎么建设、维护、更新网站内容都是为了能被搜索引擎抓取,让自己的网站内容被搜索引擎抓取。对于南京网站建设的从业者而言,我们所做的一切努力都是为了被百度认可,毕竟它的受众在国内最多,因此取得它的认可是非常重要的。那么,网站内容是怎样被抓取的呢?下面,协策网络就和大家说下自己的见解。
 
  1、去除URL中的用户相关参数
 
  那些不会对上海网站制作的网页内容产生影响的URL中的参数——例如session ID或者排序参数——是可以从URL中去除的,并被cookie记录的。通过将这些信息加入cookie,然后301定向向至一个“干净”的URL,你可以保持原有的内容,并减少多个URL指向同一内容的情况。
 
  2、控制无限空间
 
  你的上海网站设计站上是否有一个日历表,上面的链接指向无数个过去和将来的日期(每一个链接地址都独一无二)?你的网页地址是否在加入一个&page=3563的参数之后,仍然可以返回200代码,哪怕根本没有这么多页?如果是这样的话,你的网站上就出现了所谓的“无限空间”,这种情况会浪费抓取机器人和你的网站的带宽。如何控制好“无限空间”,参考这里的一些技巧吧。
 
  3、阻止Google爬虫抓取他们不能处理的页面
 
  通过使用你的robots.txt 文件,你可以阻止你的登录页面,联系方式,购物车以及其他一些爬虫不能处理的页面被抓取。(爬虫是以他的吝啬和害羞而著名,所以一般他们不会自己 “往购物车里添加货物” 或者 “联系我们”)。通过这种方式,你可以让爬虫花费更多的时间抓取你的网站上他们能够处理的内容。
 
  4、 一个URL, 一段内容
 
 
  在理想的世界里,URL和内容之间有着一对一的对应:每一个URL会对应一段独特的内容,而每一段内容只能通过唯一的一个URL访问。越接近这样的理想状况,你的网站会越容易被抓取和收录。如果你的内容管理系统或者目前的网站建立让它实现起来比较困难,你可以尝试使用rel=canonical元素去设定你想用的URL去指示某个特定的内容。
  在理想的世界里,URL和内容之间有着一对一的对应:每一个URL会对应一段独特的内容,而每一段内容只能通过唯一的一个URL访问。越接近这样的理想状况,你的网站会越容易被抓取和收录。如果你的内容管理系统或者目前的网站建立让它实现起来比较困难,你可以尝试使用rel=canonical元素去设定你想用的URL去指示某个特定的内容。相信大家都知道,众多站长每天想着怎么建设、维护、更新网站内容都是为了能被搜索引擎抓取,让自己的网站内容被搜索引擎抓取。对于南京网站建设的从业者而言,我们所做的一切努力都是为了被百度认可,毕竟它的受众在国内最多,因此取得它的认可是非常重要的。那么,网站内容是怎样被抓取的呢?下面,锐意先行就和大家说下自己的见解。
  1、去除URL中的用户相关参数
  那些不会对南京网站制作的网页内容产生影响的URL中的参数——例如session ID或者排序参数——是可以从URL中去除的,并被cookie记录的。通过将这些信息加入cookie,然后301定向向至一个“干净”的URL,你可以保持原有的内容,并减少多个URL指向同一内容的情况。
  2、控制无限空间
  你的南京网站设计站上是否有一个日历表,上面的链接指向无数个过去和将来的日期(每一个链接地址都独一无二)?你的网页地址是否在加入一个&page=3563的参数之后,仍然可以返回200代码,哪怕根本没有这么多页?如果是这样的话,你的网站上就出现了所谓的“无限空间”,这种情况会浪费抓取机器人和你的网站的带宽。如何控制好“无限空间”,参考这里的一些技巧吧。
  3、阻止Google爬虫抓取他们不能处理的页面
  通过使用你的robots.txt 文件,你可以阻止你的登录页面,联系方式,购物车以及其他一些爬虫不能处理的页面被抓取。(爬虫是以他的吝啬和害羞而著名,所以一般他们不会自己 “往购物车里添加货物” 或者 “联系我们”)。通过这种方式,你可以让爬虫花费更多的时间抓取你的网站上他们能够处理的内容。
  4、 一个URL, 一段内容
  在理想的世界里,URL和内容之间有着一对一的对应:每一个URL会对应一段独特的内容,而每一段内容只能通过唯一的一个URL访问。越接近这样的理想状况,你的网站会越容易被抓取和收录。如果你的内容管理系统或者目前的网站建立让它实现起来比较困难,你可以尝试使用rel=canonical元素去设定你想用的URL去指示某个特定的内容。


更多
  您可能感兴趣的文章推荐  
 
上一篇:怎样的网络文案最具影响效果 下一篇:没有了
协策网络公司拥有专业的网站建设开发团队,超过四年以上的网站建设、网页制作经验,我们可承接企业电子商务网站建设、企业展示型网页设计和功能型网站制作等各类型网站设计制作。
     
首 页  |  基础服务  |  网站建设  |  网站优化  |  成功案例  |  协策博客  |  关于我们  |  联系我们
COPYRIGHT © 上海协策网络科技有限公司 2008-2014 网站地图 SITEMAP 上海做网站公司 沪ICP备08009778号

地址:上海市共和新路425号凯鹏国际大厦13楼G座(近3、4、8号线)

电话:021-51085186 传真:021-56555059 咨询:+(86)18018609689
上海做网站建设网页设计制作公司