技术资讯
如何使蜘蛛逆向爬行索引
2011-11-15 00:12:46
首先,我们要来个免责声明-他们再青岛网站设计中ꦿ并不一定是必要的-但以防万一…但你必须注意的是,这些是一个概念化的东西,至少我是这样认为的,还没有进行实际的测试和实践证明。
蜘蛛的逆向爬行…至少我第一次起这个名字的时候我是这样想的。这种想法来源于很多的地方:
网站的页面的深度如果很高的话那对爬行和索引来说都是一个挑战,因为他们的结构很深,拥有大量的页面,会有爬行的障碍(例如那些大量基于参数的URL或者那些被认为没有什么价值的页面,这种情况会经常出现在一些电子🐈商务的网站。)
或者一个网站希望能够尽可能的充分并♚迅速的被索引(也许一个网站添加了新的内容,它的URL就会发生戏剧化的改变,尽管301已经被定位了,或者这是一个新的站点)。
因此,怎样才能使网站能够被正常的爬行和索引?通常是通过以下的几种方式:
发现:搜索引擎蜘蛛会根据链接进入到你的网站
提交:一个站长会把站点和页面提交给搜索引擎
XML网站地图:一个站长给他们的网站创建一个XML网站地图,并通过搜索引擎使他们变得有效,或者就把它放在网站的根目录作为一个网💟站地图或者利用ROBOTS文件来进行自动搜索。
这些方法都是优点和缺点的,但是他们至少解决了如何让蜘蛛进入他们的站点,通过使用XML网站𝕴地ജ图,可以帮助蜘蛛越过一些爬行的障碍。但是它也不是完全准确的,但是我认为这是一个自上而下的路线,像是这样的…
无论是直接还是间接,主页被发现了。那么蜘蛛就会按照他们自己的路线进行爬行。从顶级的导航到第二层让后到子导航,爬行到顶级的分类页面,通过子分类的界面,然后到更深的产品和信息页面。反过来说,你想进行索引的这些页面同时占领了头部和长尾的搜索。这些也很有꧑可能是产生交易或者是转化的页面。
蜘蛛来到你页面的频率是多少?它们一次性通常会爬多少页面?新的页面会多久才会被发现和抓取?相对🀅而言旧的页面会多久被发现和抓取?本质上来说,应该平衡抓取,这就解释了为什么排除重复性内容的重要性。你不想心爱的蜘蛛把时间浪费在爬过和收录过的内容。
当你为一些大型的网站指出这些问题的话,你发现想让蜘蛛去爬行和喜欢的URL实在是多的让人觉得可怕,即使没有那些隐藏着的爬行障碍。请记住,甚至是XML网站地图,每个网站地图最多只能包括50000个URLꦡ,最少20个单独的网站地图的话加起来就会有1000000个页面。
要说的是,我要提醒大家这种情况并不适用于所有的网站和情况。这种“蜘蛛逆向爬行”的基础和使用XML网站地图是有些不同的。典型的XML网站地图策略是要提交每一个URL,就是希望每个页面都能被索引。这也许不是最好的策略,但是这是ꦇ另外一个问题了。即使那样,这些策略往往会给加拿大预测网-在线预测过多的权重和优先权。
恰恰相反,我们应该把网站地图的重点放在一些低等级的页面上。通常都是单个的产品和信息页面。这种思想就是♈让蜘蛛去那些最深层最难爬的页面。
它们之后还会去哪儿呢?他们会按照蜘蛛做的那样做,开始爬行。想想这些深层次的页面。但愿他们内容丰富并且富有关键词。他们也许包括一些可以导航的元素,即使不是完全的高等级的导航,至少是一些分类导航。如🐼果网站有类似的面包屑导航的话,我们可以直接喂给蜘蛛这些面包屑。
在这点上,我们应该更好的以更多的方式给蜘蛛展𓂃现我们的网站。这个观念也许并不是关于逆向爬行的,反而是关于让蜘蛛从两个底端开始爬行,这样的爬行最终也能到顶部的导航。
我们通常会假设蜘蛛会很自然的首先去找加拿大预测网-在线预测然后顺势往下爬遍整个网站。和那些多样化的产品等级的页面相比从主页到顶层🔴页面有多少个唯一的URL?我的猜想是因为页面深度的不同,两个等级的页面的抓取数量是有很大的不同的。
正如我提到的,我认为这是一个低风险的路线。无论有没有xml网站地图,蜘蛛们都能找到页面的。他们会找到不在网站地图中的页面,因此即使是一个💃没有加拿大预测网-在线预测和顶级页面的网站地图,也不会遗漏掉这些页面。
在自然环境下,也许不会出现这些问题。蜘蛛会迅速📖爬过整个网站。一旦他们发现了链接他们就会追根究底。也许这些页面埋得太🐷深了,他们有点儿不太喜欢。
无论如何,让这些网页被爬到和索引是很重要的,对于我的站来说这的确是一个艰难的过程。或许这只是一个时间问题。至少我要去尝试。一旦像我想象的那🅷样整个网站的那个等级的页面都被建立了索引,我就可以继续并在XML网站地图中添加其他🧸的URL,或者我可以做个实验,不把网站地图放在网站里。
近期更新
- [2023-07-26 14:17:28] 加拿大预测网-在线预测:为品牌赋能,海外官网品牌数字化
- [2023-05-06 10:32:26] 加拿大预测网-在线预测:青岛网站建设公司,高端网站定制,一站式网站🍃服务——力图数字科技
- [2023-04-27 13:47:54] 加拿大预测网-在线预测:高端定制网站建设——从满足预期到走向卓越
- [2023-04-11 09:17:49] 加拿大预测网-在线预测:H5页面设计开发——移动端传播利器
- [2022-11-16 10:11:43] 加拿大预测网-在线预测:windows2012程序在哪
- [2022-04-14 11:01:47] 加拿大预测网-在线预测:力图数字科技配套网站服务支持
- [2021-05-18 10:14:11] 加拿大预测网-在线预测:青岛网站建设的流程
- [2021-04-29 10:14:38] 加拿大预测网-在线预测:企业定制化官网建设项目
- [2021-03-05 10:34:45] 加拿大预测网-在线预测:移动互联时代房地产行业的微信小程序解决方案
- [2021-01-22 17:29:38] 加拿大预测网-在线预测:微信小程序有哪些优势?为什么要开发微信小程序?
- [2021-01-08 17:28:04] 加拿大预测网-在线预测:网站建设最容易忽略的人性化设计
- [2020-12-16 16:55:32] 加拿大预测网-在线预测:建设一个常规的公司网站建设成本大概是多少?
延伸阅读
- [2011-11-07 22:06:08] 加拿大预测网-在线预测:网页设计与用户浏览体验-分析
- [2011-11-04 15:14:32] 加拿大预测网-在线预测:网站被K后怎么办 以及应对经验总结
- [2012-02-19 20:18:14] 加拿大预测网-在线预测:网站设计趋势-品牌站细分设计
- [2014-01-27 11:33:01] 加拿大预测网-在线预测:网站反馈表单的设计与欣赏
- [2015-01-21 09:04:02] 加拿大预测网-在线预测:您怎么看待2015中国互联网发展趋势?
- [2014-10-06 09:11:40] 加拿大预测网-在线预测:网页设计灵感的起源地
- [2011-06-28 23:59:17] 加拿大预测网-在线预测:如何选择青岛网站设计公司?
- [2014-11-06 10:48:40] 加拿大预测网-在线预测:八个优秀的图片和图标的搜索引擎
- [2011-10-21 15:02:35] 加拿大预测网-在线预测:青岛网站设计成功要素
- [2016-10-19 14:30:00] 加拿大预测网-在线预测:青岛网站建设布局好关键字更有利于SEO优化
- [2015-03-16 09:08:12] 加拿大预测网-在线预测:网站登陆页面应遵循的原则?
- [2011-11-30 22:05:58] 加拿大预测网-在线预测:如何做高质量的网站外链
解决方案
加拿大预测网-在线预测: 轮胎行业网站设计解决方案 加拿大预测网-在线预测: 机械行业网站设计解决方案 加拿大预测网-在线预测: 房地产行业网站设计解决方案 加拿大预测网-在线预测: 科技企业网站设计解决方案 加拿大预测网-在线预测: 电子家电网站设计解决方案 加拿大预测网-在线预测: 食品行业网站设计解决方案 加拿大预测网-在线预测: 集团公司网站设计解决方案 加拿大预测网-在线预测: 企事业单位网站设计解决方案 加拿大预测网-在线预测: 外贸行业网站设计解决方案 加拿大预测网-在线预测: 健身运动网站设计解决方案 加拿大预测网-在线预测: 美容与化妆品网站设计解决方案 加拿大预测网-在线预测: 建筑设计行业网站设计解决方案 加拿大预测网-在线预测: 物流行业网站设计解决方案