baidu分词切词研究如何获取优质长尾流量

编辑:Discuz论坛 发布于2019-06-17 11:24
网站优化:应该重视用户而不是重视技术
一般所说的网站优化也等同于搜索引擎优化,也叫SEO,但网站优化并不是简单的搜索引擎优化,真正的网站优化应该包括搜索引擎优化和网站使用者的优化。搜索引擎优

对与百度的分词研究原来也没有在意,但有一次我在作优化时无意中发现一个词也就是差了一个字,结果排名大不相同。我作的是二手房的要害词,但是我的页面上的要害词设置却是二手房源,可能有的朋友会说,这个没什么问题啊,二手房源不是包含了二手房这个要害词吗?假如没有仔细对百度的分词进行研究,大家可能看不出这两个词会有什么区别,不过大家只要稍微留心一下搜索出来的结果,就可以看出端倪了,百度在对二手房和二手房源这两个词分词出来是不一样的,百度自己建立有自己的词库,所以他会把二手房这个词当作一个整体,但是对于二手房源这个词,百度则拆分成了二手和房源两个词,自然别人在搜索二手房这个要害词的时候就找不到我的页面了。通过这个小细节,我觉得有必要对百度的分词进行一下深入的研究,我大概地总结出了以下这么几点:

1、百度分词是根据内容中,第一次出现要害词相关词为标准来分的。例如今日新开热血江湖sf这个词
  假如你的正文中第一个出现的是今日这个词,那么你的页面上的要害词就会被拆分成今日和新开热血江湖sf两个词,标题中一定要包含要害词,但不一定要完全匹配,但内容中出现的要害词是要跟百度分词完全匹配的,在完全匹配中又会根据文件URL路径的深度来进行排序,在要害词都完全匹配的情况下,比如说目录比文件有优先权,根目录下的文件要比二级目录下的文件有优先权,完全匹配的会排在前面,然后再是部分匹配的。

2、在要害词没有完全匹配的情况下,假如有分词,比如说:游览器下载
这个要害词,有一个网页里第一次出现的要害词是游览器,并且有较高的要害词密度,但是这个网页中却没有下载这个要害词
而另一个网页里第一次出现的要害词是下载,那么这个网页的要害词就会被拆分成 游览器 下载 两个词,虽然第二个网页里包含有游览器 下载 但是第一个网页还是会排在第二个网页的前面,这说明要害词的前面部分是最重要的。

3、要害词第一部分出现的频率是排名的要害,比如说 游览器 下载,假如两个网页都没有完全匹配,都是含有两个分词,那么游览器这个分词密度高的网页将会排在前面。

4、假如完全匹配,但是要害词第一出现是在页面内容的最后面部分,那么这个网页的排名将比前面这些页面还要低。所以要害词尽早在内容中出现是非常重要的。