三沣开发知识 购物 网址 游戏 小说 歌词 地图 快照 开发 股票 美女 新闻 笑话 | 汉字 软件 日历 阅读 下载 图书馆 编程 租车 短信 China
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
多播视频美女直播
↓电视,电影,美女直播,迅雷资源↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
vbs/VBScript DOS/BAT hta htc python perl 游戏相关 VBA 远程脚本 ColdFusion ruby专题
autoit seraphzone PowerShell linux shell Lua Golang Erlang 其它教程 CSS/HTML/Xhtml
html5 CSS XML/XSLT Dreamweaver教程 经验交流 开发者乐园 Android开发资料
站长资讯 .NET新手 ASP.NET C# WinForm Silverlight WCF CLR WPF XNA VisualStudio ASP.NET-MVC .NET控件开发 EntityFramework WinRT-Metro Java C++ PHP Delphi Python Ruby C语言 Erlang Go Swift Scala R语言 Verilog 其它语言 架构设计 面向对象 设计模式 领域驱动 Html-Css JavaScript jQuery HTML5 SharePoint GIS技术 SAP OracleERP DynamicsCRM K2 BPM 信息安全 企业信息 Android开发 iOS开发 WindowsPhone WindowsMobile 其他手机 敏捷开发 项目管理 软件工程 SQLServer Oracle MySQL NoSQL 其它数据库 Windows7 WindowsServer Linux
  IT知识库 -> 站长资讯 -> SEO算法深度分析之倒排索引,来解释SEO排名的问题 -> 正文阅读
 

[站长资讯]SEO算法深度分析之倒排索引,来解释SEO排名的问题

SEO算法深度分析之倒排索引,来解释SEO排名的问题 SEO算法深度分析之倒排索引,来解释SEO排名的问题  人参与 | 时间:2018年06月12日 07:02
今天给大家分享一下倒排索引的一些事情,为什么要说倒排索引呢?因为当用户搜索一个词的时候,返回的搜索结果页面就是经过倒排索引和一系列算法过滤后的结果排序,seo苦苦追求的不就是排名的多少吗?
说的通俗一点,其实搜索引擎的索引好比是我们平时看书时的目录,为了让大家更快找到适合自己的东西,比如导航站其实就是互联网上小型索引的结构案例。
上面会有一些分类比如新闻、电影、小说、图片等等板块,让用户快速的找到自己所需。
索引是搜索引擎中最为核心的技术之一,因为在大量的网页中,怎样才能更快、更精准的找到用户查询这个词的搜索意图。
先给大家说几个概念,为了下面的讲述中,大家都能看得懂。
1、文档:我们是以网页的形式看到互联网页面的,而网页中包含很多的东西,比如:TXT、EXCEL、PDF等等很多各式各样的文件都被成为文档。
2、文档集合:由很多的文档组成一个集合,称为文档集合。
3、文档编号:互联网上每一个文档都有各自且独一无二的编号。
4、单词编号:每个单词都有各自的唯一编号,用编号来代表这个单词或、短语者句子。
5、倒排索引:是在搜索引起的索引库中,以单词对应网页的一种存储的形式,可以根据单词快速的获取相关的文档。
其实倒排索引非常的简单,下面就结合一些特征案例来渐渐深入的分析这个算法,大家先了解一些基本的思路即可。

上图是每个文档编号对应的不同文档,如编号“1”对应“小明吃早饭”,编号“2”对应“小明早上吃了什么”,以此类推。
另外由于中文和英文的文化属性不相同,中文的汉字之间没有明显像英文单词那样的分隔符,索引首先对中文要进行一下分词(下面举例中暂时不去掉停止词),这样就把一句话变成了一个个的词组,如下图。

上图单词的ID记录了每个单词的编号,第二列是编号所对应的单词,第三列是哪几个文档中包含了这个单词。
比如单词“小明”,其其单词编号为“1”,倒排列表“1,2,4,5”,表示这几个文档集合中都包含了这个单词。实际上搜索引擎更为复杂,不仅仅记录了单词的文档编号,还记录了单词的频率(TF,什么意思呢?很多seo从业者都在说关键词的密度,
市面上计算页面中关键词密度的计算公式有三个:
公式一: 关键词次数/页面总字数 x100%
公式二: 关键词次数/页面总字数/关键词字数 x 100%
公式三: 关键词次数/页面分词数量 x 100%
先不讨论哪个公式的计算方式更加精准,我们发现公式中都出现了关键词的次数,那这个TF就是该单词在页面中出现的次数)
这个TF在搜索引擎计算搜索结果排序时,分析查询词和文档库中哪个文档更为相关的一个参考因素。

上图是比较复杂的,我们来看看文档频率为多个文档包含这个单词,如:“小明”在“4个文档”中出现了。“吃”在“4个文档”中出现了,后面的以此类推。倒排列表小明 (1;1<1>),1为文档1,中间的1为这个词在这个文档中出现的频率,<1>是这个词在文档中出现的位置1,即在文档中第一个词。
实战应用,在纸上谈的再多,不如通过实战去验证这个论点,是否对排名有帮助。下面就来看看。

以首页自然排名的10个网站的网页类型和标题为例:
首页,排名第一,“早点培训_早餐培训班_早点培训学校【免费吃住】”
首页,排名第二,“早餐培训_早餐培训班_早餐培训学校【免费加盟】”
首页,排名第三,“上海顶正小吃培训学校_早点培训_生煎包培训_烧烤培训全国最专.....”
首页,排名第四,“上海早点培训|重庆小面培训|山东杂粮饼培训|卤菜培训|小吃培训.......”
首页,排名第五,“小吃培训_特色小吃_小吃项目加盟-老灶台特色小吃培训学校”
内页,排名第六,“早点培训 正规早点培训班-培训通”
首页,排名第七,“艺尚食代-早餐早点培训”
首页,排名第八,“小吃培训,早点培训,上海面点培训,上海德志厨艺美食培训中心021-...”
首页,排名第九,“早餐店加盟_营养早餐加盟_特色早点加盟店_早餐店连锁加盟培训_开...”
内页,排名第十,“早点培训班 正宗早点培训中心-培训通”
分析得出:早点培训在这个10个网站中基本上都出现了2词,大家有没有发现早点和早餐是近义词,(比如:我早点吃了什么,我早餐吃了什么。这两句话表达的是同一个意思。)等于是增加了一遍词频,也就是3次了,在这里提醒大家关键词千万不要堆砌,要保持一个自然性。
另外通过之前的实验数据得出标题最左边的词权重最高,仅仅结合这两点,排名第一的网站标题做的比其他的网站标题都到位。另外标题结尾处“【免费吃住】”这是一个吸引用户点击的营销点,所以标题是技术与艺术的结合。
下图是网站从上线到目前的收录和权重的部分截图:

从上面的两张图片我们可以看出,这个网站的权重从2017年12月11日的站长权重是0,4天后权重到达1,还是比较轻松的。而且后来站内文章到投稿为止已经5个月没有更新了,为什么有些seoer天天更新文章,网站排名却做不起来?有小伙伴说如果不写文章,那么每天都不知道做些什么。
在我看来这个不是影响排名的重要因素,因为前期网站信任度做好可以节省后期的很多事情(PS:这就是佛系SEO,让网站自己让排名)。

通过上图发现早点培训这个词一直在首页第一,非常的稳定。所以通过算法来优化网站还是非常靠谱的。
搜索引擎是这个世界上最复杂的程序之一,公开的算法不胜其数,有兴趣的小伙伴们可以看看搜索引擎公司他们申请专利的一个文档,文档中也会涉及到高等数学等等知识,如果你能坚持的去看并且结合实践的话,那么你优化网站不用再靠猜排名了。
作者:秦羽 QQ:202696921 微信:aa1027846778
相关阅读:
草根站长这一年用血的教训换来的SEO终极算法
SEO快速排名算法独家揭秘
谈谈这三年来做SEO推广的酸甜苦辣
顶: 2踩: 0
  站长资讯 最新文章
月入5000,在北京怎么活?
淘宝自营“护肤品”精准引流加粉分享
如何因一个按钮错过50万的客户
知乎引流实操:日吸200精准粉丝玩法分享
系统下载站,一个被忽略的年入百万的项目
揭露时时彩日赚千元骗局
带你走进电商之城:莆田
670万建一个网站,史上最贵
网络营销怎么做,做什么最有效,最落地,你
刺激用户危机意识,实现快速盈利的营销思维
上一篇文章           查看所有文章
加:2018-06-13 00:28:09  更:2018-06-13 00:28:27 
 
技术频道: 站长资讯 .NET新手区 ASP.NET C# WinForm Silverlight WCF CLR WPF XNA Visual Studio ASP.NET MVC .NET控件开发 Entity Framework WinRT/Metro Java C++ PHP Delphi Python Ruby C语言 Erlang Go Swift Scala R语言 Verilog 其它语言 架构设计 面向对象 设计模式 领域驱动设计 Html/Css JavaScript jQuery HTML5 SharePoint GIS技术 SAP Oracle ERP Dynamics CRM K2 BPM 信息安全 企业信息化其他 Android开发 iOS开发 Windows Phone Windows Mobile 其他手机开发 敏捷开发 项目与团队管理 软件工程其他 SQL Server Oracle MySQL NoSQL 其它数据库 Windows 7 Windows Server Linux
脚本语言: vbs/VBScript DOS/BAT hta htc python perl 游戏相关 VBA 远程脚本 ColdFusion ruby专题 autoit seraphzone PowerShell linux shell Lua Golang Erlang 其它教程
网站开发: CSS/HTML/Xhtml html5 CSS XML/XSLT Dreamweaver教程 经验交流 开发者乐园 Android开发资料
360图书馆 软件开发资料 文字转语音 购物精选 软件下载 美食菜谱 新闻资讯 电影视频 小游戏 Chinese Culture 股票 租车
生肖星座 三丰软件 视频 开发 短信 中国文化 网文精选 搜图网 美图 阅读网 多播 租车 短信 看图 日历 万年历 2018年6日历
2018-6-24 9:23:23
多播视频美女直播
↓电视,电影,美女直播,迅雷资源↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT知识库