首页 > 网站建设行业资讯Media Reports

网站建设好后优化倒排索引?
时间:2017-12-13     来源:www.zjteam.com

杭州网站建设==帷拓小编说说 网站建设好后,优化倒排索引?  

1):正向说明还不能用于排名。假设用户搜索关键词2,如果只存在正想索引,排名程序需要扫描所有索引库中的文件,找出包含关键词2的文件,在进行相关性计算。这样的计算量无法满足实时返回排名的要求。所以搜索引擎会将正向索引库重新构造为倒排索引,把文件对应到关键词的映社转换为关键词到文件的映射,如下图:

 

在倒排索引中关键词是主键,每个关键词都对应着一系列的文件,这些文件中都出现了关键词。这样当用户索引中定位到这个关键词,就可以马上找出所有包含这个关键词的文件。

2)杭州网站建设==帷拓小编说说,链接关系计算:链接关系计算也是预处理中很重要的一部分。现在所有的主流搜索引擎排名因素中都包含网页之间的链接流动信息。搜索引擎在抓取页面内容后,必须事前计算出:页面上有那些链接指向指向那些其它页面,每个页面有那些导入链接,链接使用了什么描文字,这些复杂的链接指向关系形成了网站和页面的链接权重。GOOGLE PR值就是这种链接关系的主要体现之一。其他搜索引擎也都进行类似计算,虽然它们并不称为 PR。由于页面和链接数量巨大,网上的链接关系又时时处在更新中,因此链接关系及 PR 的计算要耗费很长的时间。关于 PR  的连接和分析,后面还有专门的文章介绍。

3)杭州网站建设==帷拓小编说说,特殊文件处理:除了H\TML文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如PDF,Word,WPS,XLS,PPT,TXT文件等。我们在搜索结果中也经常会看到这些文件类型。但目前的搜索引擎还不能处理图片和视频,对Flash这类非文字内容,以及脚本和程序以及进行有限的程序。虽然 搜索引擎 在识别图片及从Flash中提取文字内容方面有些进步,不过距离直接靠读取图片,视频,  Flash  内容返回结果的目标还很远。对图片,视频内容的排名还往往是依据与相关的文字内容,详细情况可以参考后面的整合搜索部分。

4) 杭州网站建设==帷拓小编说说,质量判断:

   在预处理阶段,搜索引擎会对页面内容的质量,链接质量等作出判断。近两年的百度绿萝,石留的算法,GOOGLE的熊猫,企鹅算发等都是预先计算,然后上线,而不是查询时实事时计算的。这里所说的质量判断包含很多因数,并不局限于针对关键词的提取和计算,或则针对链接进行数值计算。这里所说的质量判断包含很多因素,并不局限于针对关键词的提取和计算,或则针对链接进行数值计算。比如对页面内容的判断,很可能包括了用户体验,页面排版,广告布局,语法,页面打开速度等,也可能会涉及模式识别,机器学习,人工智能等方法。

在线预约 Online Booking


联系我们 Contact Us

全国统一业务咨询电话:0571-88023217邮箱:540877349@QQ.com
地址:杭州市 丰谭路380号 城西银泰城 B座12楼邮编:310030
业务咨询:0571-88023217传真:0571-88013217

关于我们 About Us

杭州网站建设帷拓科技有限公司是一家专业网络服务供应商,主营业务为杭州网站建设、杭州网站设计、杭州集团网站建设、杭州企业网站建设、杭州外贸网站建设、杭州营销型网站建设、杭州门户网站建设、杭州模板网站建设、杭州手机网站建设、杭州商城网站建设、杭州APP开发、微信公众号广告推广。

帷拓科技十三年专注 杭州网站建设杭州网站设计杭州网站制作,3000+客户网站设计案例,帷拓科技是浙江省最具竞争力的品牌网站建设公司。

帷拓WAP网站二维码

帷拓WAP网站

帷拓微信公众平台二维码

微信公众号

Copyright 2003-2016 Weetop all rights reserved 杭州帷拓科技有限公司版权所有 浙ICP备11013555号-2 法律顾问:陈乐年律师(浙江商瑞律师事务所)

浙公网安备 33010502002049号