建站常识

搜索引擎设计需要解决哪些问题?

时间:2018-10-22 来源: 作者:

搜索引擎设计需要满足使用者的各种需求,于是就会出现各种需要解决的问题。

一、搜索引擎性能

搜索引擎性能的评价指标有以下几个:

① 响应时间

响应时间,是指用户发出搜索指令到得到搜索引擎结果页面之间所用时间(时延)。对于成熟的搜索引擎而言,很多时候,这个时延可能低于0.0几秒。Google搜索可以直接看到这个时间。

② 查询吞吐量

查询吞吐量,是指在一定时间内搜索引擎系统能够处理的查询数量。比如,一秒内可以承受100万个用户搜索数据。

③ 索引速度

索引速度,是指搜索引擎将已经收录的文档编排索引,从而提高搜索的速度。当用户搜索一个词时,搜索引擎可以直接利用这些索引,以便更快地给出搜索结果。

二、搜索引擎合并新数据的速度

搜索引擎几乎是时刻都需要将新数据合并到当前的索引中,这个过程有两点需要注意:

① 覆盖率

覆盖率,是指衡量现存信息有多少被索引和存储在搜索引擎中。搜索引擎对于互联网上的某些页面不予收录,对于另外一些页面可能只收录,却不加入索引。

② 时效性

时效性,又称“新近性”和“时新性”,是指搜索引擎库中存放的页面的时间或年龄。优质内容维度之一就是时效性,时效性的极致就是最新的新闻,几天内可以得到很高的排名和曝光,但热度下去之后,可能排名和曝光就会差很多了。

三、搜索引擎的可扩充性

搜索引擎的扩充性体现在以下几点:

① 用户数量的增长

从PC时代到智能手机时代,网民的数量暴涨,搜索用户数量也是直线上升。

② 数据量的增长

互联网信息爆炸时代,越来越多的页面被搜索引擎收录并索引,所需数据库也越来越大。

四、搜索引擎的可定制性

搜索引擎的可定制性,要求可以根据检索模型、排序算法、惩罚机制等来对搜索引擎的最终结果进行调整。所以,搜索引擎的可定制性,又可以称之为自适应性。

五、搜索引擎的特殊应用

搜索引擎为了处理某些情况,必须要有一定的特殊应用场景。比如,搜索引擎对于网站复制内容的判断。

一般来讲,搜索引擎发现优质网站有些许复制内容可能依然会给予很高的排名,因为信任度高。但是,如果一个恶劣采集站,整个网站几乎都没有优质原创文章的存在,那么搜索引擎如果在这个网站上发现复制内容,可能仅收录不索引,也可能连收录都不收录。

武汉优狐网络建站 一体化服务

网站基础服务

武汉网站建设提供域名注册、虚拟主机租赁、企业邮箱购买、网站ICP备案等网站基础服务产品
...

域名域名 空间空间 邮箱 备案备案

网站建设开发

武汉网站建设从网页界面设计、动效设计、前端执行到网站程序开发处处体现了高品质与丰富细节
...

设计设计 动效动效 前端前端 程序程序

售后技术维护

武汉网站建设免费向客户提供专业专心的全年网站售后技术维护、网站安全保障、网站数据备份等服务
...

365days365days 安全安全 备份备份

网站增值产品

>武汉优狐网络公司以营销为基本核心,提供搜索引擎优化、在线营销工具、移动分享等增值化服务产品
...

优化优化 营销营销 分享分享 二维码二维码