360综合搜索引擎报告(合集)

时间:2019-05-14 03:05:52下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《360综合搜索引擎报告》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《360综合搜索引擎报告》。

第一篇:360综合搜索引擎报告

一、简介............................................................................................................1

二、发展势头.....................................................................................................1

三、未来趋势.....................................................................................................2

四、搜索特点.....................................................................................................2

四、优化推测.....................................................................................................3

五、与百度 谷歌相比较.....................................................................................4

六、技术特点.....................................................................................................4

360搜索引擎

地址:http://so.360.cn

一、简介

2012年8月16日,奇虎360低调推出综合搜索,360拥有强大的用户群和流量入口资源,这对其他搜索引擎将极具竞争力,该服务采用二级域名,整合了百度搜索、谷歌搜索内容,可实现平台间的快速切换。目前主要包括新闻搜索、网页搜索、微博搜索、视频搜索、MP3搜索、图片搜索、地图搜索、问答搜索、购物搜索,通过互联网信息的及时获取和主动呈现,为广大用户提供实用和便利的搜索服务。

二、发展势头

据站长之家、安卓论坛、丁香园等多家网站发布的流量来路数据,360搜索已快速超越搜狗、谷歌和腾讯搜搜,成为仅次于百度的中国第二大搜索引擎。此前,360综合搜索在8月16

日低调上线。在没有任何市场宣传的情况下,众多网站站长发现来自该搜索引擎的流量呈爆发式增长,短短5天时间就超越搜狗等老牌搜索引擎。业界认为,360旗下拥有数量庞大的浏览器和网址导航用户,随着360综合搜索全面铺开,其市场份额仍有较大上升空间。

站长之家流量来路数据显示,最近一天,通过360搜索访问该网站的独立IP达到11280个,超过腾讯SOSO(8706)、搜狗(6603)和谷歌(3414),占百度流量的14%;安卓论坛的数据则显示,360搜索同样是该论坛第二大来源站点。在此前由搜狗团队发布的评测报告中,360搜索品质在上线第一天已略优于腾讯SOSO。创新工场董事长兼CEO李开复认为,360第一个版本做到这样的地步很不容易,以后随着更多数据和调整还有进步空间。

三、未来趋势

360搜索目前还只是测试版,它的研发人员大部分来自于腾讯搜搜的离职员工而360搜索除了带有搜搜的基因之外还抄袭了百度搜狗等互联网搜索引擎的功能和设计,因此它的功能并不是特别的好用而目前360已经对360安全卫士和360安全浏览器用户的搜索引擎做出了默认更改为360搜索的指令因而360搜索获得了大约10%的市场份额,但是很多网友对于360的这一做法并不满意而对于360搜索的结果和功能也并不买账,所以360搜索的未来依旧是个变数。

四、搜索特点 1、360综合搜索引擎就是集合了其他搜索引擎,将多个单一的搜索引擎放在一起,提供了统一的搜索页面,当用户搜索关键词的时候他会把用户搜索的东西在百度,谷歌,等其他搜索引擎上的资源进行二次加工,去掉重复的,重新排序,经过整理后在给客户呈现。比如搜索“SEO”这个词360的综合搜索就会在不同搜索引擎搜索该词的结果,然后根据一些算法把这些资源进行排序,用户还可以自己转跳到百度或者谷歌上,去查看内容,目前还没有发现的有没有360的搜索引擎的抓去内容,虽然综合搜索和单一的搜索引擎还是有一定的差别,但是360这一举动证实了360想要做搜索引擎的野心。

2、搜索结果排名近似百度。搜索结果整体上和BD的排名结果有65%雷同,360综合搜索给老域名和信息发布网站和列表网站的权重高。

3、受关注程度现阶段还不够。当前在BD搜索360的下拉框里没有360搜索,这说明现阶段的影响力度不够,关注度也是有限的。4、360产品的捆绑效果。和腾讯产品与QQ绑定一样,建立在免费的安全卫士和杀毒软件基础上的360产品,也拥有着庞大的用户群。后期360肯定会把360综合搜索捆绑进他的安全卫士里面

5、关于产品

图片搜索:360调用的即刻搜索,百度和谷歌则自有 图片搜索:360调用的即刻搜索,百度和谷歌则自有; 视频搜索:360、百度、谷歌都自由;

地图、新闻搜索:360调用百度的,百度谷歌自有

四、优化推测

1、入驻360导航网站

360搜索引擎之所以流量可以非常迅速的增长,很大的因素是来自于它的导航网站,它的搜索引擎标题里面都没有摆脱360网址导航的字样,也是想要把它网址导航的用户能够更好的引导到搜索引擎上面。这也就是说360搜索的流量来源有较大部分是来自于它的导航网站,所以入驻到它的导航网站会很大的影响到360搜索的用户,增加我们网站被搜索的概率。

2、入驻360购物商城

目前360搜索的排名原理还很有待研究,不过它对于自己购物平台给予了人工的干预,排在所有网站的前面,所以360搜索对于它购物平台流量的增加是很大的。所以入驻到360购物商城就等于是在关键词排名上占据了绝对的优势。而且目前入驻到360商城的商家并不是非常多,在同品类下面竞争并不大,所以入驻之后,排名和流量会有相当的保障。只是它在搜索页给予展示的商品的原则还比较混乱,抓不到太多的规律。

3、增加百度优化的力度

360搜索的优化现在还无法去处理,不过在360搜索当中可以看到很多百度的产品,或许是因为要增加用户体验的原因,而且在搜索的结果当中,很多关键词上与百度是有类似的展示的。所以加大百度的搜索推广,对于360的搜索流量来说应该是有所帮助。至少在360搜索导航上列出的百度新闻、百度图片、百度知道等平台上加大推广力度是一定会增加360搜索流量的。4、360其他平台广告投放

360搜索广告目前还没有推出,不过毕竟360的搜索流量现在大多数还是来自于它其他的产品,能够增加它其他平台上用户的关注度,对于被搜索的机会有很大的帮助。

五、与百度 谷歌相比较

360比较倾向于百度,百度前3页内 360都会给予好的排名 baidu和google都在前两页 那么360会直接给排到第1页很靠前 网站域名年龄参考值很小 这一点有别于百度 网站每天更新,隔天快照 很容易进360首页 内容相关性在排名中影响不大

六、技术特点

1、工作原理

360搜索引擎有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网 页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,能搜集到绝大多数的网页。

2、处理网页

360搜索引擎抓到网页后,还做大量的预处理工作,提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。

3、提供检索服务

用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便 于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

第二篇:课堂开心辞典——搜索引擎综合实践活动

课堂开心辞典

——《网上信息检索策略与技巧》教学设计

4附:表1和竞赛题目

1竞赛题目 第一组:

1.中国月球探测计划的名称是()。2.请列举出至少四种常见的毒品。3.当今人类面临的五大问题是()。

4.昆虫和软体动物的肌肉组织分别是()5.《水浒传》中,有两位打虎英雄,在沂岭杀四虎的是

6.自古以来,汉字的书报是竖排的。1955年1月1日,有一家报纸首先实行横排。这家报纸是。7.ISO14000系列标准是国际标准化组织制定的有关()的系列标准。8.对违法犯罪受到刑事处罚的未成年人,由什么机构予以强制性教育改造? 9.奥林匹克勋章何时设立的,分哪几种?

10.2004年雅典奥运会,中国女排勇夺冠军,她们上次夺冠是在第几届奥运会上?

6第二组:

1.在2004年的第九届国际天文奥赛上,中国队获得()块奖牌。2.拘留是不是我国刑法规定的五种主刑之一? 3.环境污染的来源主要有哪四个方面? 4.两栖动物的排泄器官是()。5.《三国演义》中“煮酒论英雄”的主要人物是________。6.联合国的六种工作语言是

7.酸雨是指pH值的大气降水。

8.对未成年人犯罪案件,新闻报道不得披露该未成年人的姓名、住所、照片等,这是哪部法律规定的? 9.北京申办口号是什么?

10.香港将承办北京奥运会哪个项目的比赛? 第三组 1.“蟹状星云”在梅西叶星云星团表中的编号是()。2.制约人们行为和调节人们关系的两大社会规范是什么? 3.爆米花含有______________污染物。4.蝙蝠能产生超声波的部位在_________

5.请写出《水浒传》中最典型的反面人物6.《普通话水平测试等级标准》将普通话水平划分为

7.噪声的来源主要有交通噪声、工业噪声、建筑施工噪声和社会噪声。人耳开始感到疼痛的声音叫做痛阈,其声级为___分贝左右。

8.驾驶自行车、电动自行车、三轮车在路段上横过机动车道,应当怎么做? 9.中国第一块奥运会金牌获得者是谁? 10.请列举北京奥运会的6座协办城市? 第四组

1.中国发现近地小行星最多的单位是()。2.机械加工用的三棱刮刀是不是属于管制刀具? 3.城镇环境空气质量一般执行________级标准。

4.一种被称为“公孙树”和“活化石”的雌雄异株植物叫_________ 5.鲁达在打死郑屠后,逃到五台山出家,法名为6.依据《汉语拼音方案》,普通话的声调有7.汽车尾气是全球范围最严重的污染源。8.高速公路限速标志标明的最高时速是()公里 9.2008吉祥物福娃的名字分别是什么? 10.奥林匹克宗旨的高度概括是什么? 第五组

1.银河在哪两个()相邻的星座之间穿过?

2.盗窃公私财物价值人民币多少元以上被称为数额特别巨大? 3.我国第一个自然保护区是千岛湖自然保护区? 4.最早的苔藓植物起源于()5.《红楼梦》中向传统的男尊女卑的思想挑战的人物是谁? 6.国家通用语言——普通话的标准音指的是

7.虫眼越多的菜说明没有施用农药,所以更安全。是否正确? 8.禁止未成年人进入网吧是哪部法律规定的? 9.北京奥运会开幕式将在哪个体育馆举行?

10.中国男子第一个获得奥运会金牌的运动员是谁?中国女子第一个获得奥运会金牌的运动员是谁?

第三篇:搜索引擎实验报告

电子科技大学

实验报告

学生姓名:罗佳学号:2014120101013

指导教师:汤志伟

一、实验室名称:

电子政务可视化实验室

二、实验项目名称:

搜索引擎学习课程

三、实验原理:

搜索引擎框限定

四、实验目的:

百度的使命是“让人们更便捷地获取信息,找到所求”。Google的使命的是“整合全球信息,让人人皆可访问并从中受益。” 搜索引擎自己标榜的使命写的比较宏大,其实简单就说是:用户搜索任何关键词时都能找需要的信息。

学会运用这些搜索引擎的各种便捷方法,能让我们节省很多时间和精力,带来最满意的用户体验

五、实验内容:

采取一定的技术手段、方式和方法获取信息

六、实验器材(设备、元器件):

笔记本电脑,百度

七、实验步骤:

根据题意,对每一步提示进行操作。截图进行分析

八、实验数据及结果分析:

(1)简单查询 查询电子科技大学

(2)“”双引号完全匹配查询

查询成都小吃,没有用双引号时出现了很多美食鉴赏类的

查询“成都小吃”,结果就是完整的(3)-减号——排除查询

查询白百何会出现很多和陈羽凡有关系的消息

查询白百何 –陈羽凡,就不会出现陈羽凡的消息

(4)空格——“与”逻辑

查询三生三世十里桃花歌曲下载

查询白百何陈羽凡(5)| 分隔符——“或”逻辑 查询成都大学

查询成都|大学

(6)filetype ——指定文件类型 查询学生名单

查询学生名单filetypePDF

(7)intitle ——限定搜索标题 查询琼瑶

查询intitle:琼瑶

(8)site ——限定搜索站点 查询白百何出轨

查询白百何出轨site: http://weibo.com/

(9)inurl ——限定搜索地址 查询白百何出轨

查询白百何出轨inurl:腾讯

(10)短语检索 查询“北京大学”

查询“北京”“大学”

九、实验结论: 随着计算机的普及以及信息工程的日益发展,从网上获取信息已经成为人们的日常生活和工作一个重要途径,互联网如今已成为一个资源不断丰富的平台,整个互联网逐渐成为一个信息量超大的资源存储空间。

因此怎样有效而又快捷的从海量数据中获取所需的信息就成为一件困难的事情,搜索引擎的出现正是为了解决“信息丰富,获取困难”的问题的一种信息检索服务。搜索引擎被称为是一个信息处理和获取的黑盒子,通过一定的规则在互联网中爬取信息资源以及对信息进行处理和提取,对外提供接口方便用户查询,从而起到指导用户获取信息的作用,主要由采集信息、组织并处理信息和查询接口三部分组成。搜索引擎对于用户来说就是一个为其提供信息搜索功能的查询工具。搜索引擎所具有的研究价值、实用价值以及商业价值是其在当今信息时代获得成功的重要因素。

十、总结及心得体会:

学会使用简单的搜索技巧,来提高自己工作效率

十一、对本实验过程及方法、手段的改进建议:

1、建议使用Google搜索,结果更准确和方便

2、搜索时要明确关键词,找到最简单的方法。

报告评分: 指导教师签字:

第四篇:信息检索与搜索引擎课程报告

《信息检索搜索引擎技术》

期末考试报告

学 期:2016-2017学年第一学期

任课教师:毛存礼 专业年级: 计科133 学 号:201310405339、201310405326、201310405330、201310405325 学生姓名:李然、毛子铭、张倩、黄枫

目录

一、系统概述................................................................................................................................3

二、系统需求分析........................................................................................................................3 2.1功能需求分析....................................................................................................................3

三、程序实现................................................................................................................................4 3.1 爬虫的实现.......................................................................................................................4 3.1.1 对网页进行分析...................................................................................................4 3.1.2编写爬虫................................................................................................................5 3.2索引的实现........................................................................................................................7 3.2.1分词的实现............................................................................................................7 3.2.2索引的建立............................................................................................................8 3.2.3检索索引................................................................................................................9 3.3向量空间模型的实现......................................................................................................10 3.3.1向量空间模型概述..............................................................................................10 3.3.2建立向量空间模型..............................................................................................11 3.4利用Lucene打分机制对文档打分................................................................................13

四、测试......................................................................................................................................14

五、心得体会..............................................................................................................................17

一、系统概述

随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将Intenet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索做出响应,提供用户所需的信息或相关指针。

用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。本系统基于HTMLUNIT框架,构建爬虫,基于LUCENE框架,构建索引,利用向量空间模型向量化表示文档间的相关性,利用LUCENE给相关文档打分。

二、系统需求分析

2.1功能需求分析

该系统分为四个功能模块:

(1)爬虫模块(2)索引模块(3)向量化表示模块(4)打分模块 具体实现分工如下:

①爬虫模块:该模块采用Htmlunit框架,主要负责爬取网页内容,在本地建立文档库,以便于索引功能模块,将文档库里的文档内容建立成索引。(毛子铭所做)

②索引模块:该模块采用Lucene框架,功能分为两块:一是建立索引,将爬取的内容建立成索引。二是检索索引,即提供给用户检索索引。(张倩所做)

③向量化表示模块:该模块采用向量空间模型,其功能是将查询文本和文档向量化表示,以一种直观的表示方法,展示出文档间的相似度。(李然、黄枫合做)

④打分模块:该模块采用Lucene打分系统,计算查询文本和文档的相似度,并对其文档打分。(李然、黄枫合做)

三、程序实现

3.1 爬虫的实现

3.1.1 对网页进行分析

(1)我们首先,对网页进行分析,昆工新闻上每一则新闻,都有相应的链接,通过点击链接查看相应的新闻。

<1>昆工新闻网页截图

<2>新闻内容截图

(2)在浏览器中,查看新闻网的代码,确定我们所需要的内容并用XPATH表达式定位其内容。

<3>新闻代码截图

3.1.2编写爬虫

(1)在这里,我们使用了HtmlUnit作为我们爬虫的框架,并指定内容,对昆工新闻网进行爬取。

<4> 部分代码展示

(2)编写XPATH表达式,定位所抓取的内容,在爬取过程中,首先要找到新闻的标题,然后,再模拟点击标题的动作,进入新闻页面。

(3)爬取内容,并将其写入文本文档中。

<5> 写入文档

<6>爬取内容

3.2索引的实现

3.2.1分词的实现

(1)在建立索引之前,分词是必不可少的步骤,我们所采用的是基于Lucene框架的IK分词技术分词。

<7> 部分代码展示

(2)对爬取的内容,进行分词测试。

<9>测试

3.2.2索引的建立

(1)索引的建立,我们也是基于Lucene框架建立的倒排索引,分词技术的不同索引的差别也是很大,因此,分词技术的选取一定要合理。

<10> 部分代码展示

3.2.3检索索引

(1)在这里,我们对爬取好的内容,已经建立好了索引,我们分别测试了“宇宙”、“人民”这两关键词进行检索。可以看见,符合“人民”这个关键词的文档有2个,符合“宇宙”这个关键词的文档不存在。

<12> 索引

<13> 索引结果

3.3向量空间模型的实现

3.3.1向量空间模型概述

向量空间模型将文档映射为一个特征向量V(d)=(t1,ω1(d);„;tn, ωn(d)),其中ti(i=1,2, „,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值, 一般被定义为ti在d中出现频率tfi(d)的函数,即。

在信息检索中常用的词条权值计算方法为 TF-IDF 函数,其中N为所有文档的数目,ni为含有词条ti的文档数目。TF-IDF公式有很多变种,下面是一个常用的TF-IDF公式:

根据TF-IDF公式,文档集中包含某一词条的文档越多,说明它区分文档类别属性的能力越低,其权值越小;另一方面,某一文档中某一词条出现的频率越高,说明它区分文档内容属性的能力越强,其权值越大。两文档之间的相似度可以用其对应的向量之间的夹角余弦来表示,即文档di,dj的相似度可以表示为:

进行查询的过程中,先将查询条件Q进行向量化,主要依据布尔模型:当ti在查询条件Q中时,将对应的第i坐标置为1,否则置为0,即:

从而文档d与查询Q的相似度为:

根据文档之间的相似度,结合机器学习的一些算法如神经网络算法,K-近邻算法和贝叶斯分类算法等,可以将文档集分类划分为一些小的文档子集。

在查询过程中,可以计算出每个文档与查询的相似度,进而可以根据相似度的大小,将查询的结果进行排序。

向量空间模型可以实现文档的自动分类和对查询结果的相似度排序,能够有效提高检索效率;它的缺点是相似度的计算量大,当有新文档加入时,则必须重新计算词的权值。

3.3.2建立向量空间模型

(1)将文档的前十五个关键字作为key并将文件的内容作为value存Treemap中

<14> 部分代码展示

(2)求两个词项的并集

<15> 部分代码展示

(3)求两个词项的交集

<15> 部分代码展示

(4)计算文章相似度

<16> 部分代码展示

(5)计算公式:

3.4利用Lucene打分机制对文档打分

(1)在这里,我们是基于Lucene框架,利用其自带打分系统,对查询文本和文档计算它们的相似度,再进行打分。

Lucene打分公式如下:

(2)计算查询文本(TermQuery)与文档的相似度进行打分。

(3)在查找“人民”这两个关键词后出现两个相关文档,它们分别的得分为0.47782254和0.3901917,这说明第一个文档更符合查询

<17> 打分

四、测试

<18> 测试截图1

<19> 测试截图2

<20> 测试截图3

<21> 测试截图4

<22> 测试截图5

<23> 测试截图6

<24> 测试截图7

<25> 测试截图8

<26> 测试截图9

五、心得体会

此次报告要求实现第一个信息检索系统,涉及到多线程编程、排序、网络爬虫等多项技术。多线程是提高效率的一个非常重要的途径,比如计算机并行计算等,本次实验完成了多线程的任务,对网络间通信以及搜索引擎如何实现向海量用户在很短时间内提供服务有了更深刻的认识。通过实验我也认识到了多线程编程的边缘。在下一步的研究学习之中有很大助力。

在此基础之上建立检索,通过对于索引的检索,一方面可以加深对于索引的深层认识,另一方面又可以是我们运用知识与学习知识相结合,可以使我们学的更好,运用的有理可循。

搜索引擎的处理对象是互联网网页,日前网页数量不计其数。所以搜索引擎首先面临的问题就是:如何能够设计出高效的查询以及下载系统。网络爬虫是搜索引擎中很关键也很基础的构建,通过网络爬虫的设计,加深了我对实验原理的理解,同时也加强了自身的实践能力。

第五篇:2007年国内视频搜索引擎分析报告

2007年国内视频搜索引擎分析报告

一,背景

互联网正在经历着飞速发展的时代,在过去短短的几年里互联网从以telnet,email为代表的粗陋文本时代,一跃发展为丰富的宽带多媒体时代。互联网基础设施的快速改善,使我们今天不仅可以通过互联网欣赏到丰富多彩的图文内容,还可以进行视频通讯和网络游戏。

网络视频做为一个行业进入人们的视野是从美国Youtube的奇迹开始的,随之便一发而不可收,仅2006年以来,中国互联网行业如雨后春笋一样涌出300多家网络视频企业,相当于平均每周诞生2家,网络上的视频数量也已成爆炸式增长。

在线搜索服务超越电子邮件,已成为今天网民最常用的互联网应用。视频搜索定将成为搜索引擎服务业新的竞争点。

二,分析对象

国内的视频搜索引擎服务商几乎都是近1年内出现的,大体可分为门户类和专业类两种。而多数搜索引擎技术却大同小异,这些视频搜索引擎是否能够满足视频用户日趋增加的需求?现在已经完善到什么程度?未来会向哪些方向发展?让我们共同体验有可能成为引领此番网络视频革命的先驱们。

谷歌(http://video.google.cn/)

9月21日正式对外发布。有热门、幽默、娱乐、体育、音乐和动画六大栏目。并对当天100大视频进行排行。百度(http://video.baidu.com/)

汇集了几十个在线视频分享网站的视频索引资源而建立。Leexoo(http://www.xiexiebang.com.yahoo.com/)

搜索结果均来自于同一个视频网站,所以不计入分析队列。搜搜(http://video.soso.com/)

搜索技术和搜索结果均套用Openv的数据,所以不计入分析队列。三,分析

为了更好的对以上具有代表性的视频搜索引擎有个更深入的了解,现以一些网民和行业共同关注的数据对其进行评测,举例说明。1,搜索结果数量:

方法:通过在几个网站输入“美女”、“搞笑”、“nba”等常用视频搜索关键字,统计其返回的实际有效搜索结果数(通过一直向下翻页,去掉重复结果)。结果数愈多,代表搜索结果越丰富。谷歌:标注结果与可显示结果数不符,平均搜索结果量约1000。百度:标注结果与可显示结果数不符,平均搜索结果量约2000。Leexoo:平均搜索结果量约40000。

Openv:标注结果与可显示结果数不符,平均搜索结果量约1100。Pcpie:标注结果与可显示结果数不符,平均搜索结果量约3500。搜狗:标注结果与可显示结果数不符,平均搜索结果量约2000。爱问:标注结果与可显示结果数不符,平均搜索结果量约1000。

小结:Leexoo的数据相比而言更真实。虽然网民对于搜索结果很少翻到10页以后,但是这绝不说明搜索引擎可以肆无忌惮的狂编出几百万的虚构数据,再者,对于内容表现更为丰富且更加强调娱乐性的视频而言,用户对传统文本搜索结果很少翻到10页以后的这一行为习惯也正在改变。总之,对搜索引擎服务商而言,也许你们索引库有很多内容,但是你们还是应该按照用户能看得到的内容数目告诉用户。

2,搜索内容丰富:

方法:通过在几个网站输入“输入法”、“螺丝”、“autocad”等非常用视频搜索关键字,统计其返回的实际有效搜索结果数。结果数愈多,代表搜索结果越丰富。

谷歌:标注结果与可显示结果数不符,平均搜索结果量约300。百度:标注结果与可显示结果数不符,平均搜索结果量约800。Leexoo:平均搜索结果量约20。Openv:平均搜索结果量约30。

Pcpie:标注结果与可显示结果数不符,平均搜索结果量约30。搜狗:标注结果与可显示结果数不符,平均搜索结果量约400。爱问:标注结果与可显示结果数不符,平均搜索结果量约200。

小结:这个结果可见传统大公司的实力和积累。百度不愧是中文第一搜索引擎。Pcpie,Openv,Leexoo的规模还是比较小。

3,搜索结果信息丰富程度和用户体验 支持的用“Y”表示,不支持的用“N”表示

比较项目 谷歌 视频代表图片 Y Title Y

N 描述信息

N 格式

N 大小

Y 时长

视频上网时间 N 视频观看次数 N

N 视频预览

视频摘要帧 Y

小结:

百度 Y Y N N N N N N N N Leexoo Openv Y N Y Y Y Y Y N Y N Y N Y N Y N Y Y Y N Pcpie

Y Y N N N N N N Y N 搜狗 Y Y N N N N N N N N 爱问 Y Y N N N Y Y N N N

1、从这张表,可以看出来各个视频搜索的技术特点,传统文本搜索引擎服务商,对视频的搜索结果,仍是以文本表现方式为主,几乎都不提供更能体现视频内容特点的视频预览和视频摘要,反而是Leexoo这种新兴的以视频处理技术见长的小公司,更能在搜索结果中体现视频本身的特点。

2、这张表,反映出不同视频搜索引擎服务商对于用户在视频搜索方面的体验的把握程度。网络视频以用户上传为主,其文本描述信息极为简单甚至没有,或者干脆“文不对题”。而传统文本搜索引擎服务商,仍是以擅长的文字表现为主,但由于搜索结果中不能体现视频内容特征,主导用户点击行为的仍然是排序。而Leexoo这种新兴的视频搜索服务商,由于其结果中对于每一个视频结果均给出了7帧摘要帧图片,以及一段视频的预览,用户可以不必通过文本,直接通过图片以及视频预览片断可以更直观地选择视频。显然,这种方式对视频搜索用户而言更加友好,更加直观,颠覆了传统文本搜索所建立的按照排序来点击搜索结果的用户行为习惯。

3、百度等搜索引擎甚至连视频的文本描述信息都没有给出来。

4、传统文本搜索引擎服务商在视频搜索的技术和用户体验方面,落后于新兴的服务商。业内传言,百度甚至没有自己的视频搜索蜘蛛,只是每天向各个视频网站索要其视频索引信息来提供搜索服务,从结果来看,有一定的依据。

4,搜索准确性和有效性:

通过输入不同关键词的搜索结果进行分析。

谷歌:根据视频内容的文本信息(标题、说明、标签等)进行分类显示。显示最相关的结果,而省略了部分与已显示的结果相似的条目。百度:根据视频内容的文本信息进行分类显示。

Leexoo:通过对视频内容的视觉特征和文本信息分析而显示出相应的结果。准确率颇高。Openv:通过Autonamy的技术在电视类视频的搜索上有很高准确率。Pcpie:通过测试,准确率不是很高,远没有达到号称按帧搜索的精度。搜狗:根据视频内容的文本信息进行分类显示。爱问:根据视频内容的文本信息进行分类显示。

小结:Leexoo的视频特征分析技术在视频搜索上占有了绝对的优势。Openv则依靠Autonamy的语音识别技术在电视类视频上取得了领先。其他的搜索引擎则只能依靠对标签等文字信息的分析进行检索。Pcpie号称“帧搜索”而实际精准度却很难说服大众。

5,可搜索的视频分类。

支持的用“Y”表示,不支持的用“N”表示

比较项目 在线视频 手机视频 P2P视频 谷歌 Y N N 百度 Y N N Leexoo Openv Y Y Y N Y N Pcpie

Y Y N 搜狗 Y N N 爱问 Y N N

小结:视频搜索引擎应该是广义的对互联网上所有的视频文件进行搜索的引擎。而不是窄意的只对以flash视频为代表的在线视频的搜索。Leexoo对互联网上三大类视频都做了索引。Pcpie只对手机视频和在线视频加以区分,其他搜索引擎依然最基本的搜索格式。

6,搜索来源广泛性

通过输入不同“site:网址”或通过关键词查询组合进行分析。

谷歌:内容来源约20个。百度:内容来源约40个。Leexoo:内容来源约70个。Openv:内容来源约70个。Pcpie:内容来源约30个。搜狗:内容来源约40个。爱问:内容来源约40个。

小结:Leexoo在全国号称有300余家视频网站中收录了约1/4,基本功颇为扎实。Openv的内容来源分为电视类视频和网络类视频两部分,其电视类视频占总视频来源大约2/3。其他搜索引擎则基本在一个水平线上,唯有谷歌刚刚步入视频搜索这个行列,该做的事还真的很多。

7,特色功能 谷歌:

1,搜索结果支持rss订阅。2,视频内容的评级和举报。

3,部分视频内容具有缩略图功能。百度:

1,搜索结果矩阵显示,每页多达20个。2,内容较为全面的视频专题。Leexoo:

1,搜索结果支持视频片段预览。

2,搜索结果提供按内容变换而截取的7个预览图片。3,搜索结果去除部分重复视频。

4,提供图片搜索视频及视频搜索视频服务。5,提供不良视频举报功能。Openv:

1,搜索结果支持矩阵和列表两种显示方式。2,搜索结果支持视频片段预览。Pcpie:

1,首页有搜索和门户两种模式。2,提供放映大厅和上传视频服务。搜狗:

1,搜索结果矩阵显示,每页多达20个。2,搜索关键词排行榜。

3,支持在结果中搜索功能。爱问:

1,搜索结果支持按相关性和按时间排序两种显示方式。2,搜索结果提供搜索视频和搜索专辑两种选项。

小结:显示样式和排序方式的变化已不足以区分搜索引擎有何质的改变,所以多数搜索引擎其实都处于同一档次上。其中谷歌的搜索结果支持rss订阅是一个创新,但不会成为其领先于其他搜索引擎的技术壁垒;Pcpie的头像搜索也仅仅是个初级的模型,并没有真正的使用。视频和文本的最大不同就在于视频是非结构化的数据,能否做到脱离标题,标签等具有诱惑性的说明而直接去对实质内容进行分析,并给网民以真实的反馈,这将成为搜索引擎质变的门槛。真正具有质变潜质的是Leexoo,搜索结果提供按内容变换而截取的7个预览图片,说明了其技术可以做到按视频内容进行搜索,而提供图片搜索视频及视频搜索视频服务则是进一步证明了此能力。

8,界面友好程度

谷歌:默认搜索结果页面占据页面显示面积上部的1/4来做自己的栏框,即使有“收起”和“移除”选项,也显得是那么不的协调。用户有时候不能直接完整观看视频,需要下拉。

百度:页面清晰,整洁。搜索列表页面每页最多显示20个视频内容并显示一帧概况图。

Leexoo:页面清晰。既延续了传统的搜索引擎显示样式,又突破性的开拓了符合视频展示的方式。Openv:页面清晰,分类明确。Pcpie:页面清晰,分类详细。

搜狗:页面清晰,整洁。搜索列表页面每页最多显示20个视频内容并显示一针概况图。爱问:搜索结果分两列显示,侧重于页面左侧。

小结:搜索引擎是个内容的入口,一般给人以清晰,简单的感觉即可。在这方面几大搜索引擎都有各自的优势。百度和搜狗的页面样式非常相似,简单又清晰;Leexoo的按视频内容截取的7个关键帧显示方式比较有特色;Openv和Pcpie的分类比较准确和详细。但是谷歌在这方面做的还不够好,不像是Google这个品牌做的,有点像个人站长做的,不够大气。爱问最好也适当调整版面。

9,用户体验

谷歌:UI粗糙,内容较少。不太符合谷歌这种大品牌的定位。

百度:内容较丰富,页面简单,相信这两点赚了不少印象分。但是对内容的描述信息不够全面。

Leexoo:是一个可以改变用户习惯的视频搜索引擎。使用户的焦点不再是按自上而下的顺序寻找所关注的内容。而是全面的概览后直接选取所需,节省了大量时间,从而提高搜索效率。其图片搜索视频和视频搜索视频服务还有待观察。Openv:电视类视频专题做的颇具特色。首页的电视墙做得很眩,不过实际用处不大,反而因此令首页打开较慢。Pcpie:翻页条在右侧别具一格。搜索准确度有待提高。搜狗:同百度一样的样式,区分在于各自的品牌实力。

爱问:新浪播客的视频占据了绝大多数,更多是新浪的站内视频搜索。

小结:除去做电视类视频搜索的Openv不说,目前用户体验最好的是百度和搜狗。最有竞争潜力的是Leexoo。其搜索结果以视觉特征方式展现,提供视频的摘要帧图片和视频预览片断的方式,有可能会改变用户对视频搜索结果的浏览习惯,这是非常具有创造性的。不过Openv在1年半时间更换了4次网页风格,Pcpie在不到1年时间内更换了4次网页风格。这对于用户体验来说,不是个很好的做法。

10,更新频率

方法:通过列举最新发生的热点视频,观察被搜索引擎收录的时间,来统计视频搜索引擎的更新频率。谷歌:1天 百度:2天 Leexoo:1天 Openv:1天 Pcpie:至少3天以上 搜狗:2天以上 爱问:1小时

小结:视频搜索引擎的基本更新频率是1天,Leexoo、Openv、谷歌都做到了这个平均值,爱问确实表现颇为出色,而大于1天的则需要努力了。

11,技术实力

支持的用“Y”表示,不支持的用“N”表示

比较项目 谷歌

Y 文本搜索视频

图片/视频搜索视频 N 内容采集的智能抓取 Y

N 视觉特征索引

视频概念和段落识别 N

N 视频自动分类

N 自动聚合和查重

有害视频检测过滤 N

百度 Y N N N N N N N Leexoo Openv Y Y Y N Y N Y N Y N Y N Y N Y N Pcpie 搜狗

Y Y N N Y N N N N N N N Y N Y N 爱问

Y N N N N N N N

小结:由于视频搜索和文本搜索的本质不同,按照文本搜索的模式来做视频搜索肯定是不对的。Leexoo由于掌握了视频搜索所要求的基本技术,所以获得了领先优势,并且是门槛级的优势,谷歌等传统搜索引擎还有很多待于完善。Openv和Pcpie迈出了一小步,由此更加证明了视频搜索是具有技术门槛,需要有真实实力的产品。

12,支持格式

基本都是以flv为主,并包括目前网上主流的视频格式rm, rmvb, wmv, asf, mpg, mpeg, avi,3gp,mov等。

13,被文本搜索引擎收录的情况(site:)

Google 谷歌:45 百度:20,900 Leexoo:7,350 Openv:6,820 Pcpie:72,500 搜狗:80,100 爱问:383,000

百度 谷歌:12 百度:402,000 Leexoo:4,350 Openv:184 Pcpie:73,300 搜狗:138 爱问:109

小结:所有视频搜索引擎从被收录的网页数量上看,google的文本搜索引擎收录的明显大于百度 Pcpie在搜索引擎优化(SEO)方面下了功夫,在两大文本搜索引擎中,表现相对不错。

Gogole文本搜索引擎对自己的视频搜索引擎只收录了区区45个,可被评为2007最无私的企业。而百度正好相反,胳膊肘绝不外拐,不知道是技术水平与google有差距?还是出于商业策略的考虑。

14,视频搜索排行榜

谷歌:提供每天更新的前100个搜索排行。百度:无搜索排行榜

Leexoo:提供两种排行:一是将视频自动分为9类,提供这9类视频中每天最热门的视频排行榜;二是整合9大热门视频网站的搜索排行榜。

Openv:提供12种类型的分类排行榜。Pcpie:无搜索排行榜 搜狗:无搜索排行榜 爱问:无搜索排行榜

小结:作为一个全网的视频搜索引擎来讲,能站在全视频行业角度去对视频内容,网民搜索行为进行分析,是最基本的要求。最直观的外在表现就是视频搜索排行榜。现只有三家提供视频搜索排行榜:谷歌对当天的搜索内容进行排行,稍显不够全面。Leexoo的排行相对不错。Openv提供的搜索排行榜偏向于电视类媒体,这正是他们的强项。

还有些其他参数在这里就不详细一一列举。

四,总结

谷歌:目前在其搜索网站上没有什么体现视频搜索方面的新技术,据说,Google的视频采集爬虫尚处于初级阶段,需要针对每一家视频网站开发专门的采集器。

与.COM的Google视频搜索相比,可是被阉割的厉害,甚至连提交收录视频网站的最基本功能都没有,做个除了搜索什么功能都没有纯粹的“视频搜索引擎”。而说到搜索,最可笑的是谷歌连自家Google Video以及Youtube的视频内容都不收录。如此疲于赶场式的谷歌视频搜索,真是让所视频搜索用户贻笑大方。百度:目前在其搜索网站上没有什么体现视频搜索方面的新技术,其视频索引主要来自于各个视频网站每天直接给百度的贡献——百度还没有自己的网络视频爬虫。百度曾跟Autonomy合作,希望采用后者的技术,但是后者同时是Openv的核心技术提供商。最近传闻,百度还在四处寻找和采购新的视频搜索与分析技术。没有过多的修饰,没有过多的步骤,一切从简。

Leexoo:从网络视频爬虫、采集、分析到索引,拥有全线核心技术,发展潜力比较大。或许不是最大的,但绝对是最有潜力的,因为技术实在高出一截,因为对视频的理解确实够深刻。Openv:视频搜索引擎技术来自国际上领先的非结构化搜索技术提供商Autonomy,但是,Autonomy的技术是对音频的分析,对于视频搜索引擎还不存在缺陷,同时,Openv在网络视频的爬虫技术上还是空白。另外,由于核心技术受制他人,难以保证及时响应中国互联网视频搜索用户的需求。事实上,Openv已经更多的转变为一个面向电视台的搜索技术服务提供商+视频分享网站。

电视视频与网络视频的结合,是一大特点,到底能有多大市场,还有待于时间检验。Pcpie:具有视频分享网站类似的广告模式,具有视频搜索引擎相近的功能。号称按帧搜索,结果比标签搜索还不准确。在视频搜索领域里尚缺乏核心竞争优势。值得一提的是技术研发团队在哪里,似乎是海外????? 搜狗:虽然与百度基本相同,但是在结果中的二次搜索功能可以很方便的把搜索结果再次细分,搜狗的技术特点体现在了细微之处,可谓用心良苦。爱问:包括热门推荐、最新上传等等。爱问视频搜索并不是要做视频搜索引擎,而是想以“视频搜索”吸引用户过来尝试,再以此为基础创建一个视频分享的社区。

目前来看,最好的视频搜索是百度,其在内容、用户体验、页面等方面占据优势,这得益于其在国内文本搜索领域里的统治地位。但是致命的弱点是其未能突破文字搜索转换成视频搜索的技术门槛,在视频搜索领域缺乏最基本的技术支撑。可以预见未来的视频搜索行业中,Leexoo将会是最强有力的竞争者,其是以对视频特征分析的技术构建行业壁垒,提高搜索精准度,进而影响用户体验。搜索引擎是以技术为主导的产品,Leexoo已经具备颠覆视频搜索行业的基本潜质。

2006年视频行业呈现了超强的发展势头,2007年视频网站之间的竞争变得越发激烈,而视频搜索引擎的对决会为时不远,谁能更好的满足网民的需求,谁又能引领视频搜索行业的方向性发展。让我们拭目以待,不过还是先祝愿大家都尽情发挥自己的优势,一路走好。

下载360综合搜索引擎报告(合集)word格式文档
下载360综合搜索引擎报告(合集).doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    搜索引擎营销策略

    现代商业模式与传统商业模式的区别与联系 201452133 游逸飞 现代商业模式主要分为三种: 1、店铺模式 一般地说,服务业的商业模式要比制造业和零售业的商业模式更复杂。最古老......

    网站搜索引擎工作总结

    网站搜索引擎工作总结 网站搜索引擎工作总结一、概述 我之前一直是在类似于联创、合众的平台上工作,虽然对新闻源有些面上的了解,却一直没有到企业客户端工作的实际经验,但是就......

    搜索引擎教学设计

    搜索引擎教学设计 搜索引擎教学设计 [学习目标] 1、知识与技能 掌握网络信息检索的几种主要策略与技巧; 了解搜索引擎的相关知识(简单分类、工作原理、帮助系统等)2、过程与方......

    搜索引擎的学习心得

    搜索引擎的学习心得体会 我们身处在一个信息时代,可以通过很多途径接触到关于生活、学习等各方面的知识,但是如何在浩渺的信息海洋里快速而准确地找到我们所需要的东西呢,这成......

    网络搜索引擎实验报告

    实验名称: 网络搜索引擎营销-我们熟悉的搜索引擎有哪些我们所不熟悉的内容  实验目的: 让学生通过访问百度和Google,认真了解和学习网络搜索引擎怎么帮助企业推广,从网络营......

    搜索引擎教学反思

    《搜索引擎》教学反思 本节课以“搜索引擎”作为课程整合的切入点,采用主题任务进行驱动教学,有意识的开展信息技术与研究性学习相联系的横向综合的教学,涉及语文、英语、物理......

    《搜索引擎》教学设计

    《搜索引擎》教学设计 一、教学目标 1、关于知识方面: (1)让学生了解搜索引擎的概念; (2)是学生了解当下流行的相关搜索引擎有哪些。 (3)使学生掌握利用搜索引擎查找资料的方法。 2......

    搜索引擎SCP分析

    搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统 全文:从互联网提......