关于搜索引擎的研究论文[共五篇]

时间:2019-11-04 23:48:11下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《关于搜索引擎的研究论文》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《关于搜索引擎的研究论文》。

第一篇:关于搜索引擎的研究论文

摘要:搜索引擎的出现,把互联网产品的技术水平提高到了一个新的高度。本文首先介绍搜索引擎技术的发展历程,其次简要介绍了搜索引擎关键技术和产品;随着移动终端智能化和互联网用户个性化以及社交化为中心的融合趋势下的发展,催生了很多新型应用。结合目前管理信息系统互联网化的发展方向,详细介绍了搜索引擎在管理信息系统中的一整套应用案例。

关键词:搜索引擎; 搜索引擎技术; 搜索引擎产品; 搜索引擎在管理信息系统中案例; 搜索引擎发展趋势;

Discussion on search engine

Abstract:The emergence of search engine takes the Internet product technology to a new level.This article first introduces the development of search engine technology, then introduces search engine's key technologies and products.With the intelligent mobile terminals, services users personalized services, and social network integration as the center of the trend, a lot of new applications have emerged.Combined with the development direction of the current management MIS system, this article introduces the application case of search engine in MIS system.Keyword:search engine;search engine technology;search engine product;search engine in management information system case;search engine development trend;

1、引言

搜索引擎的诞生源自互联网最根本的用途之一:信息获取。

在搜索引擎出现之前,互联网缺少入口,用户往往需要自己记住有用的网站和网页。为了满足这种需求,最早的“搜索引擎”, 即分类目录浏览式的引擎便出现了,Yahoo就是其中的代表。最初只是采用把一些有用的网站通过分类的方式手工组织起来,便于用户找到有用的信息。能够手工组织也是基于早年整个互联网的网站数量也非常少,可以通过人工方式实现组织。

随着互联网的壮大,网页网站数量越来越多,手工组织的方式变为不可行,于是由机器实现的全文检索引擎便出现了。用户可以通过关键字查询来获取相关的网页。又随着网页数量的不断增多,任何关键字查询都会返回大量的相关网页,如果对网页进行评分和排序,返回给用户真正有价值的网页便成为重点。基于网页之间的链接关系为网页进行评分,成为很多搜索引擎的网页排序算法基础,Google的Page Rank算法便是其中的代表者。

Google也以此为基础成为搜索引擎产品中的领先者,为用户提供了更好的搜索结果相关性。现代搜索引擎基本上也由此基本成型,虽然后来的技术创新和改进很多,但主要的思路基本上没有变。

搜索引擎发展到今天,基础架构和算法在技术上都已经基本成型和成熟。搜索引擎已经发展成为根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

2、搜索引擎技术

搜索引擎所涉及和涵盖的技术范围非常广,涉及到了系统架构和算法设计等许多方面。可以说由于搜索引擎的出现,把互联网产品的技术水平提高到了一个新的高度;搜索引擎无论是在数据和系统规模,还是在算法技术的研究应用深度上,都远超之前简单的互联网产品。

搜索引擎涉及的关键技术点包含:爬虫(Crawling)、索引结构(Inverted Index)、检索模型(VSM&TF-IDF)、搜索排序(Relevance Ranking&Evaluation)、链接分析(Link Analysis)、分类(Document&Query Classification)、自然语言处理(NLP:Tokenization, Lemmatization, POS Tagging, NER, etc.)、分布式系统(Distributed Processing&Storage).虽然搜索引擎涉及的技术方方面面,但归结起来最关键的几点在于:

●系统:大规模分布式系统,支撑大规模的数据处理容量和在线查询负载。

●数据:数据处理和挖掘能力。

●算法:搜索相关性排序、查询分析、分类等。

由此可见搜索引擎系统是一个由许多模块组成的复杂系统,核心模块通常包括爬虫、索引、检索和排序,除了必需的核心模块之外,通常还需要一些支持辅助模块,常见的有链接分析、去重、反垃圾、查询分析等。搜索引擎中各关键功能模块功能简介如下:

(1)爬虫:从互联网爬取原始网页数据,存储于文档知识库服务器。

(2)文档知识库服务器:存储原始网页数据,通常是分布式Key-Value数据库,能根据URL/UID快速获取网页内容。

(3)索引:读取原始网页数据,解析网页,抽取有效字段,生成索引数据。索引数据的生成方式通常是增量的,分块/分片的,并会进行索引合并、优化和删除。生成的索引数据通常包括:字典数据、倒排表、正排表、文档属性等。生成的索引存储于索引服务器。

(4)索引服务器:存储索引数据,主要是倒排表,通常是分块、分片存储,并支持增量更新和删除。数据内容量非常大时,还根据类别、主题、时间、网页质量划分数据分区和分布,更好地服务在线查询。

(5)检索:读取倒排表索引,响应前端查询请求,返回相关文档列表数据。

(6)排序:对检索器返回的文档列表进行排序,基于文档和查询的相关性、文档的链接权重等属性。

(7)链接分析:收集各网页的链接数据和锚文本(Anchor Text), 以此计算各网页链接评分,最终会作为网页属性参与返回结果排序。

(8)网页去重:提取各网页的相关特征属性,计算相似网页组,提供离线索引和在线查询的去重服务。

(9)网页反垃圾:收集各网页和网站历史信息,提取垃圾网页特征,从而对在线索引中的网页进行判定,去除垃圾网页。

(10)查询分析:分析用户查询,生成结构化查询请求,指派到相应的类别、主题数据服务器进行查询。

(11)页面描述/摘要:为检索和排序完成的网页列表提供相应的描述和摘要。

(12)前端:接受用户请求,分发至相应服务器,返回查询结果。

3、搜索引擎产品介绍

搜索引擎产品其实包括很多种类,并不限于我们最熟悉的全网搜索引擎。具体包含如下几种:

●全网搜索:包括市场份额最高的几大搜索引擎巨头,如Google、Yahoo、Bing.●中文搜索:在中文搜索市场中,百度一家独大,其他几家如搜狗、搜搜、有道的市场份额相对还比较小。全网搜索和中文搜索属于传统的搜索引擎,它们经过了十几年的发展,目前在技术和产品上都已走向逐渐稳定和成熟,通用搜索的市场也基本进入饱和,不像早些年一直呈现高增长率。

●垂直搜索:传统搜索引擎稳定成熟的同时,在各个垂直领域,也出现了很多和产品结合得很好的垂直搜索产品,比如淘宝的购物搜索、大众点评的美食搜索、去哪儿和酷讯的旅游搜索等,也都在各自领域占据了相当大的市场,成为除了通用搜索引擎之外的重要的用户入口。

●问答搜索:专注于为问句式提供有效的答案,比如Ask.com;其他的如问答社区像Quora和国内的知乎,应该也会往这方面发展。

●知识搜索:典型代表就是Wolfram Alpha, 区别于提供搜索结果列表,它会针对查询提供更详细的整合信息。

●云搜索平台:为其他产品和应用提供搜索服务托管平台(Saa S或是Paa S), Amazon刚刚推出它的Cloud Search, Index Tank在被Linkedin收购之前也是做这项服务的。

●其他:比如Duck Duck Go, 主打隐私保护,也有部分用户买账。

各种搜索产品在各自领域都需要解决特定的技术和业务问题,所以也可以建立相对通用搜索的优势,来得到自己的市场和用户。在开源领域,各种开源产品和解决方案也逐渐发展成熟,通用搜索技术不再为大公司所专有,中小企业能够以较低的成本实现自己的搜索应用。现在搜索引擎产品之间的竞争更多的在数据、应用方式和产品形态上,在系统架构和基本算法上区分并不大。

搜索引擎在未来发展上,一是搜索将不仅仅以独立产品的形式出现,更多的会作为搜索功能整合到更多的产品和应用中。在产品形态上,基于传统的搜索引擎,会演化出像推荐引擎、知识引擎、决策引擎等形式的产品,更好地满足和服务用户需求。而搜索引擎所涉及和发展起来的各种技术,会更广泛地应用到各种其他产品上,比如自然语言处理、推荐和广告、数据挖掘等。

总之,搜索引擎对互联网技术和产品带来的影响是巨大的,未来也仍将有很大的发展和应用空间。

4、搜索引擎未来发展的趋势

搜索引擎的快速发展就是近15年发生的,这与互联网的发展趋势密切相关。最近几年,互联网在经过了Web2.0的市场培育阶段后,迎来了以互联网用户的个性化和社交化为中心的趋势。同时,移动设备的逐渐流行及两大趋势的融合,催生了很多新型应用,为了迎接和顺应这种趋势,对搜索引擎来说,也产生了新的挑战。

(1)社会化搜索

随着Facebook的流行,社交网络平台和应用占据了互联网的主流,社交网络平台强调用户之间的联系和交互,这对传统的搜索技术提出了新的挑战。

传统搜索技术强调搜索结果和用户需求的相关性,社会化搜索除了相关性外,还额外增加了一个维度,即搜索结果的可信赖性。对某个搜索结果,传统的结果可能成千上万,但如果处于用户社交网络内其他用户发布的信息、点评或验证过的信息则更容易信赖,这是与用户的心里密切相关的。社会化搜索为用户提供更准确、更值得信任的搜索结果。

国外的Dogpile等元搜索引擎能够得到发展和壮大,主要得益于国外传统搜索过多,并且企业实现共赢的理念,但在国人思考的是如何把所有资源都掌握在自己手中,百度、Google、Yahoo是不会看着自己在未来发展中落伍,成为跟潮人,现在这几家都在不断丰富自己的产品线,并且触及社会化搜索,来保证自己在这个行业中的地位。

(2)实时搜索

随着微博的个人媒体平台兴起,对搜索引擎的实时性要求日益增高,我想这也是搜索引擎未来的一个发展方向。

实时搜索最突出的特点是时效性强,越来越多的突发事件首次发布在微博上,实时搜索核心强调的就是“快”, 用户发布的信息第一时间能被搜索引擎搜索到。

不过在国内,实时搜索由于各方面的原因无法普及使用,比如Google的实时搜索是被重置的,百度也没有明显的实时搜索入口。

(3)移动搜索

随着智能手机的快速发展,基于手机的移动设备搜索日益流行,但移动设备有很大的局限性,比如屏幕太小,可显示的区域不多,计算资源能力有限,打开网页速度很慢,手机输入繁琐等问题都需要解决。

目前,随着智能手机的快速普及,移动搜索一定会更加快速的发展,所以移动搜索的市场占有率会逐步上升,而对于没有移动版的网站来说,百度也提供了“百度移动开放平台”来弥补这个缺失。

(4)个性化搜索

个性化搜索主要面临两个问题:如何建立用户的个人兴趣模型?在搜索引擎里如何使用这种个人兴趣模型?

个性化搜索的核心是根据用户的网络行为,建立一套准确的个人兴趣模型。而建立这样一套模型,就要全民收集与用户相关的信息,包括用户搜索历史、点击记录、浏览过的网页、用户E-mail信息、收藏夹信息、用户发布过的信息、博客、微博等内容。比较常见的是从这些信息中提取出关键词及其权重。

为不同用户提供个性化的搜索结果,是搜索引擎总的发展趋势,但现有技术有很多问题,比如个人隐私的泄露,而且用户的兴趣会不断变化,太依赖历史信息,可能无法反映用户的兴趣变化。

(5)地理位置感知搜索

目前,很多手机已经有GPS的应用了,这是基于地理位置感知的搜索,而且可以通过陀螺仪等设备感知用户的朝向,基于这种信息,可以为用户提供准确的地理位置服务以及相关搜索服务。目前,此类应用已经大行其道,比如手机地图APP.(6)跨语言搜索

这方面做得最好的是Google, Google目前已经能提供多种语言之间的跨语言搜索,比如搜索“麻省理工”, 排在第一位的则是麻省理工学院的主页。

如何将中文的用户查询翻译为英文查询,目前主流的方法有3种:机器翻译、双语词典查询和双语语料挖掘。对于一个全球性的搜索引擎来说,具备跨语言搜索功能是必然的发展趋势,而其基本的技术路线一般会采用查询翻译加上网页的机器翻译这两种技术手段。

(7)多媒体搜索

目前,搜索引擎的查询还是基于文字的,即使是图片和视频搜索也是基于文本方式。那么未来的多媒体搜索技术则会弥补查询这一缺失。多媒体形式除了文字,主要包括图片、音频、视频。

多媒体搜索比纯文本搜索要复杂许多,一般多媒体搜索包含4个主要步骤:多媒体特征提取、多媒体数据流分割、多媒体数据分类和多媒体数据搜索引擎。

例如图片搜索,一般的步骤为:第一步,缩小尺寸;第二步,简化色彩;第三步,计算平均值;第四步,比较像素的灰度;第五步,计算哈希值(详情可参见Google图片搜索的原理一文).(8)情境搜索

情境搜索是融合了多项技术的产品,上面介绍的社会化搜索、个性化搜索、地点感知搜索等都是支持情境搜索的,目前Google在大力提倡这一概念。

所谓情境搜索,就是能够感知人与人所处的环境,针对“此时此地此人”来建立模型,试图理解用户查询的目的,根本目标还是要理解人的信息需求。比如某个用户在苹果专卖店附近发出“苹果”这个搜索请求,基于地点感知及用户的个性化模型,搜索引擎就有可能认为这个查询是针对苹果公司的产品,而非对水果的需求。

5、搜索引擎在应用系统中的应用现状

伴随应用系统(例如OA系统)的规模正在不断扩大,在互联网上得到了成熟稳定发展的搜索引擎技术可以大大提高应用系统的办公使用效率。

5.1 重点关注的功能需求

搜索引擎在管理信息系统中的部署关注以下几点的功能需求:

●通过整合多种数据源,提供统一的搜索服务,达到促进广泛的信息交流和知识共享的目的,实现跨系统、平台、应用、地域之间以及互联网信息的整合。

●提供统一、安全的信息检索接口系统,为所有结构化、非结构化的数据提供标准的数据源输出接口功能。

●处理各种类型的文档,并实现全文检索。

●保证信息检索的迅速、准确,提供高并发率的处理能力。

●系统提供关键的维护、管理、控制和监测功能,采用统一的方式,通过集中监控管理模块与所有搜索服务进行通讯;同时,提供图形化的管理界面,使系统管理员能够对所有模块(或服务)进行本地或远程管理操作。

●系统支持负载均衡和高可用性,支持建立分布式的内部数据索引,并实现对搜索服务器的集群化部署,支持水平灵活扩展。

5.2 建议包含的主要功能

搜索系统将提供高效率的搜索功能,用户通过在单一搜索界面上的操作,可以在最短时间内,完整、准确、及时地得到所需信息。建议主要包括以下功能:

(1)提供信息的全文检索

检索范围除各类文件、信息等的要素、关键字以外,提供包括文件正文内容和附件内容在内的全文检索功能,以满足用户对文件检索的要求。

(2)支持各类文件格式

支持HTML、PDF、ASCIIText、XML、MS Office格式(Word、Power Point、Excel)、压缩文件格式(Zip、Gzip、Tar)等格式的检索。

(3)兼容各类数据源系统

可以采集、处理和索引的信息系统包括:网站(HTML、J2EE、ASP、NET、PHP)、文件系统(Windows、Linux、Unix)、数据库(Oracle、SQL Server、DB2、Sybase、My SQL)、公文流转和邮件系统、门户系统等,以保证增加和更新的文档能够及时地被搜索到,删除的文档及时地从索引平台中去除。增量索引支持可调度模式。增量索引时,应不影响搜索。

(4)减少检索功能对各系统的影响

搜索系统与各系统采用松耦合的集成方式,选择在非工作时间更新数据库索引,从而避免在文件、信息生成时同步数据各系统带来不利影响。

(5)具备良好的系统扩展性与灵活性

通过搜索系统的建立,将对各类管理信息提供统一的检索。同时,能够灵活扩展,快速、简便地与各类新数据源系统进行检索集成。

(6)搜索结果集的相关性排序

平台支持将检索结果按相关度排序后交付给用户,以适应不同应用。

(7)支持搜索结果的个性化定制和动态更新

搜索系统可以根据用户个人的需要进行个性化定制搜索。

(8)结合权限进行采集和搜索

5.3 搜索引擎在应用平台中的技术架构

搜索引擎在应用平台上的技术架构总体上可以划分为门户、数据同步、语言处理、业务处理、系统调度、搜索服务、数据反馈、统计分析、运营维护、系统管理等十大模块,各模块之间在功能上相对独立,业务上又相互联系相互支撑,共同协作从而实现了搜索引擎应用平台的整体服务架构。基于对业务需求的分析,搜索系统的技术架构如图1所示。

门户模块主要涵盖了门户、对外接口服务、对内接口服务、第三方开发接口、API等功能。

数据同步模块支持OA数据、关系形数据、文档形数据、网络数据爬取、论坛数据、知识库等多种数据形式。该模块是搜索引擎平台数据获取模块,通过数据同步将其他业务系统中的数据作为数据源提供给搜索引擎应用平台。

语言处理模块:主要功能包括分词、纠错、转换、扩展及词库学习等。

业务处理模块:主要提供对搜索请求及业务数据的处理,包括搜索任务封装、结果过滤、数据关联、编审支撑、缺失计算、数据排重等功能。

系统调度模块:提供了负载均衡、分布缓存、任务分配、数据分析、数据处理、数据存储、数据备份、任务监控等功能,主要负责将用户的查询任务进行分析、搜索结果进行缓存,并监控管理整个搜索周期。

搜索引擎模块:提供数据索引的创建和管理、分布式存储、任务处理、语义分析、数据分类、搜索、排序、监控及日志等功能。

统计分析模块:包括热词统计、趋势统计、访问量统计、业务统计、排行榜、性能统计等。主要提供搜索应用平台各项数据的统计分析服务。

运营维护模块:包括词库管理、排序管理、数据管理、同步管理、过滤管理、抓取管理等。主要提供运营业务系统的管理和配置服务。

系统管理模块:包括接口管理、权限管理、日志管理、安全管理、备份管理等。主要提供系统的基本管理及安全审计服务。

6、结束语

综上所述,搜索引擎技术在移动终端智能化和互联网用户个性化以及社交化为中心的融合趋势下的发展,催生了很多新型应用。搜索引擎技术的发展直接推动了互联网技术的迅速发展和互联网+应用的扩展,伴随着管理信息系统和业务应用系统的互联网化,搜索引擎技术将广泛地应用于管理信息系统和业务应用系统中。本文结合搜索引擎在管理信息系统中的应用给大家提供了一个实用方案,可供参考。

第二篇:B2B搜索引擎平台研究

B2B搜索引擎平台研究

(新华云科)

【作者介绍:新华云科语义智能搜索引擎研发团队,是由英国布里斯托大学、广州中山大学、北京理工大学高级网络技术专业、软件工程专业、计算机科学专业的硕士研究生、博士研究生,联合搜索引擎资深专家,于2008年组建的语义智能搜索引擎专业研发机构,拥有独立自主的知识产权。】

搜索引擎也是一个数据库和网站,B2B是一个电子商务交易搜索引擎平台。B2B(英文Business To Business的缩写)是指企业对企业之间的营销关系。而电子商务只是现代B2B marketing的一种具体主要的表现形式。

传统的企业间的交易往往要耗费企业的大量资源和时间,无论是销售和分销还是采购都要占用产品成本。通过B2B的交易方式买卖双方能够在网上完成整个业务流程,从建立最初印象,到货比三家,再到讨价还价、签单和交货,最后到客户服务。B2B使企业之间的交易减少许多事务性的工作流程和管理费用,降低了企业经营成本。网络的便利及延申性使企业扩大了活动范围,企业发展跨地区跨国界更方便,成本更低廉。

B2B不仅仅是建立一个网上的买卖者群体,它也为企业的之间的战略合作提供了基础。任何一家企业,不论它具有多强的技术实力或多好的经营战略,要想单独实现B2B是完全不可能的。单打独斗的时代已经过去,企业间建立合作联盟逐渐成为发展趋势。网络使得信息通行无阻,企业之间可以通过网络在市场、产品或经营等方面建立互补互惠的合作,形成水平或垂直形式的业务整合,以更大的规模、更强的实力、更经济的运作真正达到全球运筹管理的模式。

目前企业采用的B2B可以分为以下两种模式:

1、面向制造业或面向商业的垂直B2B(又可以称之为行业B2B)。垂直B2B可以分为两个方向,即上游和下游。生产商或商业零售商可以与上游的供应商之间的形成供货关系,生产商与下游的经销商可以形成销货关系。将垂直搜索的概念重新诠释,让更多生意人习惯用搜索模式来做生意圈,找客户。垂直B2B成本相对要低很多,因为垂直B2B面对的多是某一个行业内的从业者,所以,他们的客户相对比较集中而且有限。

2、面向中间交易市场的B2B(又可以称之为区域性B2B)。这种交易模式是水平B2B,它是将各个行业中相近的交易过程集中到一个场所,为企业的采购方和供应方提供了一个交易的机会。

B2搜索引擎举例,比如:

中国最大的农业b2b信息化推广宣传平台。中国农业网【.cn】是一家集互联网信息、电子商务和线下服务于一体的农业行业专业网站。自2001年成立以来,一直以“综合涵盖+行业细分”的双重模式整合农业资源,引领中国农业信息化的潮流,在国内农业电子商务领域独树一帜!

再比如:中国蔬菜网[.cn]是一家集互联网信息、电子商务和线下服务于一体的蔬菜行业专业网站。自1999年成立以来,一直引领蔬菜产业信息化潮流,是中国蔬菜产业信息化的成功典范。

第三篇:CNNIC:2013年中国搜索引擎市场研究

CNNIC:2013年中国搜索引擎市场研究 两年看似已经格局稳定的搜索引擎市场风云再起,同时移动互联网的快速发展更让搜索市场的格局多了几分变数,不过2014搜索市场格局之争显然已是几个大玩家之间的游戏了。

CNNIC刚刚发布了《2013年中国搜索引擎市场研究报告》,结合他们早前发布的《2013年中国网民搜索行为研究报告》,我试着对国内搜索引擎的市场格局以及未来发展做个简单解读。

如果说2013是搜索市场纵横捭阖的一年,那么2014则是争夺移动搜索和下一代搜索高地的一年,语义搜索或将引发新战役。

稳定的用户规模VS活跃的垂直搜索

从2000年算起,搜索引擎市场经历了十多年的发展,目前已经步入了较为成熟的发展阶段,覆盖了绝大部分网民。据CNNIC报告显示,截至2013年12月中国网民总数已达6.18亿,其中搜索引擎用户为4.90亿,渗透率高达79.29%。

不过用户规模的增长已经趋于平稳,从去年开始增速已经开始低于整体网民的增速,其中最主要的原因是目前的新增网民中绝大部分来自于移动端(2013年手机网民的增长率为25.3%,远高于整体网民9.5%的平均增速)。

随着互联网的深入发展和网民成熟度的提高,人们从互联网上已经不再满足于简单的信息获取,而是将更多专业化的行为搬到了互联网上,因此我们看到虽然百度、谷歌等综合搜索引擎仍旧是网民获取信息的主要渠道,但是与此同时各个细分领域的垂直搜索引擎开始活跃,已经占有了越来越多的市场份额。

例如满足用户获取实时信息需求的微博搜索、以及视频和购物搜索分别都占到了17.3%、13.4%和9.9%的市场份额。其中值得一提的是微博搜索,虽然本身渗透率并不高但却以超高的市场占有率排名第二,这代表了用户对获取实时信息的需求,也对下一代搜索引擎的发展提出了更高的要求。

PC端一家独大 智能搜索成逐鹿焦点

在PC端,不管是从市场渗透率、首选率,还是前二位选择率,百度都居于绝对领先地位。其中,第二位选择率是指很多网民除了一个经常使用的搜索引擎外,也会使用另外一个搜索引擎作为辅助,前两位选择率可以代表搜索引擎覆盖的搜索引擎用户数目。从这个指标来看,百度的覆盖率达到96%。

2014年随着搜索市场的不断变革,预计市场集中度将进一步提升,百度在搜索市场中仍将一家独大,老大地位难以撼动。同时随着腾讯搜狗资本合作,新搜狗整合力量或会出现,搜索领域将成为巨头之间的竞争。

在本人看来,PC端搜索引擎市场格局基本稳定,难以有较大的变局,未来也很难有新的竞争对手跻身前三,而谷歌等老牌搜索引擎如何在中国市场上没有大的动作则被边缘化的趋势会越来越明显,2013年谷歌的首选率仅为1.6%。

值得一提的是,人工智能和搜索技术的发展使得通过对内容索引的关键词进行简单的抓取已经难以满足网民对搜索引擎的期待。人们希望搜索引擎能针对特定的问题给出准确的答案,并且这是一个动态和灵活地过程,而并非提供一堆静态的内容。

针对这种需求,在2013年几家主要的搜索引擎公司纷纷针对下一代搜索引擎进行布局,希望通过对人工智能技术的运用和在搜索中对用户习惯、记录以及行为等信息或数据的融入,为用户提供具备深度个性化和丰富交互性的服务。

在这方面,百度很早就开始探索,2013年的相关产品逐渐浮出水面。

2013年初,百度CEO李彦宏从美国硅谷挖来了许多技术牛人,成立百度深度学习研究院(Institute of Deep Learning,IDL)。随后代表百度下一代搜索引擎雏形的“知心搜索”被推出,开始将知识图谱的技术应用到百度的大搜索里面去,并且融入了人和人之间的关系、物和物之间的关系。

整体而言,2013年算是下一代搜索引擎的初始年,整体市场还处于起步阶段,渗透率不高,预计2014年围绕下一代搜索引擎的话题也将成为几家主流搜索引擎公司竞争的焦点。

移动搜索集中度高 用户习惯延伸明显

报告显示,目前移动端搜索引擎的市场格局基本和PC端一致。不仅如此,而且移动端的市场集中度似乎更高。

从市场渗透率、首选率以及前二位选择率来看百度在移动端具有更大幅度的领先,前三名的市场集中度也比PC端更高。例如从首选率来看百度和第二名的360分别为88.7%和4.2%,而在PC端百度和排名第二的360搜索则分别为85.6%和10.1%,另外两个指标也大致类似。

这其中主要的原因是目前PC端的使用行为对移动端还有着较大的影响,在CNNIC的调查中,有74.3%的手机网民表示移动端搜索引擎的使用是 “电脑上的习惯延伸,懒得换”。

虽然目前移动端搜索引擎的市场格局并没有显示出与PC端很大的差异,但其实移动端搜索引擎的产品、技术都没有发展成型,市场格局更是难言已定。

一方面手机端网民正在快速增加,但是他们对搜索引擎的依赖和使用频率并不及PC端,用户的规模更是难与PC端相比,用户在移动端需要什么样的搜索引擎目前尚未定论;另一方面移动互联网技术飞速发展,在目前市场并不明晰的情况下随时可能出现颠覆性的技术或商业模式,在这方面各家实际上都并不轻松。

并且我认为移动端是目前整个搜索引擎市场的最大变数,对各家公司的重要性异乎寻常。因为这不仅是移动端市场的问题,更有可能会影响到整个搜索引擎市场的格局。

2014年各家巨头之间不仅将在原有的模式下快马加鞭,以寻求更多的占有用户的手机屏幕,为用户在移动搜索中植入更多地使用场景,培养用户在手机上使用搜索的习惯,也将不断地寻求颠覆性的突破,一举确立江湖地位。

待挖掘的微博搜索VS二维码和语音输入

两份报告中还有一些有意思的数字对未来搜索引擎的发展有很大的启示意义,主要有亮点。

第一是微博在未来搜索引擎中的扮演的角色。我们在上面提到相比购物搜索、视频搜索,微博搜索的市场渗透率并不高,但是在市场份额的排名上微博搜索却居于第二的位置,分别超出了视频搜索和购物搜索3.9%和7.4%。微博拥有着庞大的用户群,很多热点事件都是先从微博上开始传递的,这使得一些网民养成了微博搜索的习惯。

这背后反映的是用户对及时信息的需求,那么如何动态、及时地满足用户对实时信息的需求将是下一代搜索引擎需要解决的一个重要问题。

第二是搜索引擎输入方式的变化。相比之前依赖于传统的文字输入,随着移动互联网的兴起,其他一些新型输入方式的出现也对搜索引擎提出了更高的要求。

相比2012 年,2013年网民在使用二维码扫描输入和语音输入的网民比例大幅度上升。针对二维码的另一项调研也表现,不管是从二维码的认知度还是使用率上都保持着较高的水准。

第四篇:搜索引擎实验报告

电子科技大学

实验报告

学生姓名:罗佳学号:2014120101013

指导教师:汤志伟

一、实验室名称:

电子政务可视化实验室

二、实验项目名称:

搜索引擎学习课程

三、实验原理:

搜索引擎框限定

四、实验目的:

百度的使命是“让人们更便捷地获取信息,找到所求”。Google的使命的是“整合全球信息,让人人皆可访问并从中受益。” 搜索引擎自己标榜的使命写的比较宏大,其实简单就说是:用户搜索任何关键词时都能找需要的信息。

学会运用这些搜索引擎的各种便捷方法,能让我们节省很多时间和精力,带来最满意的用户体验

五、实验内容:

采取一定的技术手段、方式和方法获取信息

六、实验器材(设备、元器件):

笔记本电脑,百度

七、实验步骤:

根据题意,对每一步提示进行操作。截图进行分析

八、实验数据及结果分析:

(1)简单查询 查询电子科技大学

(2)“”双引号完全匹配查询

查询成都小吃,没有用双引号时出现了很多美食鉴赏类的

查询“成都小吃”,结果就是完整的(3)-减号——排除查询

查询白百何会出现很多和陈羽凡有关系的消息

查询白百何 –陈羽凡,就不会出现陈羽凡的消息

(4)空格——“与”逻辑

查询三生三世十里桃花歌曲下载

查询白百何陈羽凡(5)| 分隔符——“或”逻辑 查询成都大学

查询成都|大学

(6)filetype ——指定文件类型 查询学生名单

查询学生名单filetypePDF

(7)intitle ——限定搜索标题 查询琼瑶

查询intitle:琼瑶

(8)site ——限定搜索站点 查询白百何出轨

查询白百何出轨site: http://weibo.com/

(9)inurl ——限定搜索地址 查询白百何出轨

查询白百何出轨inurl:腾讯

(10)短语检索 查询“北京大学”

查询“北京”“大学”

九、实验结论: 随着计算机的普及以及信息工程的日益发展,从网上获取信息已经成为人们的日常生活和工作一个重要途径,互联网如今已成为一个资源不断丰富的平台,整个互联网逐渐成为一个信息量超大的资源存储空间。

因此怎样有效而又快捷的从海量数据中获取所需的信息就成为一件困难的事情,搜索引擎的出现正是为了解决“信息丰富,获取困难”的问题的一种信息检索服务。搜索引擎被称为是一个信息处理和获取的黑盒子,通过一定的规则在互联网中爬取信息资源以及对信息进行处理和提取,对外提供接口方便用户查询,从而起到指导用户获取信息的作用,主要由采集信息、组织并处理信息和查询接口三部分组成。搜索引擎对于用户来说就是一个为其提供信息搜索功能的查询工具。搜索引擎所具有的研究价值、实用价值以及商业价值是其在当今信息时代获得成功的重要因素。

十、总结及心得体会:

学会使用简单的搜索技巧,来提高自己工作效率

十一、对本实验过程及方法、手段的改进建议:

1、建议使用Google搜索,结果更准确和方便

2、搜索时要明确关键词,找到最简单的方法。

报告评分: 指导教师签字:

第五篇:中国民俗研究论文

哈尼族的领婚习俗在该民族家庭和谐形成方面的积极意义

外语系 对外汉语班 20081032102 李兴辉

【摘要】每一个民族都有每一个民族自己独特婚俗的闪亮点,从各民族的不同之处人们可以很好的发现该民族的文化、宗教、制度等的特点,可以更好的帮助人们了解该民族。哈尼族的婚俗也是其丰富多彩的民族文化的一个重要组成,从哈尼族的婚俗上人们也可以了解哈尼族的民族文化的精彩和绚丽。除此,哈尼族的婚俗有许多婚俗仪式,这些仪式在典型的民族习俗背景下形成,留有深深的民族意识形态的烙印,所以透过一些婚俗仪式我们可以很清晰的了解或推知哈尼族整个名族在其他方面具有的明显形态的原因。比如:哈尼族在各民族中尊敬长者和婚姻关系牢固是相对明显的特点,其实着也是和他们的一些婚俗礼仪着着密切联系的。

【关键词】

哈尼族

婚俗

领婚

独特的历史发展和独特的民族内涵使得哈尼族有了自己独特的婚俗礼仪和婚俗制度。一夫一妻的氏族(血缘)外婚是哈尼族基本婚姻制度,哈尼族的村寨,一般都设有专供未婚男女青年社交的场所,称为“扭然”(王清华、史超军著:《云海中的奇婚女性》,云南教育出版社1995年版,第5页。)。黄昏后,男女青年盛装一新,由小伙子头或姑娘头带领,聚会在扭然里、寡妇家,或村边丛林中幽会对歌,互诉衷情。在红河南岸大羊街一带的哈尼族,若应邀找小伙子的姑娘超过五人,便可举行盛大的酒歌恋爱宴会——“阿巴多”。其场面欢乐,多趣,规矩繁多。经过多次交往,姑娘和小伙子只要情投意合,即可结成“扎哈”关系,即稳定的朋友关系.除此,哈尼族还有着许许多多的奇闻婚俗,我们既然是对它的婚俗仪式进行深入的了解就不能抱着那种“矮子看戏”似的心态去看,必须学会在了解中得到自己独特的看法。繁衍生息于哀牢山中段的墨江哈尼族自治县的哈尼族,个支系都有基本相同的婚俗趣事:

龙”与“凤”对歌:“龙”与“凤”对歌,即男女未婚青年对歌,是白宏人的一种婚恋形式。在米索扎(十月年)或其它节日傍晚,村里的年轻人相约到一特定场所,分性别列为两排,中间隔一至几丈,相对站立或席地而坐,各找对象分别对歌。歌词多为传统与即兴创作相结合的“龙求凤”、“鱼戏水”等等,都是通过比喻的手法来表达对对方的爱慕之情。对歌前,男青年准备好红、绿绸帕(布)一块,在对歌中男方寻找到自己理想对象就将绸帕盖在自己心爱的姑娘头卜。如果姑娘乐意受盖,便说明相爱成功。有的当时便请老人帮拍板定亲,待明年来日举行婚礼。如果姑娘拒绝受盖,则返回原地继续对歌,直至姑娘受盖,互赠手镯、银泡等饰物为定情物后,方表明相爱成功。假若与姑娘对歌反复多次,姑娘仍拒绝受盖,男方只好另寻知音。对歌有一定时间限制,到时间还未受盖的姑娘,只好另找场合再寻知音

抢小帽:抢小帽,当“芽约”(小伙子)想寻觅自己的心上人“芽迷”(姑娘)时,就会在姑娘经常出没的路途中守候。小伙子钻入路途边的丛林或能隐蔽的地方,悄悄等待姑娘的来临。一旦姑娘走近自己,便猛然跳将出来抓起姑娘头戴的小帽嬉戏着跑开。姑娘追着‘拼命”地去左抢右抢,小伙子左避右闪,始终不让姑娘抢到,姑娘真真假假地要和小伙子吵起来,以至叫着骂着撵着追打。当然,小伙子是绝不还手的。姑娘以戴小帽为荣。进入青春期后,怕小帽被抢,因此,每个姑娘都备有一至几顶小帽藏于身。当小帽被抢去以后,她们便会在远离伙子的地方拿出另一顶戴上。事后,抢得小帽的伙子便托亲友邀请姑娘在某地某时相会。若姑娘谢绝,亲友便会将小帽奉还姑娘,而个别的小伙子也有不送还的,留作纪念。假如姑娘中意,小伙子便在相约的时间地点弹起了牛腿琴等待姑娘到来,随着琴声唱起动听的山歌,这时,姑娘便会走来随声附合,姑娘与伙子一问一答,相爱之情溢于言表,心越走越近。这时,姑娘便会取下上衣的两颗银纽扣赠给伙子,表示已倾心于他了。

领婚:男方家派出媒人、弟弟或堂弟去女方家把新娘领回来。领婚者到了女方家,新娘却被女伴藏起来了。领婚者绞尽脑汗地商讨对策,不停地与女方家的人交涉,千方百计地要找到新娘。想尽种种办法,通过层层关卡,最后领婚者终于找到了新娘,又经过一波三折,女方家才同意领走新娘。领到新娘返回男方家的路上,领婚者都要高声欢唱,以庆贺领到了新娘:墨江一带的哈尼族娶到新娘后,要请巫师为新郎新娘祝福并驱鬼,完成这个仪式以后新娘才能进男方家的门。进门的时候,新郎高高站在门上,让新娘从底下通过,表示女人要听男人的话;跨门坎时,新娘要右脚先进,左脚后进,这样以后才能儿孙满堂,荣华富贵。新娘进家后,首先要用猪头向灶神和祖先神灵磕头祭奠。第一顿饭要由婆婆陪同新娘进餐,其他人不能参加。红河一带,新娘到了夫家后,先向祖先神位磕头,再向婚宴上的长者敬礼,接着吃下新郎亲自送来的一碗米饭,表示永不变心。在西双版纳,要由婆婆在村口为新娘穿上白色裙子,然后才能进入村子。到了甲方家门口,男方的已婚姐姐剪下三根头发,为新娘洗手洗脚,新娘才能进入大门。婚礼酒宴上,新郎新娘要先吃公鸡肉和猪右前腿,然后给宾客一一敬酒。这时,由会唱哈尼调子的老人来祝福新娘头胎生女儿,二胎生儿子,并劝戒夫妻要和睦相处,白头到老。婚礼的最后是强迫本村年龄较大而未婚的人吃猪尾巴。

特别要说的是,领婚仪式也不是哈尼族独有的,还有彝族等极少几个的少数名族也存在领婚习俗。但是,我们也不可以孤立的看待这些少数民族的婚俗仪式,它们的形成有该民族的特殊文化的背景影响,而它们也从某些方面直观或间接的折射着该民族现实中的某些民族心态。

哈尼族的婚俗仪式其实也是对其现实社会有着深远影响的,通过调查分析,哈尼族的家庭关系是很和谐的,家庭关系中,以长者为尊,晚辈很尊重长辈,也很听长辈的话,在家庭中,夫妻关系融洽,离婚的较少。对比现代社会,在各大城市中,少数民族形态特征基本消失或已不明显,没有特殊 的婚俗礼仪,没有明显的家庭宗族关系,更不会有宗法的束缚。但是现代社会却又很多少数民族社会少有的群太现象:离婚率快速攀升、普遍蔓延,甚至还有了闪婚一族的形成;更离奇的是还有那些专门从事婚姻诈骗赚钱的人,不断的与别人交往,不断的以婚姻为诱饵骗取别人的钱财;还有那些不断出现的虐待老人的匪夷所思的现象;这些现象在民族群太比较明显的哈尼族社会里是绝对不敢想象的事情。

联系哈尼族的婚俗礼仪来看,领婚礼仪不是简单的一个迎婚过程,它包含从哈尼族青年男女开始交往到定亲,再到说媒、迎婚过门,甚至是如果婚姻破裂要举行离婚仪式:男女青年婚前社交、恋爱自由。两人相爱不受父母或他人的干涉。黄昏后,男女青年盛装一新,由小伙子头或姑娘头带领,聚会在扭然里、寡妇家,或村边丛林中幽会对歌,互诉衷情。在红河南岸大羊街一带的哈尼族,若应邀找小伙子的姑娘超过五人,便可举行盛大的酒歌恋爱宴会——“阿巴多”。其场面欢乐,多趣,规矩繁多。经过多次交往,姑娘和小伙子只要情投意合,即可结成“扎哈”关系,即稳定的朋友关系。若双方彼此中意,相约百年,并为父母认可之后,男方托媒人向女方提亲说合,随即上聘迎亲。新娘接到男家,先要向祖先神龛行埋头礼,然后吃下新郎亲手递送的一碗夹生饭,表示永不变心。第二天旭日东升,新娘随同伴娘,携带若干糯米饭回娘家,分送给村里各户血亲,以示铭记血缘祖根。婚后,双方均不再参加社交、恋爱活动。若夫妻感情破裂,不论谁提出离婚,一般由女方退还原聘金即可,有的地方则要履行简单的离婚仪式(要举行简单的仪式;由一中间人主持,男方砍一木片,两侧各砍三道小口,然后将木片破成两半,各拿一片为凭证。有的地方要吃最后一餐离婚饭,吃饭时桌子中间放一根柴,表示从此以后断绝关系)。

这种在现在的一些人看来是少数民族的一些有趣现象的仪式,背面折射出来的现实意义其实才是值得我们去探究的。哈尼族的青年男女可以在婚前自由恋爱,但是恋爱的场合有是有限制的,而且也是采用类似群体式的。这样一方面哈尼族的青年男女之间可以相互监督,另一方面哈尼族的女孩可以在众多的优秀哈尼族男青年中选择自己最倾心的男孩子。还有,哈尼族青年如果双方都倾心,在举行的婚礼上会有许多特殊却意义重要的仪式。比如哈尼族男青年家在娶亲前会邀请本村最有威望的长着和本村父母和孩子都还在的中年夫妇以及一些唱歌好的青年组成迎亲队伍迎娶哈尼族女孩。而且,当迎亲队伍到了女孩家的时候,队伍还必须通过女方家设置的重重关卡,女方家满意后方可带走女孩,但是出村时,村里的青年会刁难迎亲队伍,队伍只能接受不能反抗。透过这种仪式我们应该看到,哈尼族的在意识形态上就有着对长着的尊重,几乎什么大的事情都会邀请有威望的长着去主持或参与。其次哈尼族在婚礼上的仪式有着积极的意义,双方家庭的人员在类似与刁难的迎娶过程中会增加双方的了解,这为男女两家的和谐关系打下基础,因为一般情况下双方都会比较严肃的对待婚俗。另外新娘接到男家,先要向祖先神龛行埋头礼,然后吃下新郎亲手递送的一碗夹生饭,表示永不变心。虽然这样的仪式看起来有点约束,但从积极的方面来看,哈 尼族普遍的意识形态的对祖先的尊敬,即便是结婚过门后的首要仪式也得祭奠祖先,表示对祖先的尊敬,其次,“嫁鸡随鸡嫁狗随狗”,对丈夫的绝对忠心。

不可否认的是这样的婚俗有其历史形成的落后的一面,许多方面哈尼族的妇女在思想上受到极大的束缚,在行为上受到眼科的限制;但是从积极的一面来看,现实社会中对长辈的尊重和对夫妻双方的理解和忠诚不正是家庭和谐中最重要的两个因素吗?现在繁华社会的青年男女在恋爱过程中总是强调自由,就希望不要让父母知道或者父母绝对不要干涉,结果随随便便,交友就像换衣服赶时尚一样。交友一天就可以随便抛出“我爱你”,一星期后“我喜欢你”,半个月后“你还可以”,不到一个月就会说“我们分手吧”。这样的交友方式会有坚实的婚姻基础吗?

随后要说的是,哈尼族青年即使婚姻关系差的到了非得离婚的地步了,他们也会有比较浓的民俗礼仪。若夫妻感情破裂,不论谁提出离婚,一般由女方退还原聘金即可,有的地方则要履行离婚仪式(要举行简单的仪式;由一中间人主持,男方砍一木片,两侧各砍三道小口,然后将木片破成两半,各拿一片为凭证。有的地方要吃最后一餐离婚饭,吃饭时桌子中间放一根柴,表示从此以后断绝关系)。不难看出,虽然是离婚,但是哈尼族的离婚仪式也是相当的和谐的,要么女反复退还聘金,要么双方心平气和的吃顿饭,各取一块竹片表示婚姻关系的结束。整个仪式,完完全全是在一种和睦的氛围结束。

总结:从构建社会卞义和谐社会的角度来看,哈尼族婚姻家庭习俗在民族习俗中匀起作用,自然生态环境与文化达成了一种平衡,共同形成了一个人、自然、社会统一的和谐状态,发挥着维系这个和谐社会的功能。哈尼族的婚姻家庭习俗及伦理道德,虽然呈现出多元形态,但其主流充分体现了人类生活的共性,对维系‘婚姻家庭关系的稳定,当地社会和谐发展发挥了重要的作用。主要原因:一是婚姻恋爱的自由度较大。哈尼族的青年男女较少受到感情因素以外其他因素的限制和制约,使婚姻关系更接近其本质,有效地保障了婚姻的质量,减少了婚姻家庭纠纷。二是对离婚问题的排斥习俗,有利于维护婚姻家关系的稳定。三是哈尼族对离婚态度十分开明。哈尼族离婚一般不吵闹,也不结怨,离婚后原夫妻双方仍以朋友、兄妹相称,其开明态度值得提倡。四是哈尼族婚姻家庭习俗有利于促进婚姻家庭关系和谐稳定。虽然少数哈尼族的婚姻家庭习俗始终处在与时代同步发展、演变的不断变动中,但其精神内涵一般都很强调婚姻家庭关系的和谐稳定。从实践的情况看,哈尼族的婚姻家庭关系很少发生矛盾。这也表明哈尼族的婚姻家庭关系一般都很和谐稳定。

下载关于搜索引擎的研究论文[共五篇]word格式文档
下载关于搜索引擎的研究论文[共五篇].doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    搜索引擎营销模式及其商业价值的管理论文

    内容摘要:在Web 2.0时代的今天,互联网已经影响到人类生活的各个方面,互联网用户对搜索引擎的依赖程度不断加深,搜索引擎已成为用户最喜爱的网络信息采集渠道,这使得搜索引擎......

    搜索引擎营销策略

    现代商业模式与传统商业模式的区别与联系 201452133 游逸飞 现代商业模式主要分为三种: 1、店铺模式 一般地说,服务业的商业模式要比制造业和零售业的商业模式更复杂。最古老......

    网站搜索引擎工作总结

    网站搜索引擎工作总结 网站搜索引擎工作总结一、概述 我之前一直是在类似于联创、合众的平台上工作,虽然对新闻源有些面上的了解,却一直没有到企业客户端工作的实际经验,但是就......

    搜索引擎教学设计

    搜索引擎教学设计 搜索引擎教学设计 [学习目标] 1、知识与技能 掌握网络信息检索的几种主要策略与技巧; 了解搜索引擎的相关知识(简单分类、工作原理、帮助系统等)2、过程与方......

    搜索引擎的学习心得

    搜索引擎的学习心得体会 我们身处在一个信息时代,可以通过很多途径接触到关于生活、学习等各方面的知识,但是如何在浩渺的信息海洋里快速而准确地找到我们所需要的东西呢,这成......

    网络搜索引擎实验报告

    实验名称: 网络搜索引擎营销-我们熟悉的搜索引擎有哪些我们所不熟悉的内容  实验目的: 让学生通过访问百度和Google,认真了解和学习网络搜索引擎怎么帮助企业推广,从网络营......

    搜索引擎教学反思

    《搜索引擎》教学反思 本节课以“搜索引擎”作为课程整合的切入点,采用主题任务进行驱动教学,有意识的开展信息技术与研究性学习相联系的横向综合的教学,涉及语文、英语、物理......

    《搜索引擎》教学设计

    《搜索引擎》教学设计 一、教学目标 1、关于知识方面: (1)让学生了解搜索引擎的概念; (2)是学生了解当下流行的相关搜索引擎有哪些。 (3)使学生掌握利用搜索引擎查找资料的方法。 2......