第一篇:教育技术发展中的误区及发展趋势
教育技术发展中的误区及发展趋势
一、发展误区
(1)硬件、软件建设不能同步。这是在大陆教育技术发展历史上一直都存在的老问题,一般表现为重硬件轻软件,主要受唯媒体技术论的思想影响。70年代末80年代初,出现过一哄而上搞电视课堂搬家的现象,造成了很大的浪费。90年代以后,以计算机为核心的信息技术兴起,教育信息化成为世人瞩目的焦点,基础设施建设初见成效。可以说,硬件建设已取得了一定的成绩,但软件建设却没有跟上硬件建设的步伐,使“软件匮乏”成为开展教育技术工作的瓶颈。我们应该关注硬件和软件的并行建设,探索出一条符合中国国情的软件建设的路子。(2)重效应轻效果。这反映在多个方面:其一,重技术轻理论。教师热衷于技术的学习,而对教育技术理论则持怀疑、否定甚至拒绝的态度。其二,重制作轻应用。人们在制作教育教学软件的时候,错误认为“只要运用了教育技术,就一定能够促进教学”,不注重教学过程的设计、教学的反馈和评价,致使真正优质的教育教学软件稀缺。其三,重评奖轻实用。许多教师运用现代教育技术手段只是为了拿到参加各种比赛、公开课的入场券。(3)理论研究与实践需求存在较大差距。一方面,在教育技术的研究人员中,普遍存在重理论轻实践的现象,另一方面,教育技术的实际工作者,尤其是一线教学人员,存在重实践轻理论的现象。教育技术是理论和实践的结合,实践是理论的先导,同时理论指导实践,并在实践中检验和修改理论。这是一个反复的过程。教育技术研究人员和一线教师有各自的优势和不足,如果能够协力合作,交流沟通,优势互补,将会促进教育技术在理论和实践领域的更快发展。近几年,在这方面我国取得了一些进展,像“小学语文四结合教学改革试验研究”就是一个理论与实践、专家与教师密切结合的成功范例。
二、发展趋势
1.教育技术作为交叉学科的特点将越来越突出
教育技术属于交叉学科,是连接教育、心理、信息技术等学科的桥梁。作为交叉学科,首先体现在它需要技术的支持,特别是信息技术的支持。教育技术的发展与技术的进步密不
可分,在未来的发展中,信息科学和人工智能将发挥越来越重要的作用,教育技术应该关注如何更有效地使用技术以及如何利用技术来促进学习。因此,“研究人类智能及人类知识的机理以及如何用机器模拟人的智能并促进人类知识发展”的知识工程可以也应该作为教育技术学的一个重要研究方向。其次,教育技术作为交叉学科,体现在它融合了多种思想和理论。从教育技术的发展历程来看,教育技术的理论基础主要有教育理论、学习理论、传播学、系统理论等。时至今日,随着人本思潮的兴起,各种学习理论虽然各执一端,但在教育技术领域内走向了融合,以促进人的发展为目标而各尽其力。人们不仅关注个体的学习心理,还对学生之间如何协同与合作、如何基于问题进行综合性学习等进行着系统的研究。第三,教育技术交叉学科的特性决定了其研究和实践主体的多元化,协作将成为教育技术发展的重要特色。包括教育、心理、教学设计、计算机技术、媒体理论等不同背景的专家和学者共同研究和实践,开放式的讨论与合作研究已成为教育技术学科重要特色。
2.重视教育技术实践性和支持性研究
教育技术作为理论和实践并重的交叉学科,需要理论指导实践,在实践中进行理论研究。目前,教育技术研究最前沿的两个领域是信息技术与课程整合和网络教育,所有这些乃至终身教育体系的建立都强调对学习者学习的支持,即围绕如何促进学习展开所有工作。正因如此,人们将会越来越重视教育技术的实践性和支持性研究。(1)教师培训。支持学习首先是谁来支持以及如何支持,即教师培训问题。世界各国都很重视教师培训。2000年,美国国际教育技术协会制定了“全体教师的教育技术基本标准”,其中规定了教师应该具备的教育技术基本能力,为了达到该标准需要对教师进行系统的教育技术培训。此外,英国、法国、新加坡、韩国等国家也十分重视对教师的培训工作。据调查,大陆教育技术发展较快地区尚有1/3的教师对教育技术知识不甚了解或根本不知道。调查也显示,教学第一线的教师大部分欢迎教育技术培训,具有较强的学习动机。因此,如何对教师进行教育技术培训,特别是如何实施有效的培训,需要我们教育技术工作者在实践中进行不断的探索。(2)教学资源建设。在教学资源建设方面,特别是教育软件的设计和应用方面值得我们重视。当前教育软件的应用远远没有达到我们所预期的效果。比较突出的问题有:存在科学性错误、适用性较差、交互性不强、制作欠精细、智能性欠佳等。随着网络技术、智能技术、代理技术、虚拟现实技术、教育多主体技术等的不断发展,新一代的以网络为核心的智能教育软件将在教育软件市场占据越来越重要的地位。如何克服教育软件业目前的困难,开发出适合学习者特点和需求的网络教学资源,将成为资源建设中重要的研究任务。此外,为了使得教育资源能够大范围地共享和交流,网络教育技术标准研究成为近几年的热点问题。2001年,在教育部的组
织下,大陆成立了现代远程教育标准化委员会,专门从事网络教育技术标准的制定和推广工作。(3)学习支持。教育技术在研究与实践中对于学生学习的支持给予了密切的关注,这种支持包括在信息技术背景下特别是网络环境下学生的学习活动、教学组织和教学评价等方面。广大工作在教育一线的教师,能够深切感受到教学中存在的问题,也只有他们才能根据实际情况结合理论知识来解决问题。教育技术工作者应该为广大教师提供各种解决实际教学问题的思路和方法,有力地对学生的学习提供支持。
3.对于计算机教育应用的更全面的审视和研究
当前,世界各国都投入了大量的人力、物力和财力来研究和探索新技术在教育领域的应用。我们在为这些做法欣喜之时,不得不冷静地思考计算机应用于教育领域的若干问题,以期获得对计算机教育应用更全面的理解。(1)应用的针对性:实践证明,计算机并不是对所有学科和对象都同样有效,特别是涉及到人文类或者培养个人情感方面的有关学科以及注重实际操作能力培养的学科等。因此,需要把握的是计算机在教育中的应用应该针对哪些学科、知识点和学习对象而展开,应该采用什么样的策略来进行。(2)应用的条件:计算机应用于教育,应该考虑领导是否重视,资金投入能否跟上,教师是否具备基本的计算机技能,是否有足够的教学资源来支持,是否有足够的心理准备等。而且,各个条件之间存在紧密联系,对不同地区、不同学校而言,条件的标准和组合也各不相同。专门从事教育技术研究的工作者,就需要选择不同地区和类型的学校,通过充分的调研、实地考察和比较,进行科学试验,并将成功经验进行推广。(3)应用的有效性:应用的有效性包含了两层含义。一层含义是利用计算机教育教学的效果如何,通常以教育教学评价的结果作为主要参考。另一层含义是投入产出的比例如何,也就是效益问题。对于前者人们已经作了大量的工作,对于后者人们也越来越重视。但由于目前对计算机以及其他技术在教育上投入的效益问题还没有实际的研究成果,这会造成人们投入的盲目性,而且还会阻碍教育技术的进一步发展。全面研究计算机教育应用的有效性将是教育技术研究的重要内容。
4.关注技术环境下的学习心理研究
首先,需要研究不同的人在面对技术进行学习时的差异。目前,人们已经认识到问题的解决能力、创新思维、协作技能、信息素养等的重要性,但如何消除数字鸿沟,使所有的学习者应用技术进行有效学习,是环境建设和资源建设的重要研究课题。其次,需要进一步研究技术环境下人的学习行为特征和心理过程特征,人与技术环境如何实现交互,什么因素影响学习者的心理(比如动机)。随着技术的进步以及技术环境下学习心理研究的深入,教育技术领域的研究将不再只满足于技术的简单应用,适应性学习和协作学习环境的创建必将成
为前沿研究的焦点。技术所支持的学习环境将真正体现出开放、共享、交互、协作等特点,在这种学习环境中,将更注重学习者内部情感等非智力因素,更注重社会交互在学习中的作用。
5.更重视学习活动的设计与支持
未来的教学设计将不仅重视学习资源和学习过程的设计,而且更重视学习活动的设计和支持。为了培养综合素质的人才,教学设计将越来越关注课程整合尤其是一般学科与信息技术的整合。而在整合过程中,如何设计研究型的学习活动、基于实际问题的学习活动、综合型的学习活动、协作型的学习活动,以便让学习者综合应用多个学科领域的知识,培养创新人才是教学设计的重点,也是难点。学习者的学习过程和活动的设计将更加灵活和弹性化,教师在学习过程中的指导者角色将更为突出,学习过程的支持研究将变得更为重要。教师从“讲台上的哲人”转变为“学生身旁的指导者”也意味着,教学设计的方案不再像传统教案那样仅仅是教师教的过程的设计,教案应该向“学案”转变,学生学习过程和活动的设计将成为“学案”中的重要组成部分。当前网络教育开展得如火如荼,但是对于网络课程和网络教学结构还需要不断研究、探索、实践才能适应其迅速发展。网络课程建设需要更加注重学习过程、学习活动、学习组织和评价,尤其是形成性评价的设计。网络教学平台作为承载网络课程的工具,应该支持更加多样化的学习活动。随着网络教学理论的深入研究,学习活动将更加个性化、情境化、多样化、综合化。
6.进一步完善教育技术学科建设
现在,教育技术领域的学者和专家就教育技术是什么、教育技术的学科和课程体系、教育技术发展和实践过程中存在的问题和对策、教育技术的未来发展趋势等纷纷提出观点和看法,形成了百家争鸣的局面,这对教育技术学科的发展来讲是一件好事。作为一个学科的定位与学科建设,除了以上这些问题以外,还必须考虑从事工作的人群及其从事的工作,包括理论研究者、实践工作者及其他相关人员。
第二篇:光纤通信技术及其发展趋势
光纤通信技术及其发展趋势
摘要:光纤通信技术是目前通信行业应用的主要技术,光纤通信跟传统通信方式比较具有很强的优势,在通信网络中已得到广泛应用。光纤通信技术作为信息技术的重要支撑平台,在未来信息社会中将起到十分重要的作用。
关键词:光纤通信技术 优势 光纤到户 全光网络
中图分类号:TP39 文献标识码: A 文章编号:1007-9416(2011)07-0025-01
近年来随着传输技术和交换技术的不断进步,核心网已经基本实现了光纤化、数字化和宽带化。随着业务的迅速增长和多媒体业务的日益丰富,使得用户住宅网的业务需求也不只局限于原来的语音业务,数据和多媒体业务的需求已经成为不可阻挡的趋势,现有的语音业务接入网越来越成为制约信息高速公路建设的瓶颈,成为发展宽带综合业务数字网的障碍。
1、光纤通信技术
光纤通信是利用光作为信息载体、以光纤作为传输的通信方式。在光纤通信系统中,作为载波的光波频率比电波的频率高得多,而作为传输介质的光纤又比同轴电缆或导波管的损耗低得多,所以说光纤通信的容量要比微波通信大几十倍,图1为光纤结构图。
2、光纤通信技术优势
2.1 频带极宽,通信容量大
光纤比铜线或电缆有大得多的传输带宽,单模光纤具有几十GHz?km的宽带。目前,单波长光纤通信系统的传输速率一般在2.5Gbps到10Gbps,采用密集波分复用术实现的多波长传输系统的传输速率已经达到单波长传输系统的数百倍。巨大的带宽潜力使单模光纤成为宽带综合业务网的首选介质。
2.2 损耗低,中继距离长
目前,实用的光纤通信系统使用的光纤多为石英光纤,此类光纤损耗可低于0.20dB/km,这样的传输损耗比其它任何传输介质的损耗都低,因此,由其组成的光纤通信系统的中继距离也较其他介质构成的系统长得多。
2.3 抗电磁干扰能力强
我们知道光纤原材料是由石英制成的绝缘体材料,不易被腐蚀,而且绝缘性好。与之相联系的一个重要特性是光波导对电磁干扰的免疫力,它是一种非导电的介质,交变电磁波在其中不会产生感生电动势,即不会产生与信号无关的噪声。这样,就是把它平行铺设到高压电线和电气铁路附近,也不会受到电磁干扰。这一点对于强电领域(如电力传输线路和电气化铁道)的通信系统特别有利。
2.4 光纤径细、重量轻、柔软、易于铺设
光纤的芯径很细,约为0.1mm,由多芯光纤组成光缆的直径也很小,8芯光缆的横截面直径约为10mm,而标准同轴电缆为47mm。这样采用光缆作为传输信道,使传输系统所占空间小,解决了地下管道拥挤的问题,节约了地下管道建设投资。此外,光纤的重量轻,柔韧性好,还有,光纤柔软可绕,容易成束,能得到直径小的高密度光缆。
2.5 保密性能好
对通信系统的重要要求之一是保密性好。电通信方式很容易被人窃听,光纤通信与电通信不同,由于光纤的特殊设计,光纤中传送的光波被限制在光纤的纤芯和包层附近传送,很少会跑到光纤之外。并且成缆以后光纤在外面包有金属做的防潮层和橡胶材料的护套,这些均是不透光的,因此,泄漏到光缆外的光几乎没有。更何况长途光缆和中继光缆一般均埋于地下。所以光纤的保密性能好。此外,由于光纤中的光信号一般不会泄漏,因此电通信中常见的线路之间的串话现象也可忽略。
3、光纤通信技术在接入网的应用
目前莱芜市所用的接入网技术为ADSL,其全称是Asymmetric Digital Subscriber,中文意思是“非对称数字用户线路”。它以普通电话线路做为传输介质,既在普通双绞铜线上实现下行高达8Mbit/b传输速度;上行高达640Kbit/s的传输速度,但这种技术不能满足人们对上网速度越来越高需求。
3.1光纤接入网的优势
接入网采用无线网络是未来通信行业的发展趋势,但无线接入网仍需要光纤网络的支撑,其优势体现为:
首先,通信网在一开始采用的是金属线缆,铜缆网的故障率很高,维护运行成本很高,而采用光接入后,每年的维护运行和供给成本可以比传统铜缆网每线大约节约400元,对于一亿用户相当于每年节约400亿元,而且其故障率也大大降低。
其次,对于新业务的发展,特别是多媒体和宽带新业务,能够加强企业的竞争力,增加新业务的收入,同时可以补偿建设光用户接入网所需的投资,最后,光接入网可以满足用户希望较快提供业务,改进业务质量和可用性的要求,也可以节约地下管道空间,延长传输覆盖距离,总之,采用光接入网能够解决通信行业发展的瓶颈问题。
3.2 光纤通信技术发展的制约因素
铜缆网传输的是电子信号,交换采用的是电子交换机,现在,通信网络大部分都是光纤,传输的为光信号,光交换的形式,由于目前光交换器件还不成熟只能采用光-电-光的形式。这种方式效率不高也不经济,目前ASON-自动交换光网络的开发缓解了这一问题,但对大容量光开关的开发也迫在眉睫。
目前为止我国的光缆技术有了很大的发展,从光进铜退开始,公司采用了多个厂家的光缆,国内生产光缆的厂家大约有200家,但其产品单一,很少具有自主知识产权,技术含量较低,竞争力不强,有关资料显示,自1997年截止到2010年我国光缆专利的申请只占国外同期专利申请的20%,而光核心技术只占国外的10%。这些数据显示我国与国外在光纤技术发展上差距较大,我国作为世界第二光缆大国,应该把发展自主知识产权的技术作为重中之重。
4、结语
从光纤通信问世到现在,光传输的速率以指数增长,光传输的速率在过去的十几年中大约提高了100倍。层出不穷的光通信新技术将成为市场复苏的源泉,随着光纤网络从骨干网的扩建到接入网、城域网的扩散以及向用户驻地网的不断延伸,光纤网络市场必将增长。
参考文献
[1]马金洋.《光纤通信的现状和前景》[J].电信科学.[2]辛化梅,李忠.《论光纤通信技术的发展和现状》[J].山东师范大学学报.[3]蒋力三.《光纤通信技术的发展》.中兴通讯资料.
第三篇:多媒体技术发展趋势
多媒体技术发展趋势
1、发展趋势状况
总的来看,多媒体技术正向二个方而发展:一是网络化发展趋势,与宽带网络通信等技术相互结合,使多媒体技术进入科研设计、企业管理、办公自动化、远程教育、远程医疗、检索咨询,文化娱乐、自动测控等领域;二是多媒体终端的部件化、智能化和嵌入化,提高计算机系统本身的多媒体性能,开发智能化家电。
迎接21世纪国际竞争的挑战和教育改革的实践,由于技术的进步,特别是信息化步伐加快,使这一教育观念转变过程,不仅仅是思想解放,更是一个实践推动的过程。数字化技术将文件处理带入了新的领域,让人们可以用更快的速度生产文件,用更便捷的方式修改图像和文件,利用网络通讯把图像和文件迅速地传到四面八方。经过数字压缩,从根本上解决了录像带资源长期保存的问题。未来的人们需要某一内容时,可以通过网络调出,在网络终端上阅读,满意时,再从终端打印机上打印出来。因特网就是在这种背景下,不知不觉地走近了我们的生活。1997年,中国媒体对网络的报道不断升温,因特网信息服务提供商开始了商业运作,反映到教育领域,这些技术的变化,推动了学校电化教育的大力普及。很多在过去传统教育手段和方法下难于解决的问题,在今天的数字化方式下迎刃而解了。
2、蕴藏的巨大发展空间
先进的多媒体技术蕴藏着巨大的发展空间。
荷兰电子制造业巨头飞利浦电子公司(PhilipsElectronics)前天表示,它正在准备批量生产一种体积小巧、类似书籍大小的显示器,消费者将可以利用这种显示器下载报纸和杂志,然后把显示器卷起来收藏好。这种五英寸的显示器可以呈现出精细的影像,并能折放进钢笔大小的存放器中。如果它与手机相连接,还能用以下载网页、书籍或电子邮件。飞利浦表示,它利用由塑料制成的电子电路研发出了上述单色显示器。飞利浦研究部门发言人表示:“我们将可以批量生产这种显示器,它已经不再是一个研究项目,我们将建造一个试点生产线,预计可以在2005年投产,届时年产量可以达到100万台。”
时代的步伐把我们带到了21世纪,面对信息时代,世界上任何一件事物都是由信息组成的。网络、商务已经变成昨天的话题。人们工作依赖于信息,生活还是依赖于信息。作为商务活动中最传统的组成之一的名片依旧据占着历史。为什么没有多媒体名片?为什么没有internet名片?为什么没有pda名片?传统的名片以纸张为介质,传达姓名、电话、公司等极为有限的信息。对于今天的信息时代,这些信息显得有点“寒酸”。这点儿三言两语要把个人或公司介绍的比较详细是不可能的。怎样实现用名片的形式来表达更多的内容和完整的企业形象呢?多媒体技术给出了答案。把声音、影视,把交互,以至于三维、四维的元素以多媒体的形式表现在名片上,使多媒体技术应用的更广。
其实多媒体名片只是作为生活多媒化的起点,倡导多媒体的多元化,使多媒体不只应用在多媒体光盘上,在“蓝牙”、“pocket”等新技术下使多媒体技术、概念真正的走进生活,走进各个领域。
设计和技术是同等重要的,关键是把“前”的设计与“新”的技术相互结合,用在设计上。首先是商务活动信息时代化的概念得以应用。其次是多媒体设计艺术、技术的大众化,并突出公司的形象。目前国内外还没有把多媒体名片或internet名片作为项目进行开发和设计制作。传统的名片还是统一着天下,只有多媒体光盘性质的公司简介。以多媒体名片作为一个多媒体应用的一个缩影,国外在多媒体应用上要领先于我们,比如数字化多媒体冰箱,数字化多媒体房屋等。虽然我们硬件,软件和国外有着一定的差距,但是观念上我们要赶超国外。
2003年,市场研究公司ForresterResearch预测,苹果计算机公司进入音乐下载服务市场将使该公司在这个迅速扩张的市场中获得一块份额。这家公司在5月15日发表的一篇研究报告中预测,欧洲数字音乐下载服务服务市场到2007年将价值13亿欧元。这个市场2003年的收入只有2,400万欧元,但是将占2007年全部音乐销售收入的13%。美国数字音乐下载服务服务市场到2007年将价值20亿美元。Forrester公司称,这些收入大多数来自个人下载,并不是基于订阅的服务。更过的合法服务的出现和更高的宽带网普及率将推动这种增长。研究分析师RebeccaJennings表示,最近EMI公司和苹果公司宣布进入这个市场的消息表明,主要音乐公司和技术公司现在正开始认真对待未来的数字音乐。虽然美国合法的音乐下载市场已经摆脱了障碍,在2002年达到了1,500万美元,但是,欧洲市场落后了。这是因为正式的服务仅集中在美国,欧洲家庭宽带网的普及一直比较缓慢。但是,在今后几年里,数字音乐的传播将迅速增长。这篇报告预测,消费者的需求将迫使唱片公司向欧洲市场扩张。报告指出,宽带网用户下载MP3音乐的人数可能会比窄带用户多123%。Jennings表示,欧洲消费者最喜欢购买单曲唱片。在2002年,欧洲人购买了大约1.65亿张单曲唱片,而美国单曲唱片仅销售了900万张。Jennings预计,欧洲消费者一般都下载单曲唱片,在欧洲的数字音乐销售将有42%是单曲唱片。在2007年,成套唱片将占下载音乐的49%。分析人士表示,还有基于订阅的服务。到2007年,将有200万用户为这些服务支付1.25亿欧元。
20世80年代,美国APPLE公司成立计算机多媒体实验室,主要研究计算机技术同多种信息媒体相结合,并首次推出了MACHITOSH系统机,标志着早期多媒体技术的兴起。进入20世纪90年代,多媒体计算机技术迅速发展,给信息传播带来了一场革命。现代意义上的多媒体以计算机技术作为支撑,不仅具有计算机所固有的存储记忆、高速运算、逻辑判断、自行运行等功能,还采用了图形窗口、交互界面、语音识别和触摸屏等先进方式,使计算机不仅具有了处理文本、图形、音频、视频的能力,并能够用人类习惯的方式、图像、声音,生动逼真地传播和表达信息,与人类交流。多媒体技术的广泛应用促进了多媒体语音室、多媒体计算机模拟实验室、电子图书室、多媒体教学管理等的蓬勃发展。此外,网络的出现与发展,使以因特网(INTERNET)为主要标志的网络技术构成了现代技术文化的重要部分,联系上亿人的因特网将人类带入了一个全新的数字化时代,拓展了人类的第二生存空间——网络社会。在网络社会的大背景下,网络技术与教育更是结下不解之缘:美国在1998年公布了INTERNET计划,宣布要使每一所学校、每一间教室、每一家庭和每一个美国公民都能享受INTERNET带来的全新的学习环境;英国政府建议成立网上工业大学,并推出“全国学习网”,目标是到2002年使英国3.2万所中小学全部进入因特网;我国教育部1999年推出《面向21世纪教育振兴行动计划》将校园网的构建提到日程上来,2000年4月中国基础教育网正式开通,同年10月国家教育部宣布全面实施“校校通”工程,目标是在未来的5-10年内使全国90%以上的中小学能与网络联通,到2005年使所有大学和一千所中小学上网。
3、在网络教学上的发展
“多媒体”与“网络”的联姻促成了“多媒体网络教学”的产生。作为信息时代的教学媒体,多媒体网络技术所具有的集成性、交互性、可控性、信息空间主体化和非线性等特点使其与黑板、粉笔、挂图等传统媒体有质的区别。多媒体与网络技术特有的优点使其对教学的介入,不仅改变了教学手段,而且对传统的教学、教学模式、教学内容、教学方法等产生了深远的影响,极大地冲击了机器工业时代“大批量生产”形式的教学。目前这一技术正向着交互性、非线性化、智能化和全球化的方向推进。
三、总结
从多媒体技术的发展趋势来看,多媒体技术的数字化将会是未来技术扩张的主流,而作为多媒体技术赖以存在和发展的重要基石,数字多媒体芯片技术将成为未来多媒体技术革命中的焦点,不管是从以PC技术为依附的计算机多媒体应用,到移动通信业务的各种多媒体实现,以及未来3C时代各种电子化装置的多媒体大融合,数字多媒体芯片都是无可置疑的主角
第四篇:城乡统筹发展中的几个问题和误区
城乡统筹发展中的几个问题和误区
统筹城乡发展,是全面建设小康社会的根本要求,是党中央从战略全局出发做出的重大决策。2010年中央一号文件,把加大统筹城乡发展力度作为重要主题,与时俱进地提出了统筹城乡发展的新要求。统筹城乡发展,既要鼓励积极探索,大胆实践,又要把握好方向,防止走形变样。一些地方以统筹城乡为名,统农村的土地资源多,筹农村的公共服务少;统城市的建设项目多,筹农村的民生工程少。这些做法背离了城乡一体发展的宗旨。从根本上讲,统筹城乡经济社会发展,就是要破除城乡二元结构,公平对待农民,使农民获得平等的教育、就业、公共服务和社会保障等权益,提高农民的社会地位,让农民平等参与现代化进程,共享改革发展成果。
统筹城乡发展,在政策部署上,要把握好以下三大问题。
第一,城乡基本公共服务均等化问题。城乡统筹首先要在城乡公共服务均等化上综合运筹。要统筹城乡基础设施建设,推动城市基础设施向农村延伸,加快农田水利、农村饮水安全、农村公路、农村能源、农村信息网络等基础设施建设。要统筹城乡社会事业发展,为城乡居民提供均等化的教育、医疗卫生、社会保障、文化等基本公共服务。要促进城乡义务教育均衡发展,做到县域内学校办学条件大致均等,促进农村义务教育质量大幅度提升。全面实行免费的农村职业教育,进一步提高农村地区高中教育普及程度。进一步巩固和发展新型农村合作医疗制度,逐步提高政府和农民个人筹资标准,提高新型农村合作医疗的保障水平。建立健全农村三级医疗卫生服务网络,向农民提供安全价廉的基本医疗服务,加强农村妇幼保健,全面实施农村妇女住院分娩补助政策,使农民享有公共卫生服务水平得到进一步提高。完善农村最低生活保障制度,健全农村社会救助体系,加快建立新型农村社会养老保险制度。逐步提高扶贫标准,扩大扶贫政策覆盖范围,对农村低收入人口全面实施扶贫政策,实现扶贫和低保两项制度有效衔接。建立健全农村文化设施网络和文化服务机制,大力发展公益性文化事业。近年来,无论是财政对“三农”投入总量、增量,还是增幅,都是较高的。但财政支农资金比重总体上处于波动和下降状态,财政支农力度与国家财力的增长状况还不相匹配。不能光看财政支农资金总量和增速,还要看比重和口径。2003年至2008年,中央财政支农资金占财政支出的比重分别为:8.7%、9.3%、8.8%、8.4%、8.7%和9.8%,相对于农村人口规模和农民对公共服务的庞大需求而言,财政在农村投的钱不算多,公共财政的阳光还没有真正做到普照农村。随着我国财力的增强,要更加自觉、更大幅度地调整国民收入分配格局和国家财政支出结构,促进公共财政资源在城乡均衡配置,完善对农业生产和农民增收的财政支持与补贴政策,全面提高财政对农村基础设施和基本公共服务的保障水平,巩固和完善强农惠农政策。要尽快制定和完善有关法律法规,明确界定财政总支出中“三农”支出的内涵,强化法律约束,建立财政资金“三农”投入稳定增长机制,力争在“十二五”期间末将中央财政支农资金占财政收入的比重提高到10%以上。抓紧划分中央与地方的支农事权,完善转移支付办法,建立中央与地方财权和事权相匹配的财政支农体制。积极利用财政贴息、补助等手段,引导社会资金投向农村。创新农村投融资体制,拓宽“三农”投入来源渠道。根据财政支农目标和重点,有效整合财政支农资金,突出财政支农资金的公共性,健全政府农业投资监督机制,发挥资金使用的综合效果。
第二,农民工的市民化问题。城镇化的一个根本标志就是农村人口向城镇转移并沉淀在城镇,吸纳农业转移人口在城镇就业和定居,并使之向市民转变,是城镇化的重要任务,是破除城乡二元结构的重大举措。我国农民工转移的稳定性得到显著提升,流动的“家庭化”趋势明显。新生代农民工成为主体,他们对土地的情结弱化,思想观念、生活习惯、行为方式已日趋城市化,融入城市的意愿强烈。针对农民就业和转移政策,实际上过去30年可以划分为三个阶段:上世纪80年代的政策基调就是消除离土的限制。因为在改革开放前,农民没有自由转移就业的权利,80年代乡镇企业发展起来了,促进了农民就地转移;90年代的政策基调是消除农民离乡的限制。90年代初农民工规模只有几百万人,1993年才不到2000万人,现在外出就业是1.5亿多人,90年代后政策有了根本性调整,消除了农民流动就业的限制。进入新世纪,我国政策基调正在向消除农民工在城镇定居限制的方向转变。这个方向符合亿万农民工的意愿,符合城镇化发展的客观规律。今年一号文件一个很大的亮点就是明确提出,要创造条件,要让一部分农民工,特别是新生代农民工在城市定居,在城市落户。已经有13个省市区宣布改革户籍制度,取消农业户口和非农业户口的划分,实行新的户口制度。但大部分省市区的户口制度改革是形式上的、表面的,没有给农村人口提供与城市人同等的享受公共服务的权利。户籍制度改革的正确方向,就是把户籍的登记与公共服务的提供脱钩。不能只给有了户口的人提供公共服务,将来的公共服务提供要与居住直接结合在一起,让符合条件的农民工享受同等权利和待遇。农民工是最需要改善居住条件的社会群体,目前,大部分农民工集中在城中村、城乡结合部租房,居住条件恶劣。形成适合农民工特点的住房供应体系和政策体系,是农民工融入城市需要解决的一个大问题。要多渠道多形式改善农民工居住条件,鼓励有条件的城市将有稳定职业并在城市居住一定年限的农民工逐步纳入城镇住房保障体系。当然,当前的重点是从中小城市和小城镇做起。农民工真的要成为市民,首选的是中小城市和小城镇,他们在大城市打工,但最终希望在当地县城买房定居。
第三,农民土地权益保护问题。城乡统筹难点、焦点、分歧点都在土地问题上。我国农村与城市土地制度仍然维持着二元性,农民对土地的权利一直处于相对弱势。随着工业化与城镇化的快速推进,城镇建设用地迅速扩张,产生大量的失地农民。农业用地转化为非农建设用土地的过程,不是一个平等的、协商的产权交易过程,征地范围过宽,征地补偿办法不合理,征地程序忽视农民意愿,失地农民生活无着落、长远生计缺乏保障。近几年,在国家实行最严格的耕地保护制度背景下,不少地区开始推行宅基地和村庄整理,将节省出的部分土地转换为城镇和工业建设用地。农村土地整理为工业和城市发展腾出了空间,在一定程度上促进了土地集约利用与新农村建设,但也存在着农民和集体土地权益得不到有效保障等一系列问题。关于土地问题,还是要回到现实当中来。什么是现实当中土地的真问题,什么是农民真正关心的土地问题?城里人议论很多农村土地问题,对农民来讲,可能根本不是一个问题。
根据观察,关于农村土地问题在认识和实践中存在三个误区。第一个误区是片面强调搞土地的规模经营,片面强调要流转土地。2005年我们在全国2749个村庄做了一个调查,发现有23%的农户发生过土地流转。到农民那里问,有没有想多种地的?有很多;有没有农民不想种地,找不到租种的?几乎没有,农民不想种总会有办法流转出去,这说明,农民自发的土地流转是比较充分的。
第二个误区是片面强调农民当了市民,拿土地换户口和住房,拿土地换保障。这个问题在现实当中非常复杂。根据土地承包法规定,农民在设区的地级市以上城市落户要放弃家庭承包地。南京市要给50个优秀农民工落户,但只有一个农民办了落户手续。农民讲,家里还有十几亩地,把土地就这么放弃了,给一个城镇户口,不划算。因此,首先要明确土地是一种权利,是一种物权,拿着土地权利去换户口,对农民这可能是一个更大的损害。这个问题理论上要把它说透,在现实操作中才不出偏差。鄂尔多斯东胜区搞了一个城乡统筹实验区,就是要让农民成为新型市民后,农村的土地权利没有任何改变,城镇居民能享受的所有权利都可以享受,而且比城镇居民还要优惠。在一定阶段这种做法是有意义的,是有价值的。农民刚到城里来,就把农村的承包地、宅基地都给拿走,一旦不适应,连个退路都没有。
第三个误区是一讲城乡统筹,就是强调城市建设用地增加要与农村建设用地的减少相挂钩。这个挂钩的规模是非常大的,当项目来了,没有建设用地指标了,就要让农民把宅基地捣腾出来,土地腾出来以后大都转为国有建设用地。从研究的角度来讲,我们要看得更长远一点,农村庞大的建设用地背后是一个巨大的利益调整。农民可能只看到三、五年,房子比原来漂亮了,但没有看到土地如果真的权利明晰以后,可以给社区集体,给农民带来一个长远的巨大利益。在土地问题上,如果现在操之过急,没有一个规范,最后把农民的土地承包经营权统没了,把农村集体土地所有权统没了。
土地制度事关农村基本经营制度巩固,事关农村稳定大局,需要关注什么是农民关心的真问题。局部地区可以做一些实验,可以做一些探索,但是一定要意识到有一些探索可能会有风险,在推广这些经验的时候,学术界在总结这些经验的时候一定要非常谨慎。要进一步统一认识,明确政策方向。一是切实稳定农村土地承包关系。全面颁发农户长久拥有的具有明确法律效力的土地承包权证书,确保农民不丧失土地承包经营权。在土地流转过程中,要保证农民是经营主体和受益主体。在现阶段,不应提倡工商企业长时间、大面积租赁和经营农户承包地,以防止出现大资本排挤小农户和大规模土地兼并现象。二是在农民变市民过程中,不能把农民的土地权益“变没了”。从我国的基本国情看,现阶段让农民以放弃土地为代价,获得市民身份并享受与市民一样的待遇是不现实的。应当看到,农民市民化是一个漫长的过程,在这个过程中,既要创造条件,让农民在城市里能够住有所居、劳有所得、病有所医、老有所养,又允许农民继续享有对承包地的权益,以此作为应对不确定性及各种风险的生存保障,让农民“既进得了城,又回得了乡”。“家中有地,进退有据”。这是保护农民利益的需要,也是促进城镇化健康发展的需要。三是在“城镇建设用地增加与农村建设用地减少挂钩”实施过程中,要切实保护农民的土地承包权和宅基地权益。特别是在农村土地整理过程中,首先要把增加优质耕地作为目标,节省出来的建设用地,要优先满足新农村建设的需要,不能把增加城镇建设用地作为土地整理的主要目的。
第五篇:搜索引擎优化技术及发展趋势
搜索引擎优化技术及发展趋势
一、引言
“搜索引擎”作为互联网上提供信息服务的一种工具,现在几乎已经是一个妇孺皆知的事物。按照中国互联网络信息中心在2006年7月19日发布的报告[1],中国网民中有66。3%经常使用搜索引擎,比半年前又提高了近1个百分点。
互联网上的第一代搜索引擎出现于1994年前后,以AltaVista、Yahoo和Infoseek为代表,搜索结果的好坏通常用反馈结果的数量来衡量,或者说是“求全”。然而研究表明,当时的搜索引擎性能并没有想象中那么优秀,根据SteveLawrence和C。LeeGiles在1999年2月的实验[2],全球11个主要的搜索引擎中,每个搜索引擎仅能搜索到互联网上全部页面的16%,甚至更低(图1)。造成这种情况的原因,主要是这些搜索引擎的处理能力和网络带宽等方面的限制。
1998年,以Google为代表的第二代搜索引擎出现在互联网上,其主要特点是提高了查准率,或者说“求精”。当时传统的搜索引擎如Lycos等主要使用网页中的关键词进行搜索,而Google则使用了一种综合页面排名算法:它不仅考虑搜索关键词,还考虑页面间的链接关系,然后对整个网络的链接结构进行分析和迭代计算,从而对页面进行区分[3]。
第二代搜索引擎在技术和商业上都获得了巨大成功,然而商业竞争和信息环境的变化仍在推动着它们不断创新和发展。当前所谓的第三代搜索引擎主要增加了互动性和个性化等技术,为用户使用搜索引擎获取信息提供更好的体验。至于互动性的评价标准是什么,以及第三代搜索引擎到底比第二代增加了多少价值,目前并没有非常令人信服的研究结论。在以下的论述中,我们不对产品概念进行太多讨论,而是就搜索引擎目前所面临的挑战,以及它们的应对方略和发展趋势进行梳理和阐述。
二、搜索引擎面临的挑战
面对瞬息万变的环境,搜索引擎如果在技术上不创新进取,从信息服务质量的角度讲,现在看来不错的技术,将来很可能会落伍。不进则退,在搜索引擎领域体现得很明显。关于搜索引擎的基础技术,读者可参见文献[23],那么目前有些什么变化在影响着搜索引擎呢?
(一)Web的发展
1。信息大量增加
Web自产生以来,其信息量一直以几何级数的形式递增,近两年来尤其如此。这主要有两方面原因:首先是Web2。0[16]的用户和以前有所不同,他们正在由单纯的信息消费者向生产者与消费者双重身份转变;其次是DeepWeb[4]的发展。
如果说Web1。0是单纯的网页浏览模式,那么Web2。0则是通过了真正的个性化、去中心化和信息自主权,向着内容更丰富、联系性更强、工具性更强而努力。尽管一切都还在探索中,但毋庸置疑,Web2。0已经成为互联网新的发展趋势。这种转变,从模式上可以概括为是从单纯的“读”向“写”和“共同建设”发展。这也更体现了互联网的第一规则,“用户需要表达”。只要有机会和便利,网民就不会满足于只是被动的信息接受者,他们需要表达,希望驾驭自己的传媒,而不是受其掣肘。在Web2。0实际应用中,除了原先的IM(InstantMessenger,即时通讯)、P2P(PeertoPeer,对等网络)等得到新的发展,更是涌现出了很多社会化的新事物,比如Blog(Weblog,网络日记)、RSS(RDFSiteSummary,站点摘要)、WIKI(网络百科)、WB(WebBookmarks,Web文摘)、SNS(SocialNetworkSoftware,社交网络)等。
这些新事物发展得非常快。以RSS为例,美国提供RSS内容的网站数目从2001年9月的1000余家激增至2004年9月的195000余家,短短的3年中增长了近150倍,市场的飞速发展令人瞩目。而Blog站点的大量涌现,更是为每一位用户都提供了畅所欲言的场所——据计世资讯(CCWResearch)的统计,2006年第二季度,中国注册博客的总数量达到6800万,比第一季度增长51。1%;中国博客用户则达到2100万人,比第一季度增加40。0%。这些无疑都在刺激着Web信息生产和消费的繁荣。
根据AlexandrosNtoulas等人的研究结果[5-6],每星期Web上新产生的页面数大约为8%。而这个数字是非常保守的:他们的实验是针对154个“popular”网站进行的,而实际上,那些大量涌现的新网站,如Blog网站,它们的成长速度远远超过这些所谓的流行网站。
关于DeepWeb的研究最近几年也受到越来越多的关注,DeepWeb又被称为InvisibleWeb或者HiddenWeb。JillEllsworth于1994年首次提出的InvisibleWeb概念,是指那些常规搜索引擎难以发现的内容。美国互联网专家ChrisSherman和GaryPrice在他们著作《TheInvisibleWeb》中将InvisibleWeb定义为:“在互联网上可获得的,但传统的搜索引擎由于技术限制不能或者经过慎重考虑后不愿意作索引的那些文本网页、文件或其他高质量、权威的信息。”InvisibleWeb分为四种类型:不透明网络(theOpaqueWeb)、私人网络(thePrivateWeb)、专有网络(theProprietaryWeb)和真正的隐形网络(theTrulyInvisibleWeb)。我们认为使用“deep”更为合适,因为这些内容不是真的Invisible,只是藏在Web中较深的位置。
根据BrightPlanet公司的调查[4],2001年的DeepWeb大概是SurfaceWeb的500倍左右,而且还在快速发展。ChrisSherman和GaryPrice的估算则保守些,他们认为InvisibleWeb只有SurfaceWeb的2~50倍。但不论如何,DeepWeb在数量上都不容小觑。更为重要的是,DeepWeb通常都组织良好、信息权威、质量很高,而且时新性强。正因为这样,国内外许多研究者都在克服重重困难,探索如何有效地发现这些有价值的信息,提供给更多用户使用。各大搜索引擎要想巩固和强化在搜索市场的地位,就必须重视DeepWeb,发展搜索技术,提高竞争力。对于垂直搜索而言,DeepWeb的作用更为突出。
Web信息的大量增加,使得搜索引擎面临严峻的挑战。任何技术都有它的适用范围,超出这个范围,其性能将严重下滑。以搜索引擎的检索页面集为例,粗略地说,当页面总数没有超过某个阈值时,搜索引擎工作良好,一旦页面总数超过这个阈值,搜索引擎的查询结果质量将急剧下降,用户往往在查询返回结果的前10位、前20位甚至前50位都找不到一个自己想要的结果。这一点在目前的几大搜索引擎上都已经初现端倪,相信他们已经为此绞尽脑汁。
2。信息更新加快
Web上不但新信息涌现速度很快,信息变化速度也非常快。以网页中的链接为例,根据AlexandrosNtoulas等人的研究结果[5],每星期将有25%的新链接产生,1年之后,将只有24%的原有链接仍然存在。Google等搜索引擎的成功在于正确地分析了页面间的链接关系,为了保持这种成功,搜索引擎必须不断地跟踪链接结构的变化,或者说不断地刷新自己所保存的相关信息。就以每周25%的新链接为例,这样的链接更新速度要求搜索引擎至少每周重新计算一次所有页面的Ranking值,否则便不能及时地、恰如其分地反映RealWeb上的当前状况,失去搜索引擎所必需的时效性(timeliness)和时新性(freshness)。
3。信息表现形式多种多样
随着网络速度的提高,Web上的多媒体信息也急剧增加,因此人们对多媒体信息的检索需求也就随之而来。传统的信息检索主要集中于文本的检索,在多媒体方面的研究并不是很多。需求的发展使得目前各大搜索引擎都不断推出自己的多媒体素材搜索产品,让用户可以在庞大的素材库中进行检索,如AltaVista可以让用户在5。5亿个素材(包括5。4亿个图片、1100万个视频/音频文件)中进行检索,Google的素材库也达到了4。4亿的量级。然而,目前对这些多媒体素材库的使用,大多还是标注、分类等方法,缺乏对图像、音视频内容的直接检索。搜索引擎如何自动分析音视频的内容,允许用户按内容进行检索,甚至在抓取音视频素材时就按内容进行,这些问题将在今后较长一段时间内构成挑战,成为搜索引擎所要迫切解决的问题。
4。SEO正在蓬勃发展
自古有矛便有盾,有盾便有矛。SEO目前已经成为一个新兴的互联网行业。SEO是SearchEngineOptimization的缩写,即搜索引擎优化。从事这方面工作的就是SearchEngineOptimizer——搜索引擎优化师。他们利用工具或其他手段使目标网站符合搜索引擎的搜索规则从而获得较好的网站排名。无止境地追求更高排名是搜索引擎优化师们的目标,因为他们知道,如果想让用户在烟波浩渺的Web中发现自己,获得一个很高的排名无疑是非常有效的一种方法。
客观地说,SEO的这种追求是很自然的,因为经济利益的诱惑实在是太大了。根据USCensusBureau的调查,2004年美国的电子商务销售额就达到692亿美元,并以7。8%的年增长率在发展,远远超过美国的GDP增长。而根据ForresterResearch的预测,美国B2C的销售额将于2010年达到3290亿美元,占全部零售额的13%。如果不能让用户认识自己,何谈电子商务呢?“搜索引擎优化”正是让大量用户认识自己的一种有效手段。
搜索引擎优化师们并不等于垃圾页面制造者,但他们中的一部分的确为Web和搜索引擎制造着麻烦,为搜索引擎用户制造着垃圾。虽然有良好素养和道德观念的搜索引擎优化师们仍然通过网站结构的优化、页面质量的提高等方法进行他们的工作,但那些不道德的搜索引擎优化师们发现有一些“捷径”更加有效,如在页面上堆砌大量关键词、使用重定位手段欺骗WebCrawler程序、构造LinkFarm来提高目标页面的排名,等等[7,8]。他们运用这些手段欺骗搜索引擎,浪费了搜索引擎大量带宽和时间,污染了搜索引擎的页面集合,歪曲了排名结果,浪费了用户的时间和精力,最后带给用户的只是大量垃圾。
这些垃圾制造者通常被称为WebSpammer。他们所运用的手段有Boosting技术和Hiding技术两大类:Boosting技术是指使用不道德的页面排名提升技术,而Hiding技术是指对使用的Boosting技术进行隐藏,尽量不让用户和WebCrawler发现。
Boosting技术包括TermSpamming和LinkSpamming。TermSpamming是较早出现的技术,是指Spammer操纵Web页面的正文,使其内容和众多的用户查询尽可能地相关,方法是在Body、Title和AnchorText等处插入大量毫无关联但用户经常使用的关键词。由于技术简单,只需要把别人已有的内容进行重复、编织和黏合,所以至今很多Spammer还在采用这些TermSpamming技术,而且已经发展到自动化和智能化的程度。LinkSpamming则更具隐蔽性,WebSpammer通常使用HoneyPot或构造强有力的LinkFarm来提高目标页面的排名。一个典型的LinkFarm可能包括几千个支持页面,而LinkFarm之间还可以构成威力更大的联盟[7]。由于隐蔽性很强,对于LinkSpamming的探测非常具有挑战性。
Hiding技术主要包括ContentHiding、Cloaking和Redirection。ContentHiding是指正文和页面背景使用相同的颜色,从而掩盖大量的无关正文,使得WebCrawler能够发现而对用户进行屏蔽。Cloaking是指对WebCrawler返回一个不同的页面,从而欺骗搜索引擎。Redirection本质上和Cloaking一样,但它是对浏览器而非Crawler返回不同的页面。Hiding技术也是Spammer所常用的,有时利益如此诱人,以至于一些著名大公司也跃跃欲试,如2006年初的时候,宝马德国公司网站(bmw。com。de)就曾因为使用了该欺骗技术而遭到Google的惩罚。
(二)用户需求的发展
1。更准、更全、更新、更快
经过十几年的技术发展和市场成熟,搜索引擎正日益渗透到人们日常生活的方方面面,人们对信息的获取越来越依赖搜索引擎。在全世界网民中,搜索引擎的使用率仅次于电子邮件而位居第二。随着对搜索引擎的使用不断走向深入,网民的要求也在提高。从产品层面来看,准、全、新、快仍然是用户对搜索引擎最基本的四个要求,而且用户希望搜索引擎在这些方面能做得更好。
目前而言,围绕这几个问题,各大搜索引擎服务商都在做许多细致的工作,以力求趋向完美解决。比如“准”,需要更准确地理解用户需求,不断更新Ranking算法,同时又要严格控制垃圾网页的干扰;“全”指的是全面,尽可能地把互联网中“有价值”的网页都索引下来,满足最大用户群的需要;“新”要求搜索引擎的抓取非常高效,能够把最新的东西及时提取出来,同时还要不断更新已抓取信息;第四点是“快”,不仅要让用户感觉速度很快,还要保持最大的系统稳定性。“搜得准、搜得全、搜得新、搜得快”,这是一个综合的服务过程,任何一个环节出了问题,都有可能导致用户满意度的下降。
2。使用更加方便和容易
随着技术的发展,人们希望搜索引擎无处不在,在任何时间任何地点,要寻找信息时都可以使用搜索引擎。而随着搜索引擎的逐步普及,越来越多的使用者(他们中很大一部分对计算机和网络了解不多)希望搜索引擎的工具性进一步加强,最好在不觉察的情况下使用搜索引擎服务。人们甚至期望搜索引擎的使用如微波炉和洗衣机一样方便和容易。
3。搜索个性化
搜索引擎的一个经验就是,用户很多时候并不确切地知道自己想要什么样的结果,除非你把结果放在他的面前。所以用户在使用搜索引擎时,很多时候相同表象的内容却意味着不同的需要。比如对于同一个查询词,不同的用户所需要的查询结果可能是不同的。即使是同一个用户输入同一个查询词,他在不同的时间、不同的地点和不同的查询背景下,希望得到的查询结果也可能是不一样的。
搜索引擎必须理解用户的意图和需求,才能非常到位地提供相关、准确的信息。要理解用户的意图,首先要理解用户的行为和习惯,对不同人的查询做不同的处理,反馈给用户个性化的内容;其次要理解用户查询时的上下文背景,包括时间、地点、语义等。个性化的搜索,意味着向更加精确搜索结果的方向又迈进了一步。
(三)网络的发展
1。网络终端形式更加丰富
目前各种客户端搜索工具的发展,使得用户可以不到搜索引擎的网站,而是直接在工具终端搜索所要查询的信息。手机、PDA等终端设备的不断发展,将最终帮助人们摆脱电脑的制约,而各种嵌入式智能装备的推广普及,正在印证着这一趋势。随着网络终端形式越来越丰富,很多应用找到了自己的位置,如手机电影;也有一些应用随着网络终端形式的发展而不断拓展,如Gmail的手机版。那么作为网络第二大应用的搜索引擎,也应该与时俱进,不断拓宽应用之路。
实际上很多搜索引擎已经这么做了。如Nokia和Yahoo在2006年9月7日发布了面向Nokia便携式终端的应用软件“NokiaMobileSearch”。该软件面向NokiaNseriesS60终端,用Yahoo的网页、图像搜索功能可向用户提供10种语言的搜索结果。但问题的关键是,只在新的网络终端上发布搜索产品还远远不够,应该挖掘各种网络终端的最佳应用模式,更好更方便地、个性化地服务用户,用户才可能喜爱这些新生事物。例如使用手机进行搜索时,完全可以根据时间和地点进行个性化服务。可以想象,如果快吃饭的时候使用手机查询饭店,那么把手机持有者附近的知名饭店作为查询结果返回,将会是一个很好的选择。
2。网络速度的提高
随着基础建设的发展和技术水平的提高,网络速度一直在不断提高。网速的提高对于搜索引擎的影响主要在两个方面:首先极大地促进了页面搜集的速度,能够使搜集的页面集合更全,覆盖率更高,同时使页面集合的更新更快,信息时效性更强;另一方面是在搜索结果的使用上,可以使用户更快地打开页面,下载自己需要的信息,包括pdf文件、图像文件、音视频文件等,给用户更好的应用体验。
网络速度的提高提供了以上的可能性,而搜索引擎必须把这种可能变为现实。另外,搜索引擎还要抓住机会,比如随着IPv6的发展,大力推进多媒体信息的搜索和使用。
3。无线网络的发展
互联网有从有线网络向无线网络发展的趋势,随着无线通讯技术的发展,无线传输速率、覆盖面和稳定性得到很大提高,3G的应用将进一步扩大这个趋势。摩根斯坦利(MorganStanley)2006年4月初发布了一份106页的名为“全球互联网趋势(GlobalInternetTrends)”的调查报告[9],这个报告包含了互联网的调查和市场数据,从金融市场的角度分析了互联网市场的风险和机遇。摩根斯坦利在这份报告中,试图说明互联网的发展趋势已经从PC互联网转向移动互联网;而规模远超过PC用户群,并且没有经过深度发掘的手机和消费电子设备,已经成为了主导互联网发展的主角。摩根斯坦利认为移动互联网将带来新的商机,在未来的数年内,移动互联网很可能会出现类似于Google那样的大服务商。
(四)来自非技术方面的挑战
1。知识产权问题
Web上的知识产权保护是一个很复杂的问题——不仅搜索引擎公司觉得麻烦,用户也很矛盾:一方面认为合法的知识产权理所当然应该受到保护,另一方面也希望自己能够更方便地获得更多权威的、有价值的信息。
事实上,Google公司不止一次地受到侵权起诉,Google使出浑然解数,也不过与原告们打个平手而已。国内的百度公司也因为提供MP3下载而屡屡为人诟病。知识产权的问题虽然最终要靠通过相应的法律解决,但某种程度上的技术处理,可以减轻侵权的压力。
2。所在国法律
搜索引擎庞大的搜罗万象的能力并非总是它的优势,有时正是因为在这一点上违反了所在国的相关规定而遭到封锁。比如“网页快照”是Google非常好的一项功能,但在中国内地因为与相关法规抵触而被封锁,而该项功能的封锁,使得它的不少用户不得不转向其竞争对手的产品。类似这种问题,是搜索引擎本地化时首要考虑的问题。
3。网络诚信问题
网络诚信不只是搜索引擎发展中所遇到的难题,而且也是整个互联网发展中的一个非技术瓶颈。这里以“点击欺诈”为例来说明问题的严重性。
“点击计费”是目前主流搜索引擎商普遍采用的广告收费模式,他们通过广告点击率向广告主收取费用,其广告收费=有效点击次数×广告投放价格,其中有效点击次数是指排除点击欺诈后的次数。点击欺诈自互联网诞生之际就出现了,成为全球搜索引擎商们的一大心病。虽然几乎每个搜索引擎商都有自己的反欺诈系统,但判断某个点击是“有效”还是“恶意”其实是非常困难的一件事。点击欺诈在中国更是泛滥到无法收拾的地步:靠点击广告挣钱甚至已经成为一个行业!点击欺诈的泛滥告诉我们,网络诚信远远没有我们预期的那么好。
2006年3月,网络搜索巨头Google宣布,公司同意支付最高9000万美元费用与点击欺诈案的原告达成和解。虽然Google这位行业老大终于愿意率先和广告主们握手言和了,但我们担心,Google能够独自承担整个行业的重责吗?恐怕这由非技术因素引起的挑战,最终还要靠技术手段把它们控制在搜索引擎公司能够承受的范围内。
三、搜索引擎应对方略
针对以上各种挑战,搜索引擎如何应对呢?我们对搜索引擎所采用的方略和相关的成型研究进行梳理,归纳为以下几点予以介绍。这几点和上面介绍的挑战并没有一一对应的关系。
(一)多元化
针对形形色色的用户,针对用户各种各样的需求,搜索引擎已经到了细分市场的时候,多元化是搜索引擎的必然之路。一方面,针对大量的普通用户,搜索引擎仍然致力于最广泛、最全面的信息检索;另一方面,针对检索目的明确、查询要求精准的用户,搜索引擎在特定领域和行业中发展,推出更有针对性的垂直搜索系统,为这些专业人士更好地服务。
1。通用系统:其定位是一个好的推荐系统
在通用系统层面,搜索引擎的定位更加清晰:它只是一个好的推荐系统,对于它的返回结果,用户必须经过自己的过滤和选择,而不是把排在前一二位的结果直接拿来使用。
作为一个好的推荐系统,搜索引擎着力做好这样几件事情:①信息尽量全而有价值;②信息具有良好的时效性和时新性;③信息查询尽量准确,或者说通过尽可能少的交互,引导用户找到其所需要的结果;④用户界面友好;⑤查询速度快。后面几个小节中,我们会有针对性地讨论这些方面。
2。专业系统:要求非常精准,有专业特色
专业搜索系统又称垂直搜索(verticalsearching)系统,它是搜索引擎的细化和延伸,在最近几年发展得如火如荼。垂直搜索引擎和通用搜索引擎的最大区别,是对网页信息进行了一定程度的结构化提取,然后将提取的数据进行深度加工处理,为用户提供针对性更强、精确性更高的服务。
垂直搜索引擎的应用方向很多,比如地图搜索、音乐搜索、图片搜索、文献搜索、企业信息搜索、求职信息搜索、购物搜索、房产搜索、天气搜索……几乎各行各业各类信息都可以细化成相应的垂直搜索对象。垂直搜索引擎一般在规模上比通用搜索引擎要小,因为它只涉及某个特定的领域。垂直搜索引擎在技术上也需要信息搜集程序(但只在一些特定站点活动,并且不是对所有的链接都感兴趣)、中间处理(分词、信息提取和索引等)程序以及为用户提供查询服务。在信息搜集方面,Crawler除了使用各种技术在限定领域内面向主题抓取尽可能全的信息外,从领域内的各种系统和数据库中获得信息更为重要,因为这些信息更为权威、也更有价值。在中间处理上,最大的挑战是如何利用模版、规则或Ontology技术,整理所抓取的纷繁芜杂的数据,从中提取结构化信息,然后使用关系模型或XML等半结构化模型进行组织。只有经过有效组织,才能提供有针对性的、更为精准的查询服务。
CiteSeer、GoogleEarth、YahooShopping、Shopping。com等都是代表性的垂直搜索引擎。计算机论文搜索引擎CiteSeer(http://citeseer。ist。psu。edu/cs)是NEC研究院建立的一个学术论文数字图书馆,它提供了一种通过引文链接检索文献的方式。GoogleEarth使用了公共领域的图片、受许可的航空照相图片、KeyHole间谍卫星的图片和很多其他卫星所拍摄的城镇照片,并将它们和GIS布置在一个地球的三维模型上,使人足不出户就可以在名川大山间翱翔,在摩天楼群中俯瞰。YahooShopping和Shopping。com是美国最大的购物搜索引擎,其中Shopping。com创建于1999年,每月可输送2000万个有效销售给商家,2005年8月被eBay以6。2亿美元收购。
至于国内,垂直搜索市场更是群雄纷争,令人眼花缭乱。然而问题是,大家在纷纷寻找好的赢利模式的时候,往往忽略了应该有一个好的技术作为支持。这是一个很可悲的现象。
(二)搜索质量提高
1。过滤垃圾页面
Web垃圾信息泛滥,不仅浪费了搜索引擎的带宽和时间等宝贵资源,更重要的是,它们的存在大大降低了搜索引擎的查询质量和查询效率,极大地影响了用户对Web信息的有效使用。搜索引擎主要在两个步骤上进行反击:①在Crawler抓取阶段即进行过滤,滤去那些质量极低、毫无内容可言的“高纯度垃圾”,这样可以节省网络带宽、费用、抓取时间、存储空间等,并且大大减轻了下一步在信息分类、信息组织和查询匹配时的负担;②在信息分类和组织阶段,计算网页信息的可信度,在用户查询信息时,把可信度作为一个重要因子对查询结果集进行排序,从而提高查询结果的信息质量,满足用户的实际需要。
搜索引擎公司传统上的做法是,聘请专业人员,不断地搜查探测那些恶意欺骗者。当确认了一个Web垃圾网站后,搜索引擎停止对它的搜索和索引。然而这个探测过程非常昂贵而且缓慢,鉴于此,搜索引擎公司、国内外知名大学和研究机构近几年开始从不同的角度研究和寻找更好的方法,其中有代表性的研究成果如下:
(1)Google在2002年就注意到Web垃圾信息日渐泛滥的问题,提出要在自己的排名算法中,加大页面质量的权重[10]。
(2)Microsoft对近6亿个页面进行了研究,从URL属性、HostName的解析、链接关系、内容特点等几方面分析了Web垃圾页面的特点,并试图按照这些统计属性来确认Web垃圾页面[8]。
(3)Stanford的Gyongyi等人受Haveliwala的“Topic-SensitivePageRank”思想的启发,认为好的页面所指向的链接页面通常也是好的,于是他们提出了TrustRank的概念,依靠一个人工选取的好种子页面集,计算他们的传播结果,从而对Web站点按可信度排序,进而把所有站点分为“好”和“坏”两种[11]。他们还对Webspam进行了分类研究[12],并对Linkspam联盟技术做了分析[13]。Gyongyi等人提出TrustRank的概念后,受到了广泛关注,陆续有很多研究者进行类似的研究,如匈牙利科学院的AndrásA。Benczúr等人,以及美国LehighUniversity的BaoningWu和BrianD。Davison等。
虽然很难见到Google、Yahoo等搜索引擎关于如何去除垃圾页面的技术报告,但他们一直在做着这样的工作,并且已经有所应用。这一点从相关产品的使用体验中可间接地验证。
2。提高查询准确度
对于一个查询,搜索引擎动辄返回几十万、几百万篇文档。面对大量的返回结果,用户只能在其中浏览筛选。实际上,用户大多数时间都没有足够的耐心去浏览多屏结果。根据Silverstein等人的研究结果,有85%的查询只需要给出前10个结果[14]。
如何使用户想要的查询结果出现在返回集合的前列(最好是第一屏),这个本来就具有挑战性的问题随着搜索引擎检索页面集的增大而越来越急迫。目前解决这个问题的主要几种方法是:
(1)通过各种方法获得用户没有在查询语句中表达出来的真正用途,包括:①相关度反馈机制,使用户告诉搜索引擎哪些文档和自己的需求相关(及其相关的程度),哪些不相关,通过多次交互逐步求精;②智能代理跟踪用户检索行为,分析用户模型;③用户注册使用,以便更好地分析用户的使用特点和喜好。
(2)使用正文分类技术将查询结果分类,使用可视化技术显示分类结构,用户可以有选择性地浏览自己感兴趣的类别(GoogleNews就采用了这种方法)。
(3)使用链接结构分析进行站点聚类或页面聚类,然后将信息推荐给用户(Vivisimo公司就是采用对搜索结果自动聚类的办法来满足不同类型用户的需要)。
我们认为最有力的方法是改进排名算法。Google的排名规则一直在变化中,2001年基于HillTop算法进行的优化是比较明显的变化(HillTop认为来自相同主题的相关文档链接对权重计算的贡献更大),现在又到了迫切需要算法更新的时候了。据说Google正在研究“多倍索引信息获取系统(MIBIRS)”,可以使搜索引擎的网页索引数量达到惊人的1000亿幅甚至更多,我们翘首以盼。
(三)搜索能力加强
1。对多媒体搜索的支持
随着多媒体信息在网络上的大量涌现和人们对多媒体信息需求的高涨,知名搜索引擎如Google、Yahoo、AltaVista、Lycos、AllTheWeb等对于多媒体搜索的能力也在不断加强。它们或在一个统一的用户界面上提供资料类型选择,或直接提供独立的多媒体搜索引擎。另外,各种图像搜索引擎和各种娱乐搜索引擎也不断涌现。这些系统可以说在很大程度上满足了用户的需要,然而它们对多媒体搜索的支持都还在初级阶段,基本上是基于文本关键词和自动标注进行多媒体信息检索,缺乏基于图像和音视频内容进行比对检索的功能。
一般的说,多媒体信息的内容表示可分为物理层(如信号样本、像素等)、特征层(如图像的颜色和纹理、语音频谱)、语义层内容(如语音的脚本、音乐的音符、图像中的物体形状和人脸)等三个层次。基于内容的检索一般针对后两个层次。基于特征层次的内容检索主要应用于以媒体实例为输入的查询方式。检索时,首先对输入的实例提取特征模板,再与检索源中的数据相匹配。相关研究主要围绕着检索的快速性和准确性问题展开,具体涉及特征选取、匹配策略、算法优化等。
关于图像处理和检索的专利较多,根据美国专利网的检索结果,与图像检索相关的专利达186项,但是很少见它们应用于实际系统,而用于网络多媒体搜索引擎的专利,则更是罕有。2004年Lowe提出了SIFT(Scale-InvariantFeatureTransform)[15]特征,该特征具有旋转、缩放不变性,并且对光照、仿射变换以及视角变化等都具有相当程度的鲁棒性。除此之外,每一个SIFT特征都具有很强的描述和区分能力,因此非常适用于图像实例检索。但在对海量数据的检索中,如何降低其复杂度需要进一步的深入研究。
在音频检索方面,常用的特征包括:短时能量、频谱、过零率、美标度倒谱等。针对大数据量检索问题,很多工作集中在特征匹配的策略优化上。基于内容的视频检索可以看做图像和音频检索的扩展,所用特征除图像和音频中的常用特征以外,还包括一些专有特征:如物体运动、镜头切换等。关于音视频检索的专利也不少,根据美国专利网的检索结果,与音频和视频检索相关的分别为28项和80项,但是应用于网络多媒体搜索引擎的专利却很少。
语义层次上的内容检索研究相对更为困难一些,下面几个方面是最近几年进展较快的:场景分类技术、语音数据识别、语音说话人分割、视频数据中精彩片段提取等。然而这些技术距离大规模检索应用还有相当的距离。
在这里值得一提的是,面对咄咄逼人的Google和Yahoo,法国总统雅克·希拉克在2006年新年讲话时宣布,法国决定联手德国,抓住多媒体搜索这个机会,开发“真正的多媒体搜索引擎Quaero,以应对Google和Yahoo带来的全球挑战”。
Quaero的拉丁语意是“我搜”,该项目的目标是,搜索时无须借助文字描述就能“读懂”音频、图像和视频的内容。目前,这样的图片识别程序已经存在。法国中型软件公司、Quaero项目成员LTUTechnologies向美国联邦调查局(FBI)提供电脑取证分析工具,用于分析被扣押的硬盘中的图片,并将其与已知的恋童癖罪犯的照片相比对。另外他们还有一些可将语音转化为文字的音频解析程序。Quaero项目组面临的挑战是,如何改进这些工具以提高搜索准确度,同时提高速度,适应大数据量的检索。
目前参与Quaero研发的主要公司和机构包括法国电信、汤姆逊公司、法国视听研究所、德国电信、贝塔斯曼集团和西门子公司等。Quaero项目预计在未来5年内需要投入10亿~20亿欧元,所需资金将由法、德两国政府以及两国企业共同承担,其中法国政府已计划5年内投资2。5亿欧元。这个项目究竟走势如何,我们将拭目以待。
2。对DeepWeb的搜索
DeepWeb已经拥有不少研究者,如Stanford和UIUC的学者们,他们分别搭建了HiWE[16]和MetaQuerier[17]两个很好的原型系统。也有一些搜索引擎能够搜索DeepWeb信息,如www.xiexiebang.com、www.xiexiebang.com。com、www.xiexiebang.com等。然而它们或者太小,或者搜索Invisible信息的能力太弱,所以使用起来很多时候不能得心应手。
几大主流搜索引擎尚未提供DeepWeb搜索功能,主要原因是技术上还不够成熟。然而“需求是创新之母”,我们期待在不久的将来能使用Google、Yahoo等查询DeepWeb信息,或者是基于DeepWeb查询的搜索引擎迅速发展起来,为我们提供更好的服务。
3。ArchiveSearch
搜索引擎通常能够提供的信息通常只是最近在网上有的信息,而很多情况下我们需要了解网上曾有的历史信息,甚至需要将不同时间的信息进行归纳、比较和综合。另外,对于搜索引擎来说,把自己辛辛苦苦搜集来的信息轻易抛弃也是很可惜的事。
这方面的研究国内国外都曾开展过,如InternetArchive、UCLA的WebArchive[18]和北京大学的WebInfoMall(http://www.xiexiebang.com/)作为搜索引擎的领袖公司,一直在进行着前沿研究,并不断推出新的产品。就在不久前,Google专门为中小企业推出了集成了Gmail、Gtalk、GoogleCalendar和GooglePageCreator等免费服务的GoogleAppsforYourDomain项目。接着Google又跟LitCam和UNESCO(教科文组织)合作,推出了一个专为教育和文化事业而设置的集成服务——Google知识工程。Google还推出了新搜索服务——SearchMash。com作为Google的子搜索网站,SearchMash采用了图文结合的方式显示搜索结果,左边为文字搜索结果,右边为符合度最高的图像搜索结果。另外,Google正在研究“多倍索引信息获取系统(MIBIRS)”,据说通过该项技术,可以使Google搜索引擎的网页索引数量达到惊人的1000亿幅或更多。Google对于语义搜索的研究也在进行中。
(2)Microsoft(http://research。microsoft。com/)对于搜索引擎这个庞大的市场当然不肯放过。微软亚洲研究院(http://research。microsoft。com/asia/)早在2001年底,便开始了有关互联网信息检索技术的研究,几年来发表了很多高水平的论文,并不断把这些研究成果转化为技术。他们的代表性成果包括对网页细分的“数据模块化的Web检索方法”、搜索动态网页数据的“深层网络数据发掘技术”,等等。对于分散于互联网上的图像资源,他们开发出的智能化图片搜索技术,已可自动识别与分类搜索结果。在2006年微软创新日上,微软亚洲研究院集中展示的38项技术中,搜索类技术就多达11种,包括对文字、图像、新闻事件等进行搜索,应用涵盖了手机移动、IPTV等多个方面。微软亚洲研究院院长沈向洋博士于2006年9月在北京宣布,微软亚洲研究院将在原有四大研究方向:新一代多媒体、新一代用户界面、无线及网络技术和数字娱乐的基础上,增加互联网搜索和挖掘为该机构的第五大研究方向。
(3)Yahoo!(http://www.xiexiebang.com)……就是例子。前面提到的法国和德国联手开发Quaero搜索引擎的计划也能给我们启示。在上述包罗万象数据(信息)的大搜索的概念下,本土努力将更有天然的优势,而一定的国家行为可以使这种优势发挥出最好的效益来。
本文www.xiexiebang.com www.xiexiebang.com A5首发,转载请保留。