B8毕业设计(论文)工作总结

时间:2019-05-12 02:05:16下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《B8毕业设计(论文)工作总结》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《B8毕业设计(论文)工作总结》。

第一篇:B8毕业设计(论文)工作总结

北京交通大学海滨学院系

级毕业设计(论文)工作总结

一、基本情况总结

(包括:班级数、学生人数、指导教师人数、校内外设计学生人数、选题情况总结等)

二、主要成绩

三、存在的问题

四、改进措施及建议

系(盖章)

第二篇:实习、毕业设计(论文)工作总结

一、实习目的通过毕业实习,锻炼自己在实际工作中的工作能力,并能够仔细观察、切身体验、独立思考、综合分析,灵活运用自己学到的知识解决工作中遇到的实际困难;具有一定的开拓和创新精神,学会接受新事物,有自己的思路和设想;增强责任心,学会与单位同事和睦相处,交流融洽,善于取长补短,虚心好学,注重团队合作。

二、毕业实习的任务

毕业实习的任务就是通过收集资料,撰写毕业论文。高等学校本科生毕业时撰写的学术论文属于学术论文的范畴,是学士学位论文。

学术论文具有学术性、科学性和创造性的特点。学术性是对研究对象的本质及其规律的研究,是对发明、立现或创见的科学表述。学术论文的科学性体现在科研成果的形成是以科学的世界观和方法论为指导,以科学理论与科研实践为基础,采取严谨的态度去探求未知,而获得的成果,也体现在论文的表述要严谨,论文的立论要客观、正确。论据要可靠、充分,论证要严密、有力。学术论文突出创新的特点,是在科学研究领域对所研究的问题有新的观点、新的见解。通过毕业实习注意培养探求未知、探求真理的科学精神,良好的科学品质与科学素养,通过在实习的具体工作中检验自己综合运用基础理论、基本知识和有关技术技能,解决由关实际问题的能力。

三、实习时间

2011年2月21日至2011年4月25日

四、实习地点

网萌网络科技有限公司

五、实习内容

网萌网络营销专员的主要工作有:寻找目标客户、给目标客户发公司业务广告、与客户谈单、为客户下单并安排客服人员办理业务等工作。

六、实习心得

通过这次的实习,我对自己的专业有了更为详尽而深刻的了解,也是对这几

年大学里所学知识的巩固与运用。从这次实习中,我体会到了实际的工作与书本上的知识是有一定距离的,并且需要进一步的再学习。我作为网萌网络营销专员的主要工作有:寻找目标客户、给目标客户发公司业务广告、与客户谈单、为客户下单并安排客服人员办理业务等工作。

由于本专业对网络营销的理论学习并不多,所以在实习中我对网络营销是一次全新的认识,从工作培训到实施操作这是一个对网络营销理论加实践的深入学习。实习过程中我发现自己在营销知识在应用感到很无措,在面对客户时如何与客户谈单,如何让客户接受公司的业务,特别是对于网络安全和价格这些敏感因素上怎样能够让客户接受我们。网络营销的每一个步骤都是十分重要的,常常可能因为一句话的差错,就会影响到整个订单的成败,所以网络营销工作是一项严谨的活动。此外,我还结交了许多前辈、同事,他们都会给我很多中肯的建议,技术上的指导,大家也会一起交流、相互促进。因为我知道只有和他们深入接触,我才会更加了解网络营销工作的操作技巧、谈单经验、与客户互动方式,这为我以后进一步走向社会打下坚实的基础。在这次的实习中,让我学到了很多在课堂上根本就学不到的知识,拓宽了视野,增长了见识,也改掉了很多毛病。知道挣钱的不容易,工作的辛苦,与社会的复杂多变。而为了适应社会,我们要不断的学习,不断的提高自己,在实践中锻炼自己,使自己在激烈的竞争中立于不败之地!

七、撰写论文心得

在撰写论文的过程中,我学会了如何从新的角度去看待问题,论文必须要严谨,立论要客观、正确,论据要可靠、充分,论证要严密、有力。在查阅资料时,要多方查证,通过自己的思考加以总结,从自己的角度去撰写论文,不能盲目的将资料复制粘贴。在导师批阅修改过后,一定要反复仔细的阅读原稿,斟酌导师批改过的段落,从整体、各个方面去思考,重新整理论文的内容,反复仔细的阅读修改,不能马虎应对,关键是态度问题,必须要认真的对待。

第三篇:2010届毕业设计(论文)工作总结

纺织服装学院

2010届毕业设计(论文)工作总结

在校领导的关心和校评估处的指导下,经过全体老师的共同努力,本学期纺织服装学院顺利全面地完成了2010届毕业设计(论文)工作。在取得成绩的同时,也发现了一些问题。为了今后更好地开展工作,取得更大成绩,现从以下几个方面进行总结:

一、毕业生及指导教师基本情况

今年,我院开展了为期14周的毕业设计(论文)工作(不含前期准备工作及毕业实习),有毕业设计(论文)工作任务的是纺织工程专业、轻化工程和服装工程三个专业。纺织工程专业06级3个班本科毕业生95人,其中2人没有参加毕业设计(论文)资格;轻化工程专业06级63人全部参加毕业设计(论文);服装工程本科毕业生54人全部参加毕业设计(论文),本届我院共有210名毕业班学生参加了毕业设计与论文。

我院参与本届毕业设计(论文)指导工作的教师共有29名,分别是毕红军、吕立斌、宋孝浜、秦卫兵、刘丽、季萍、林洪芹、王玮玲、马志鹏、陶丽峰、王春霞、陆振乾、张伟、郑成辉、周天池、祁珍明、于凉云、张奇、吕景春、周青青、李静、袁淑军、俞俭、李慧、黄新民、陆平、刘亚平、陈嘉毅、宋晓蕾等,经过专业系考察和毕业设计(论文)指导小组认定各位指导教师都有毕业设计(论文)指导资格。

二、加强对毕业设计(论文)工作的组织领导

在上学期我院就制定了2010届毕业设计(论文)工作的组织形式,并成立了“纺织服装学院2010届毕业设计(论文)工作领导小组”,由院长担任组长,副院长和书记为副组长,其它骨干教师为组员。为了顺利开展本届毕业设计(论文)工作,院部工作领导小组专门召开了有关会议,明确分工,责任到人,领导毕业设计(论文)工作。本学期还成立了毕业设计(论文)答辩委员会及工作小组。重视毕业设计(论文)工作的领导、组织、督查、监控和考核等工作。

三、加强毕业设计(论文)管理文件和指导文件的建设工作

为保证毕业论文工作的正常开展和教学质量的提高,院部严格按照学校毕业设计(论文)工作条例的有关规定开展工作,制定了本学期“纺织服装学院2010届毕业设计(论文)工作计划”和“纺织服装学院毕业设计(论文)教学工作实施细则”,使工作有计划、有步骤、有目的地进行,并使进程密切配合学校有关工作的进度,按部就班地贯彻执行。我院还对专业系和教师的指导文件的建设进行了规范化指导。专业系重新修订了《毕业设计教学大纲》和《毕业论文教学大纲》,大纲中包括教学目的、教学基本要求、成果形式、成绩评定原则、学时分配等内容,符合规范。

各指导教师有统一格式的课题申报表、审批表和毕业设计(论文)任务书,并将任务书按时发放给学生,使学生明确了具体的任务及要求。课题申报表审批表和毕业设计(论文)任务书完成得较好,内容详实并有经指导教师、专业系负责人的签字和院部签署的明确的审批意见。

学生交给专业系的文献综述和开题报告打印件绝大多数符合规范和要求,文献综述内容能反映学生做了文献查阅、收集、整理和综合工作,开题报告反映出课题的目的意义、主要内容、研究思路和工作进度。

四、强化课题的申报和审批程序,保证题目质量

院部对今年的毕业设计(论文)课题的申报和审批程序作了一定的改进,强调了这项工作的过程管理和规范化管理。

1、课题的申报

从09年秋学期末就开始10届毕业生毕业设计(论文)的选题工作,由院部进行动员,根据学校的规定、专业教学大纲要求和专业特点提出了对课题的要求,布置教师尽可能多地提出课题,也欢迎学生根据自身情况提出课题,要求每位具有担任毕业设计(论文)指导资格的教师每人至少提出10个课题,并写出课题的选题说明。最后再根据课题的质量和教师的实际情况,确定指导教师所带的学生人数和课题。

2、课题的筛选和审批

在上学期结束前,院组织专业系骨干教师对申报的课题对照要求,根据其性质、难度和工作量的大小进行讨论、研究和筛选,并提供给学生进行选择,在此基础上,由专业系主任审定。专业系主任签署意见后,再由院领导批准确定。

通过以上程序,本届毕业生所选的210个课题均与纺织服装学院各专业培养目标相符,结合了纺织工业发展实际、纺织企业生产实际、纺织和轻化专业实验室的建设和课程建设情况和教师的科研工作,也结合了学生的就业,与学生的意向比较一致,并且做到1人1题。

对在毕业设计(论文)过程中发现的个别难度太大而超出学生力所能及和工作量太小而不能达到综合训练目的的课题,我们要求指导教师根据情况进一步明确和细化工作任务或者增加工作量,充实内容。尽可能中途不更换课题,从而保证了本届毕业 设计(论文)教学工作得以顺利进行。

五、加大毕业设计(论文)教学工作全过程的质量监控力度

根据学校《毕业设计(论文)教学工作条例》和“纺织服装学院2010届毕业设计(论文)教学工作实施细则”,我们建立了一套行之有效的质量监控措施,加强了对今年毕业设计(论文)教学工作的管理。平时正常进行检查督促,从本学期第一周开始,我们就将质量意识贯穿在毕业设计(论文)教学管理工作中,定期召开全体毕业设计(论文)指导教师会议,了解教师指导情况,讨论解决工作中出现的问题,布置下阶段工作,把握总体进度。由于今年毕业生较多,就业形势比较严峻,在毕业设计(论文)前阶段,许多学生请假外出找工作,参加人才市场和到用人单位面试,影响了毕业设计(论文)工作进度,我们也考虑到学生的实际情况,但为了不影响毕业设计(论文)质量,我们严格控制学生的请假次数和时间,结果大部分学生能够安心地做毕业设计(论文)。此外,我们严格控制到用人单位进行毕业设计(论文)的学生人数,对到用人单位进行毕业设计(论文)的学生严格按照学校规定执行,并且毕业设计(论文)质量的要求和在校生相同。

在毕业设计(论文)工作的监控过程中,我们进行了毕业设计(论文)的前期、中期和后期三次检查。前期检查主要是查指导教师到岗情况、学生实习情况(实习报告)、开题情况(开题报告)、查阅资料情况(文献综述)、任务书的填写和是否下达到每一个学生的情况。中期检查着重检查学风、工作进度、教师指导情况及存在的问题,今年通过“中期答辩”加强了对设计(论文)内容质量的检查和控制。后期主要检查教师教学总体情况和学生毕业设计(论文)成果的规范和质量。对于自查和学校检查中出现的问题,我们要求每位指导教师认真进行整改。在毕业设计(论文)答辩前,我们组织了对学生答辩资格的审查,根据教学大纲、任务书及学校《毕业设计(论文)教学工作手册》中的要求,检查了学生的任务完成情况,不符合要求的坚决不准参加答辩。

六、重视毕业设计(论文)的成果建设和答辩工作

毕业设计(论文)的成果主要是以毕业设计说明书(包括设计图纸)和毕业论文形式体现的,其质量好坏既体现出成果的大小,也与学生成绩相关。因此我院十分重视毕业设计(论文)的撰写工作,根据制定的《纺织服装学院毕业论文(设计)文本格式要求》、《毕业设计(论文)答辩程序》、《毕业设计(论文)成绩评定办法及标准》、《申报优秀毕业设计(论文)的评选程序》等规范化指导文件,强化了毕业设计(论文)的成果建设工作。我们组织毕业论文(设计)质量专门检查小组对毕业论文、设计说明书和其它文件写作格式的规范化和内容质量进行了检查并认真记录,对不符合格式要求和内容质量较差的开出不符合项单,坚决要求指导教师作为第一责任人进行限期整改,使本届毕业设计(论文)质量得以提高。

我院根据学校总体进度统一安排答辩工作和成绩评定工作,并及时上报学生成绩。通过成立的毕业答辩委员会的指导和安排,加强了毕业答辩和成绩评定各个环节的控制。本届毕业答辩完全按照“纺织服装学院毕业答辩程序”进行,各答辩小组都能严格控制答辩时间,认真提出问题,真实记录答辩情况,客观给出答辩成绩。通过既定的毕业设计(论文)成绩评定程序和办法,认真进行学生成绩评定工作,最终评定的成绩能客观地体现出毕业论文教学水平,成绩分布符合正态分布规律性,在本科优秀论文中我院推荐了9篇参加校优秀论文的评定,并通过7篇。

七、加大整改力度、提高成果质量

今年我院加大了对毕业设计(论文)质量的整改力度,整改的内容主要包括材料格式的统一和内在质量的提高两个方面。我院统一了毕业设计(论文)各类材料的格式,并根据前期检查情况明确了质量整改的主要问题,要求指导教师在限定的时间内完成整改。在指导教师整改后,组织“毕业设计(论文)质量检查小组”对每份论文或设计进行了逐个检查,开出了不符合项报告单,要求指导教师提出整改措施并负责对指导的论文或设计进行进一步的修改,直至验收合格。通过整改,本届的毕业设计(论文)质量得到了较大提高。

八、存在问题

虽然毕业设计(论文)工作已经圆满结束了,但通过检查和总结,我们仍然发现了一些问题:

1、目前纺织和轻化专业实验室仪器设备能基本满足实验课程教学的需要,但由于条件有限,大部分毕业设计(论文)课题能在校内实验室中完成,而少数课题需在外单位做实验。由于经费等问题,这部分设计(论文)的工作量难以保障,质量难以提高。

2、师资力量较弱,科研水平较低,因此总体来说我院毕业设计(论文)水平和我国名牌纺织专业院校相比还不够高。

3、部分学生计算机运用能力还不够高,未能充分运用计算机进行研究设计及绘图。

4、部分学生英文翻译水平较差,经过老师帮助后质量有所提高。

5、学生找工作和研究生参加复试等对毕业设计(论文)工作有一定的干扰。

6、个别教师在指导过程及对学生论文的修改方面责任心不强。

九、建议

1、建议学校加大投入,加快实验室建设,增加毕业设计(论文)经费,从硬件上保证毕业设计(论文)教学工作顺利进行。

2、学校可组织各专业就毕业设计(论文)教学工作进行相互学习。

3、从制度上协调好毕业设计(论文)教学工作和学生就业的关系。

4、采取更加灵活的毕业设计(论文)教学形式。

纺织服装学院

二O一O年六月二十九日

第四篇:毕业设计(论文)

四川交通学院毕业设计(论文)目录1 VI设计综合概述....................11.1 VI的定义.......................1

1.2 VI基础要素系统设计表....................1

1.3 VI应用要素系统设计表.....................1

1.4 VI设计的基本原则.........................设计软件介绍.........................32.1设计软件介绍.....................43 设计基本的思路......................53.1 牛牛啤酒有限公司VI设计基本思路....................5

3.2 牛牛啤酒有限公司VI设计的详细介绍................5啤酒行业的现状....................17中国啤酒市场的现状..........................20

5.1 总述.............................20

5.2 分述...............................20外国啤酒对于我国啤酒市场的影响.....................23

参考文献...........................26

致谢............................27

四川交通学院毕业设计(论文)VI设计综合概述

1.1 VI的定义

VI即(Visual Identity),通译为视觉识别,是CIS系统中最具传播力和感染力的层面。人们所感知的外部信息,有83%是通过视觉通道到达人们心智的。也就是说,视觉是人们接受外部信息的最重要和最主要的通道。企业形象的视觉识别,即是将CI的非可视内容转化为静态的视觉识别符号,以无比丰富的多样的应用形式,在最为广泛的层面上,进行最直接的传播。设计科学、实施有利的视觉识别,是传播企业经营理念、建立企业知名度、塑造企业形象的快速便捷之途。

1.2 VI基础要素系统设计表

1.企业标识

2.产品商标

3.企业标志释义

4.标志制图法

5.标志的使用规范

6.标志的色彩规范

8.中文标准字

9.英文标准字

10.中文指定印刷字体

11.英文指定印刷字体

12.企业辅助色

13企业象征图案

1.3 VI应用要素系统设计表

1.待客用项目类:洽谈会、会客厅、会议厅家具、烟灰缸、坐垫、招待餐饮具、客户用文具。商品及包装类商品包装设计、包装纸、包装箱、包装盒、各种包装用的徽章、封套、封缄、粘贴商标、胶带、标签等。

2.符号类

公司名称招牌、建筑物外观、招牌、室外照明、霓虹灯、出入口指示、橱窗展示、活 动式招牌、路标、纪念性建筑、各种标示牌、经销商用各类业务招牌、标示。

3.帐票类

订单、货单、帐单、委托单、各类帐单、申请表、通知书、确认信、契约书、支票、收据等。

4.文具类

专用信笺、便条、信封、文件纸、文件袋、介绍信等。

5.服装类

男女职工工作服、制服、工作帽、领带、领结、手帕、领带别针、伞、手提袋

等。

6.印刷类

股票、报告书、公司一览表、调查报告、自办报刊、公司简历、概况、奖状等。

7.大众传播类

报纸广告、杂志广告、电视广告、广播广告、邮寄广告等。

8.SP类

产品说明书、广告传播单、展示会布置、公关杂志、促销宣传物、视听资料、季节问候卡、明信片、各种POP类。

9.交通类

业务用车、宣传广告用车、货车、员工通勤车等外观识别。

10.证件类

徽章、臂章、名片、识别证、公司旗帜。

1.4 VI设计的基本原则

VI的设计不是机械的符号操作,而是以MI为内涵的生动表述。所以,VI设计应多角度、全方位地反映企业的经营理念。VI设计不是设计人员的异想天开而是要求具有较强的可实施性。如果在实施性上过于麻烦,或因成本昂贵而影响实施,再优秀的VI

也会由于难以落实而成为空中楼阁、纸上谈兵。

1.风格的统一性原则

2.强化视觉冲击的原则

3.强调人性化的原则

4.增强民族个性与尊重民族风俗的原则

5.可实施性原则

6.符合审美规律的原则

7.严格管理的原则

VI系统千头万绪,因此,在积年累月的实施过程中,要充分注意各实施部门或人员的随意性,严格按照VI手册的规定执行,保证不走样。企业视觉识别系统中的基本要素与应用要素的内容、形式,需要根据企业经营的内容与服务的性质来决定。其内容、项目的多少,一

般说来,是与企业识别系统开发设计工程的大小和实施程度而成正比;其风格与特色也与企业产品、经营特色及企业识别系统在应用中的展开程度而不同。另外,企业在实行视觉识别系统时,还应考虑到企业费用和时间的问题,逐步改善企业的设计并使之统一化。因此,视觉识别系统的实施、设计,还应该根据企业识别系统逐步实行,只有这样,才能真正发挥视觉识别的功效。为了达成企业形象对外传播的一致性与一贯性,应该运用统一设计和统一大众传播,用完美的视觉一体化设计,将信息与认识个性化、明晰化、有序化,把各种形式传播媒体上的形象统一,创造能储存与传播的统一的企业理念与视觉形象,这样能集中与强化企业形象,使信息传播更为迅速有效,给社会大众留下强烈的印象与影响力对企业识别的各种要素,从企业理念到视觉要素予以标准化,采同一的设计,对外传播均采同一的模式,并坚持长期一贯的运用,不轻易进行变动。要设计的简化:对设计内容进行提炼,使组织系统在满足推广需要前提下尽可能条理清晰,层次简明,优化系统结构。如VI系统中,构成元素的组合结构必须化繁为简,有利于标准的施行。设计软件介绍

2.1设计软件介绍

本组设计主要用了两种平面设计软件,是PhotoshopCS ILLUSTRATOR CS 这是款很经典的平面设计软件,在介绍我们的具体设计之前,首先向大家大致介绍一下它:

PhotoshopCS ILLUSTRATOR CS是Adobe公司开发的,它是一款集图形设计、文字编辑和高品质输出于一体的矢量图形软件,可以保证所绘制的图形任意地放大或是缩小而不影响其质量。它被广泛地应用于海报、包装和排版等平面广告设计、网页图形制作和艺术效果的处理等诸多领域。该软件具有图形绘制、图形优化以及艺术处理等多方面的超强功能,能充分满足设计者的实际工作需要。设计基本的思路

3.1 牛牛啤酒有限公司

VI设计基本思路我们这次是为一家啤酒有限公司做VI设计。首先,我们调查了各类啤酒公司的各种广告、宣传等涉及到VI方面的案例,然后又在网上搜索了大量关于啤酒行业VI设计中所牵涉到的知识、需求;在调查中积累了一定的经验后,我们开始对这家公司的性质进行分析:这是一家以突出青春和活力为主的啤酒公司,而且根据现在的市场需要,又往往都会提到“价格”这个概念,那么,我们就决定围绕着“青春”、“活力”“环保”、“价格中等”这四个中心来思考设计方案;经过讨论,然后考虑到我们的消费对象主要是中下水平家庭,基本这种情况,所以我们基本确定了标志的设计方向:青春、活力、环保、价格中等。我分别设计了各种标志,然后放在一块进行比较、讨论,最后,经过反复讨论、修改,最后确定了“beer jjan”企业标志确定下来以后,我们就开始了整个VIS的基础系统和应用系统部分的定义和设计,以下就是我们最后设计出来的样稿。

第五篇:毕业设计论文

一、综述..........................................................................................................................2

一、信息检索技术.....................................................................................................2

1、信息检索技术的发展.....................................................................................2

2、信息检索技术的简介.....................................................................................3

3、信息检索技术的模型.....................................................................................5

一、综述

一、信息检索技术

由于以因特网为主体的信息高速公路的不断普及和发展,信息技术已经渗透到我们社会生活的各个角落,正以前所未有的速度和能力改变着我们的生活的工作方式,我们真正处于一个“信息爆炸”的时代。一方面,因特网上面蕴含的海量信息远远超过人们的想象;另一方面,面对信息的汪洋大海,人们往往感到束手无策,无所适从,出现所谓的“信息过载”和“信息迷向”的现象。于是一个极富挑战性的课题:如何帮助人们有效地选择和利用所感兴趣的信息,尽量剔除不相关的信息。同时保证人们在信息选择方面的个人隐私权利?成为学术界和企业界所十分关注的焦点。

随着在线文本的日益增多,其中包括新闻、电子杂志、电子邮件、技术报告、文档以及网上图书馆。如此众多的信息,仅仅依靠大脑来收集和整理所需要的信息显然是不够的。所以,自动收集和整理所需要的各类信息成为信息产业面临新的挑战和新的发展契机。根据不同的应用背景和不同的使用目的,信息处理技术已经演化信息检索、信息过滤、信息分类、问题回答等方向。

由于目前网上信息的表现形式大多数为文本,而且文本也是广大用户所习惯接收的形式。因此我们在下面主要讨论中文文本检索和相关的评价方案。

1、信息检索技术的发展

信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程。

信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。1945年,Vannevar Bush的论文《就像我们可能会想的„„》第一次提出了设计自动的,在大规模的存储数据中进行查找的机器的构想。这被认为是现在信息检索技术的开山之作。进入50年代后,研究者们开始为逐步的实现这些设想而努力。在50年代中期,在利用电脑对文本数据进行检索的研究上,研究者取得了一些成果。其中最有代表性的是Luhn在IBM公司的工作,他提出了利用词对文档构建索引并利用检索与文档中词的匹配程度进行检索 的方法,这种方法就是目前常用的倒排文档技术的雏形。

在著名的国际文本检索会议(Text Retrieval Conference,TREC)上,有两个最重 要的研究方向:Routing Task和Ad Hoc Task。其热点问题包括从早期的文本检索、文本过滤到当前的问题回答。

文本信息检索就是根据用户提出的具体查询,在大量相对稳定的文本源中,检索出符合用户查询条件的文本,并按其满足查询的程度排序列出。文本检索技术的发展已经有四十多年的历史,取得了很大的成就,产生了大批实用的检索系统,积累了很多成熟的技术。

1992年,NIST(美国国家标准和技术研究所)与DARPA联合赞助了每年一次的TREC,对于文本检索和文本过滤和问题回答等专题倾注了极大的热忱。

目前随着因特网的迅速发展,需求的不断增加,文本检索以及相关技术方面取得了长足的进展,成为信息产业新的增长点。

2、信息检索技术的简介

信息检索系统流程大致如下图所示:

总体上,系统可分为四个部分:数据预处理,索引生成,查询处理,检索。下面我们分别对各个部分采用的技术加以介绍。

1.数据预处理

目前检索系统的主要数据来源是Web,格式包括网页、WORD 文档、PDF 文档等,这些格式的数据除了正文内容之外,还有大量的标记信息,因此从多种格式的数据中提取正文和其他所需的信息就成为数据预处理的主要任务。此外,众所周知,中文字符存在多种编码,比如GB2312、BIG5、Unicode(CJK 区),而原始数据集往往包含多种编码,因此要正确地检索到结果必须进行统一编码转换。研究者们对预处理部分要提取哪些信息并没有共识,这与后续处理所需的信息密切相关,一般来说,正文、锚文本和链接地址都是要提取出来的。

2.索引生成 对原始数据建索引是为了快速定位查询词所在的位置,为了达到这个目的,索引的结构非常关键。目前主流的方法是以词为单位构造倒排文档表,其结构大致如下图所示:

每个文档都由一串词组成,而用户输入的查询条件通常是若干关键词,因此如果预先记录这些词出现的位置,那么只要在索引文件中找到这些词,也就找到了包含它们的文档。为了进一步提高查询的速度,在组织索引时还可以采用一些更复杂的方法,比如B树、TRIE 树、哈希表等。这个阶段还需要对预处理之后的文档进行词法分析,这是因为很多语言的文本都不宜直接把正文中的字符串用于建立索引。例如,中文里的词与词之间不存在分隔符,因此必须先进行分词,而英文中的词存在很多变形,比如“compute”就存在“computes”、“computing”、“computed”等多种变形,应先进行词根还原。此外,有些词虽然出现频率很高,但对于查询没有任何帮助,比如“的”、“了”等,就无需放入索引,为此需要预备一个停用词表(stop word list)对这类词进行过滤。

3.查询处理

用户输入的查询条件可以有多种形式,包括关键词、布尔表达式、自然语言形式的描述语句甚至是文本,但如果把这些输入仅当作关键词去检索,显然不能准确把握用户的真实信息需求。很多系统采用查询扩展来克服这一问题。各种语言中都会存在很多同义词,比如查“计算机”的时候,包含“电脑”的结果也应一并返回,这种情况通常会采用查词典的方法解决。但完全基于词典所能提供的信息有限,而且很多时候并不适宜简单地以同义词替换方法进行扩展,因此很多研究者还采用相关反馈、关联矩阵等方法对查询条件进行深入挖掘。

4.检索

最简单的检索系统只需要按照查询词之间的逻辑关系返回相应的文档就可以了,但这种做法显然不能表达结果与查询之间的深层关系。为了把最符合用户需求的结果显示在前面,还需要利用各种信息对结果进行重排序。目前有两大主流技术用于分析结果和查询的相关性:链接分析和基于内容的计算。许多研究者 发现,WWW 上超链结构是个非常丰富和重要的资源,如果能够充分利用的话,可以极大地提高检索结果的质量。基于这种链接分析的思想,Sergey Brin 和Larry Page 在1998 年提出了PageRank 算法,同年J.Kleinberg 提出了HITS 算法,其它一些学者也相继提出了另外的链接分析算法,如SALSA,PHITS,Bayesian等算法。这些算法有的已经在实际的系统中实现和使用,并且取得了良好的效果。而基于内容的计算则沿用传统的文本分类方法,多采用向量空间模型、概率模型等方法来逐一计算用户查询和结果的相似度(相关性)。两者各有优缺点,而且恰好互补。链接分析充分利用了Web 上丰富的链接结构信息,但它很少考虑网页本身的内容,而直观上看,基于内容的计算则较为深入地揭示了查询和结果之间的语义关系,但忽略了不同网页之间的指向关系,因此现在很多系统尝试把两者结合起来,以达到更好的性能。

3、信息检索技术的模型

信息检索模型可形式化地表示成为一个四元组< D, Q, F, R(qi,dj)>,D是一个文档集合,Q是一个查询集合,F是一个对文档和查询建模的框架,R(qi,dj)是一个排序函数,它给查询qi和文档 dj 之间的相关度赋予一个排序值。3.1、布尔模型

所谓布尔检索, 就是采用布尔代数的方法, 用布尔表达式表示用户提问, 通过对文本标识与用户给出的检索式进行逻辑比较来检索文本。设文本集D 中某一文本i, 该文本可表示为:Di =(t1 , t2, ⋯, tm),其中, t1 , t 2, ⋯, t m 为标引词, 用以反映i 的内容。另设用户某一检索式如下:Qj =(t1 ∧ t 2)∨(t3 ∧(t4)).对于该检索式, 系统响应并输出的一组文本应为: 它们都含有标引词t1 和t2 , 或者含有标引词t 3, 但不含有标引词t 4。

布尔检索具有简单、易理解、易实现等优点, 故得到广泛的应用。1967年后, 布尔检索模型正式被大型文献检索系统采用, 并渐成为各种商业性联机检索系统的标准检索模式, 服务信息情报界30多年, 直到现在, 大多数商用检索系统仍采用布尔检索。尽管布尔检索有着种种的优点, 但是它的缺点仍然是明显的, 它存在的主要缺陷有以下几点。

(1)布尔逻辑式的构造不易全面反映用户的需求。用标引词的简单组配不能完全反映用户的实际需要, 用户需要那一方面内容的文本, 需要到多大程度, 这是检索式无法表达清楚的, 如对上述检索式, t1 和t2 , 究竟用户希望能得到更多地反映t1 内容的文本还是反映t2 内容的文本, 传统的布尔检索无法 5 解决此问题。

(2)匹配标准存在某些不合理的地方。例如, 在响应某个用“∧”连接的检索时, 系统把只含有其中一个或数个但非全部检索词的文本看作与那些根本不含有其中一个检索词的文本一样差, 同样加以排除;另一方面, 用响应某个用“∨”连接的检索式时, 系统都不能把含有所有这些检索词的文本看作比那些只含有其中一个检索词的文本更好一些。

(3)检索结果不能按照用户定义的重要性排序输出。系统检索输出的文本中, 排在第一位的文本不一定是文本集中最适合用户需要的文本, 用户只能从头到尾浏览才能知道输出文本中那些更适合自己的需要。

针对于标准的布尔模型中文献表达形式过于简单、检索条件过于严格而出现的问题,人们对其采取了扩充和修改,提出了扩展的布尔模型。如Salton 于1983年提出的一种所谓的扩展布尔检索模型, 它是将向量检索模型与布尔检索模型融为一体, 并克服了传统希尔模型的一些缺陷, 下面我们用矢量的方法来讨论布尔检索。设文本集中每篇文本仅由两个标引词t1 和t2 标引, 并且t1、t2允许赋以权值, 其权值范围为[ 0, 1] , 权值越接近1, 说明该词越能反映文本的内容, 反之, 越不能反映文本的内容, 在Salton 模型中, 上述情形用平面坐标系上某点代表某一文本和用户给出的检索式, 如图:

图中的横、纵坐标用t1、t2 表示, 其中A(0, 1)表示词t1 权值为0, 词t 2 权值为1 的文本, B(1, 0)表示词t 1权值为1, 词t 2 权值为0 的文本, C(1, 1)表示词t

1、t 2 的权值均为1 的文本, 文本集D 中凡是可以用t

1、t 2 标引的文本可以用四边形OACB 中某一点表示, 同样, 用户给出检索式后, 也可用四边形OACB 中某一点表示。

下面我们来看看Salton 模型中是如何构造相似度计算式的。对于由t1 和t2 构成的检索式q = t1 ∨ t2 , 在图1中只有A、B、C 3点所代表的各文本才是最理想的文本, 对于某一文本D 来说, 当D 点离A、B、C 3点越接近时说明相似度越大,或者说,当D点离O点越远时,相似度越大。因而D与O的距离

DO =(d10)(d20)22 =

d1d222 可以作为我们衡量一文本与查询q 的相关程度的一个尺度, 显然0 ≤ 2 , 为了使相似度控制在0 与1 之间, 将相似度定义为:

d1d222DO ≤

sim(D, Q(t1 ∨ t2))= 与C 的距离

DO(1)对于由t1 和t 2 构成的查询q = t1 ∧ t 2, 只有C 点才是最理想的文本, 用D =(1d1)(1d2)22

作为我们衡量一文本与查询q 的相关程度的一个尺度, 于是, 把相似度定义为:

(1d1)(1d2)22sim(D, Q(t1 ∧ t2))= 1-(2)(1)、(2)式还可推广到对检索标引词进行加权的情形, 设检索标引词t1、t2 的权值分别为a, b,0 ≤ a, b ≤ 1, 则(1)式、(2)式可进一步推广为:

a(1d1)b(1d2)2222sim(d, Q(t1 , a)∨(t2, b))= 1

在文本信息检索中, 布尔检索不仅具有简单、易理解等特点, 而且易于在计算机中加以实现, 是一种最为常用的检索方法。扩展的布尔模索模型——Salton 模型克服了传统布尔模型的一些缺陷, 更符合了用户的需要。

3.2、向量空间模型 向量空间模型是由Salton及其学生们在六十年代末到七十年代初提出并发展起来的。这一模型将给定的文本(文章、查询或文章中的一段等)转换成一个维数很高,由一系列关键词组成的向量。模型并没有规定关键词如何定义,但是一般来说,关键词可以是字,词或者短语。假设我们用“词”作为Term,那么在词典中的每一个词,都定义向量空间中的一维。如果一篇文档包含这个词,那么表示这个文档的向量在这个词所定义的维度上应该拥有一个非0值。这个模型最大特点是可以方便地计算出任意两个向量的近似程度,即向量所对应的文本间的相似性。用信息检索的术语来说,如果两个向量是相近的,则其对应的文本是语义相关的。将所有文献和查询以向量形式表示,则针对特定的查询向量,比较它与所有文献向量的相似度,并依相似度将文献降序排列,这便是现代信息检索系统中常用的方法。Salton及其学生们还根据向量空间模型实现了Smart系统。该系统在过去的30多年中,对信息检索的研究有非常重要的影响。信息检索的许多理论和技术(如自动索引、加权技术、相关反馈、文献聚类等)都是在Smart上首先实现或测试的。

假设表示文档向量,而

表示查询向量,文档与查询的相关性可以用余弦距离表示如下:

如果我们用进行归一化,即令和表示和中的第i维的值,并且对每个文档矢量,那么上式有可以表示为

在此,究竟如何取值是一个重要的问题,其取值一般被称为关键词i在文档D中的权重。

目前,对关键词权重的确定方法一般都需要获取一些关于关键词的统计量,而后根据这些统计量,应用某种认为规定的计算公式来得到权重。最常用的统计量包括:

  

tf,Term Frequency的缩写,表示某个关键词在某个文档中出现的频率。

qtf,Query Term Frequency的缩写。表示查询中某关键词的出现频率。

N,集合中的文档总数  df,Document Frequency的缩写,表示文档集合中,出现某个关键词的文档个数。

   idf,Inversed Document Frequency的缩写。dl,文档长度 adl,平均文档长度

权重的计算:

在向量空间模型下,构造关键词权重计算公式有三个基本原则:

1.如果一个关键词在某个文档中出现次数越多,那么这个词应该被认为越重要。

2.如果一个关键词在越多的文档中出现,那么这个词区分文档的作用就越低,于是其重要性也应当相应降低。

3.一篇文档越长,那么其出现某个关键词的次数可能越高,而每个关键词对这个文档的区分作用也越低,相应的应该对这些关键词予以一定的折扣。早期的权重往往直接采用tf,但是显然这种权重并没有考虑上述第二条原则,因此在大规模系统中是不适用的。目前,常用的关键词权重计算公式大多基于tf和df进行构建,同时,一些较为复杂的计算公式也考虑了文档长度。现简要列举如下:

TF-IDF得分。严格地说,TF/IDF得分并不特指某个计算公式,而是一个计算公式集合。其中TF与IDF都可以进行各种变换,究竟何种变换较能符合实际需求,需要由实验和应用来验证。常见的变换方法有:

其中,最后一个公式,即:

被大量系统证明是最有效的。

此外,较为常用的关键词权重算法还包括Okapi权重和Pivoted Normalization 权重(PNW)。这些公式综合考虑了查询和文档中的词频,以及文档的长度。Okapi权重需要预设三个参数:

   k1,在1.0-2.0之间 b,通常为0.75 k3,在0-1000之间 而PNW则需要预设一个参数s,大部分情况下取0.20。

在经典模型中,假设索引项是独立的,或者说是正交的。这个假设极大地简化了索引项权值的计算过程,尽管这一假设有时不符合自然语言的实际情况,但是在这个假设下,计算权值的过程简单快捷,因而在目前很多实用的信息检索模型中仍被广泛采用。向量空间模型中索引项权重的算法提高了检索的性能,改进了检索效果,同时采用了部分匹配的策略和一定的相似度计算方法,使得模型可以根据结果文档与检索项的相似度进行排序,检索出与用户查询要求接近的文档,从而有效地控制返回文档的数量和质量,检索的结果文档集更接近用户的检索需求。但是事实上,在自然语言中,有些索引项是相互关联的,比如当在一个文档中看到“计算机”时,就非常有可能同时看到“科学”;而当在一个文档中看到“土豆”时,看到“计算机”的可能性就很小。再比如:“王励勤”“乒乓球”的出现不是独立的。同时,该模型丢失了句法信息(如短语结构、词的顺序等),而权重的计算需要利用整个文档集合的信息。

3.3、概率模型

由于信息检索中文本信息的相关判断的不确定性和查询信息表示的模糊性,导致了人们用概率的方法解决这方面的问题。Maron和Kuhns在1960年提出了第一概率检索模型;1976年Robertson和Sparck Jones等在此基础上进行改进提出了第二概率检索模型;之后,Turtle、Fuhr和Roberston又提出了统一化模型,即第三概率检索模型,提高了文档的排序精度。

信息检索的概率模型基于概率排序原则:对于给定的用户查询Q,对所有文本计算概率,并从大到小进行排序,概率公式为:P(R|D,Q)。其中,R表示文本D与用户查询Q相关。另外,用R’表示文本D与用户查询Q不相关,有:

P(R|D,Q)+ P(R’|D,Q)= 1,也就是用二值形式判断相关性。把文本用特征向量表示:x =(x1,x2,,xn)。其中,N为特征项的个数,xi为0或者1,分别表示特征相i在文本中出现或不出现。

在信息检索中,估计参数是困难的,一般地并不直接地计算P,而是把计算P(R|di,qk)换为计算P(R|x,qk),这样处理略去了公式中与文本无关的特征项,计算的结果可能与实际不符。为了容易计算,现在假设包括相同特征项的文本,经过计算后,它们的可能性是相同的。将所有文本按相关概率P进行排序,等价于所有文本按特征向量排序。一个文本D的概率相关性的计算为:

下载B8毕业设计(论文)工作总结word格式文档
下载B8毕业设计(论文)工作总结.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    毕业设计论文

    毕业设计(论文) 软弱土地基处理对策研究 刘建军 ( 建筑工程技术 专业 0730610256 湖北 黄石 435003 ) 摘要:为充分利用土地资源,有必要对软弱土地基进行处理。本文探讨了软弱土......

    毕业设计论文2014 (完整格式)

    完整的论文标题写在这里 摘要: 摘要内容三百字左右。简述课题和论文的主要内容,如:课题提出了什么问题,经过了哪些分析,遇到了哪些困难,解决了什么问题,得出了什么样的结论等等。三......

    毕业设计(论文)

    [在此处键入] 日照职业技术学院毕业设计(论文) php许愿墙系统 学生姓名 院 部电子信息科学与工程学院 专 业计算机应用技术 指导老师 日 期 2015-05-19 目录 一 许愿墙简介 ........

    毕业设计论文

    毕业设计论文-利用本量利方法测评企业效益第一章××乳业公司的企业概况1、自然状况哈尔滨××乳业公司位于黑龙江省呼兰县境内,企业的前身为松花江第二乳品厂,始建于1982年,占......

    毕业设计论文

    公司简介 陕西展屹建设工程有限公司,成立于1989年,坐落于历史悠久的美丽古城西安。公司注册资金2000万元。施工总承包2级资质,可承接总造价亿元以上工程。经营范围;建筑工程、......

    毕业设计论文

    重庆大学城市科技学院本科学生毕业设计(论文)正文摘要 室内设计是指为满足一定的建造目的(包括人们对它的使用功能的要求、对它的视觉感受的要求)而进行的准备工作,对现有的建筑......

    宁夏理工学院毕业设计(论文)工作总结参考

    届本科毕业设计(论文)工作总结 系名称: (加盖公章) 专业名称: 1、 2、 3、 4、 5、 6、 填表时间: 年 月 日 毕业设计(论文)的工作总结(参考提纲) 1.组织与管理方面做了哪些工作? 2.指导......

    3毕业设计(论文)工作总结要求

    毕业设计(论文)工作总结要求毕业设计(论文)工作是一个重要的教学环节,各分院(系)都应在这项工作结束之后进行认真总结,分析教学质量,总结工作经验,肯定成绩,找出存在的问题与不足,为下次......