第一篇:徐州普果舆情监测系统平台简介
徐州普果舆情监测平台打破舆情监测领域高价格局
2013年7月,徐州普果网络技术有限公司与中国联通徐州分公司达成战略合作,使用国内最具影响力的Goonie搜索引擎软件以及Goonie互联网舆情分析软件,建设一套面对各级政府单位及企业服务的互联网舆情监测与分析平台(以下简称舆情平台)。该舆情平台能够对互联网各类新兴媒体中传播的海量舆情信息进行监测、分析;及时、准确、智能的发现热点舆情、重要舆情,有价值的人物;并从多种维度,多种方式进行挖掘、展现;借助于新闻传播学的理论及方法,结合数据挖掘及搜索引擎等技术,帮助各政企单位及时洞察社情民意或企业、品牌、产品在用户中的形象及口碑,对涉及政府或企业品牌形象的舆情进行及时响应,进而提升舆论形象,并为日后的正确决策提供支持。中国联通徐州分公司与徐州普果网络技术有限公司合作共建的舆情监测平台,是徐州市及周边地区首家运营商参与投建的舆情监测技术平台。此平台充分依托联通公司IDC(互联网数据中心)的优势,以特级的机房和宽带网络资源,将舆情监测平台的数据抓取速度和监测效果体现的淋漓尽致,受到了新闻媒体、政企客户、舆情监测领域专家们的一致好评。通过此舆情监测平台,完全有能力让您第一时间发现网上负面信息、第一时间洞察民意口碑、第一时间知晓竞争情报,从而让您更好的掌控全局。
据徐州普果网络技术有限公司副总经理朱麒运先生介绍,该舆情监测平台采用了实时采集网络舆情信息,包括新闻、论坛、博客、贴吧、微博、QQ群以及公众微信等形式,7*24小时为客户提供信息采集、信息处理、信息编辑功能,实时掌控所关注的网络舆情信息,为政府、企业决策提供参考依据,及时了解民意、民生,及时解决民生问题。普果公司朱总谈到:论坛、社区、微博、贴吧为网民发表言论提供了阵地,地方政府和宣传部门缺乏有效的监测手段,造成突发舆论的大面积传播,特别是一些不负责任的负面言论,严重影响社会和谐,破坏投资环境,损害领导威信。对于这类信息,如果及时监测发现处理,就能及时处理还处在萌芽状态的事态的发展。对于现代企业来说,网络舆情监测具有非常重要的意义。因为有关企业和产品的“网络舆情”,就代表了企业的产品或者服务在消费者中的主流印象和评价。如果能监测收集到这些舆情信息,对于企业的的发展有着巨大的推动作用。
该舆情平台的工作原理是将监测系统所需的服务器等相关硬件设备安置在联通公司本地机房,并接入高速的互联网专线宽带。将Goonie搜索引擎软件、Goonie互联网舆情分析软件、企业竞争情报系统等相关软件配置在专有服务器上,利用搜素引擎技术、文本处理技术、知识管理方法,通过对互联网海量信息自动获取、提取、分类、聚类、主体检测、专题聚焦,实现用户对网路舆情监测和热点事件专题追踪等需求。该舆情平台与花费大量资金自己部署网络舆情监测系统不同,该平台通过软件平台服务模式给用户提供网络舆情监测服务,用户不需要单独部署舆情采集服务器,只需通过帐号密码登录PC或手机客户端服务系统,即可全面监测网络舆情。用户可通过PC客户端服务平台日常监测上万家网站的新闻、博客、论坛及微博等信息。智能化、人性化的设计为用户提供信息检索、专题设置、趋势浏览、数据分析、简报生成等各项功能,用户无需培训就可以进行操作。徐州普果网络技术有限公司 朱麒运 ***
第二篇:云舆情监测系统
云舆情监测系统
随着网络日益的发达,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一,网络舆情的重要性凸显出来。网络舆论热点层出不穷,各种突发性事件都是通过互联网第一时间扩大传播。网络舆情信息主要来源是新闻评论、bbs、博客等,这些成为政府了解社情民意的直接渠道,也是新形势下政府的重要舆论阵地。因此,网络舆论一旦被错误地控制和引导,将成为影响社会稳定的重大隐患。
舆情监测系统在这样的环境下产生,它可以通过采集各大门户网站信息内容来知晓最新的社情民意,民众的舆论导向。
系统工作流程
采集新闻、论坛网站内容→通过监测系统网站分析、舆情分析第一时间发现敏感、热点话题→由专家学者、评论员或是新闻发言人分析报告、进行及时的舆论引导。
系统介绍
系统对所需信息进行过滤、分析、聚合和数据挖掘,以传播力和影响力作为分析指标,及时发现信息,分析并追踪传播及演变过程,并对指定重点敏感事件进行专项监测与分析。
云舆情监测系统提供对互联网信息(新闻、论坛、博客、贴吧、微博客等)实时采集、内容提取及排重;并且对获取的信息进行全面检索、主题检测、话题聚焦、相关信息推荐;按需求定制主题分类;为舆情研判提供时间趋势、传播路径、话题演化等工具,统计舆情信息,生成舆情报告。
全面实时监测网络舆情
采用定向采集为主、全网监控为辅的方式,自动对新闻(新闻跟帖、新闻评论、RSS)、论坛(回帖、点击数、回复数等)、博客、贴吧、微博客等网络媒体进行全面实时监测。智能处理舆情信息
对互联网舆情信息自动提取关键词、摘要、分类、聚类、主题检测、关联分析、情感分析。
完善的舆情监控业务
自动监测敏感信息,自动聚焦热点话题,自动追踪潜在舆情事件。可预置审核流程,逐级审核、上报舆情信息。自动探测页面删除状态,统计研判网络舆情,生成可定制舆情报告。提供对本地网站的属地化管理,支持违规网站信息统计管理。
行业特色功能
支持实现对网络舆论导向的全面掌控、效果评估。
第三篇:舆情信息监测服务系统
舆情信息监测服务系统
舆情信息监测服务系统是一个高度集成的专业化数据检索和分析系统,总体上包括舆情信息采集、舆情分析引擎、舆情监测应用三个核心功能。从互联网采集新闻、论坛、博客、微博、平面媒体、微博等舆情信息,并存储到舆情数据库中,并通过舆情搜索引擎对海量的舆情数据进行实时索引。对采集的数据进行智能筛选,萃取准确的舆情信息。舆情分析引擎负责舆情数据库进行智能分析和加工。舆情服务平台把舆情数据库中经过加工处理的舆情数据发布到Web界面上并展示给客户。客户通过舆情服务平台浏览舆情信息,通过简报生产等功能完成对舆情的深度加工。整个系统结合了C/S、B/S两种不同的应用模式,并形成了优势互补。系统共分四大功能模块。分别为:信息采集功能、信息处理功能、舆情分析功能、舆情展示功能。
(1)信息采集
信息采集可自定义监测站点击监测关键词,新闻、论坛、博客、微博。结合元搜索技术(搜索引擎结果补充),确保信息全面性。
定向抓取源:云腾舆情监测分析系统收录7000个监测网站,包含站点数约为15万个站点,对这些站点中的新闻,论坛,博客等实现全面的抓取,同时支持对主流新闻网页分页、评论内容的采集以及对评论点击数、回帖数的抓取。
搜索引擎结果:云腾智能爬虫系统还可以自动跟踪多个搜索引擎的搜索结果,对监测数据进行补充。
自定义URL来源采集频率:除系统常规监测范围外,还可以自定义需要重点监测的信
息,客户可以设定采集的栏目、URL、更新时间、扫描间隔等,以便及时发现目标信息源的最新变化,并以最快的速度将个性化关注内容采集到本地。
(2)信息处理
垃圾信息过滤:基于机器学习的垃圾过滤机制可以自动过滤广告、水贴等无效垃圾信息。
智能去重:采用“文章相似度技术”,根据文档内容的匹配度确定是否重复、去重的级别;根据不同的需要特点分为:URL去重、标题去重、正文去重三个级别。
HTML内容提取:采用自主知识产权的HTML网页文本萃取技术自动提取任意复杂网页中的标题、内容、作者、发布时间等信息,自动跟踪文章分页;对于论坛信息自动分析主贴、回帖以及作者等信息。
快照保存:对于每个经过抓取和处理的网页,系统都存有一个纯文本的备份,方便客户快速浏览,也方便客户查看被删除的文章或帖子。
(3)舆情分析
文章权重计算:综合网站重要程度、文章出现位置、主题相关度、危机程度、点击回复次数、传播数量以及客户自定义规则等复杂参数计算的文章权重,加上基于自然语言处理技术的训练系统,能准确分析出重要舆情信息。
传播轨迹分析:系统可以对于一段时间(自定义范围)内的舆情信息走势进行分析展示,同时可以以不同的载体如论坛、新闻等分类呈现。
自动分类与情感分析:将自然语言处理技术(NLP)应用于舆情监测领域,对信息精准分类并自动做情感分析。
相似文章聚类去重:基于自然语言处理技术,系统根据文章内容相似程度技术相似文章,方便获取同一内容文章的所有传播网站。采用“文章相似性技术”,根据文档内容的匹配程
度确定是否重复、去重的级别;根据不同的需要特点分为:URL去重、标题去重、正文去重三个级别。在详细信息列表里,分为“过滤”与“不过滤”,展示相关文章;媒体覆盖分析:系统可以对于监测信息的媒体类型进行展示,同时对于信息的主要传播媒体自动识别,进行综合分析,以图表呈现。
(4)舆情展示
在舆情信息呈现上,信息监测平台支持多种互联网终端设备和接入方式。除了传统的移动设备Web网页接入方式,还可以通过短信、邮件对信息进行及时推送,同时还可以通过移动设备客户端(Android客户端、iOS客户端、平板电脑客户端等 如图)进行信息交互。
WEB客户界面:基于云计算模式,客户可以使用WEB浏览器随时登陆系统,在客户界面对舆情状况进行全面的了解。客户界面包含了如舆情走势、舆情详细信息、最新微博信息、载体覆盖情况等主要内容,并以列表以及图表展示等可视化方式呈现,方便客户查看。导航栏清晰明了,方便我们中心查看各种分类;实时搜索功能,可以自定义搜索条件查看系统抓取的最新监测信息;支持关键词组分类、媒体类型分类、信息属性分类查看。
舆情预警:预警级别显示,显示当日舆情级别,方便客户整体把握,同时呈现预警信息走势和预警信息列表。建立多个舆情指标,对于突飞舆情自动发出舆情信号,在最短时间内通过邮件方式通知客户,辅助进行舆情干预和引导。
舆情分析报告:根据舆情分析引擎处理后的结果库生产报告,客户可通过浏览器浏览,并且可以导出生成为Word、PDF等格式的本地文档。方便客户对不同时段的重点和热点以及对事件舆情数据的把握。
第四篇:舆情监测系统建设方案
突发公共事件发生前、中、后均可进行舆情监测,对网络舆情进行实时关注,及时发生社会稳定的不利因素。
常态和非常态,自动搜索关注量较大的新闻和热点,通过对新闻及相关数据的挖掘、分析,及时发现社会安全隐患,及时发出预警信号,达到早发现、早报告、早处置的目的,做好社会安定防控工作。
舆情监测系统通过对热点问题和重点领域比较集中的网站信息,如:网页、论坛、博客等进行24小时监控,随时下载最新的消息和意见。下载后完成对数据格式的转换及元数据的标引。对下载本地的信息,进行初步的过滤和预处理,减少智能分析的工作量。对热点问题和重要领域实施监控,前提是必须通过人机交互建立舆情监测的知识库,用来指导智能分析的过程。对热点问题的智能分析,首先基于传统基于向量空间的特征分析技术上,对抓取的内容做分类、聚类和摘要分析,对信息完成初步的再组织。然后在监控知识库的指导下进行基于舆情的语义分析、倾向性分析,使管理者看到的民情民意更有效,更符合现实。最后将监控的结果,分别推送到不同的职能部门,供制定对策使用。
1.1 互联网舆情监控系统 1.1.1 需求分析
通过对网页、论坛、博客、新闻评论信息的深度搜索和挖掘,实时对突发公共卫生事件的媒体报道和公众舆论信息进行汇聚和统计分析,使市卫生局应急办人员能够随时了解社会公众的声音,每天自动生成舆情监测专报,上报相关领导,为领导决策提供准确、全面的信息。
1.1.2 建设方案 1.1.2.1 网络舆情抓取
自动采集网络媒体发布的网络新闻、BBS论坛信息、博客内容信息,舆情采集用户只需输入一个待采集的目标网址即可实现图文结合采集到本地。网页采集模块在互联网上不断采集新闻信息,并对这些信息统一加工过滤、自动分类,保存新闻的标题、出处、发布时间、正文、新闻相关图片等信息,经过手工配置还可以获得本条新闻的点击次数。以网络论坛BBS为代表的交互性网络站点,往往是一些突发事件的网络舆情爆发点。
1.1.2.2 网络舆情热点自动发现
对重要的热点新闻信息进行分析和追踪,对于突发事件引起的网络舆情,可以及时掌握舆情爆发点和事态。系统会根据新闻文章数及文章在各大网站和社区的传播链进行自动跟踪统计,提供不同时间段(1天、3天、7天、10天)的热点新闻。对每条热点新闻还可以查看新闻相关传播链,了解在某一时间段该热点新闻在哪些站点的传播数量。同样也提供热点帖子、热点专题等功能。
1.1.2.3 多维度关联的舆情展现
自动对每天采集的海量的、无类别的舆情进行归类,把内容相近的文档归为一类,并自动为该类生成主题词。可支持自动生成新闻专题、重大新闻事件追踪、情报的可视化分析等诸多应用。
1.1.2.4 舆情分析和统计
1、热点专题统计
热点专题总体分布、重点预警事件总分布、各类重点预警事件分布。
2、站点统计
可统计各采集站点的采集文章数、统计各论坛站点的采集文章数。
3、热点人名
系统自动抽取文章中的人名,并按该人名出现的文章次数进行统计,可查看热点人名的传播趋势。可按日期查询热点词语。
4、热点地名
系统自动抽取文章中的地名,并按该地名出现的文章次数进行统计,可查看热点地名的传播趋势。可按日期查询热点地名。
5、热点机构
系统自动抽取文章中的机构名,并按该机构名出现的文章次数进行统计,可查看热点机构的传播趋势。可按日期查询热点机构。
6、热点词语
系统自动抽取文章中的热点词语,并按该词语出现的文章次数进行统计,可查看热点词语的传播趋势。可按日期查询热点词语。1.1.2.5 舆情专报生成
根据配置的关键词信息,自动定时生成要求格式的舆情专报,提供给领导进行参考。
第五篇:网络舆情监测系统评价标准
网络舆情监测系统评价标准
随着互联网的快速增长,网络舆情监测软件及其服务市场也迅速地发展起来,保守地估计,在中国大陆地区这个市场的总量已经逼近10亿元人民币规模。
市场参与者主要包括四种类型的公司:第一类是拥有网络信息搜索或(中文)文字信息处理等相关技术的软件公司;第二类是公关、广告公司,这类公司是在传统媒体监测业务基础上发展出网络新媒体监测业务;第三类是网络营销服务公司,近几年这类公司增长迅猛,网络社会化媒体的飞速发展是其发展的催化剂;第四类是依托传统媒体延伸出的增值服务。随着网络的发展,不少传统媒体也开始“触网”,并逐步发展出针对网络媒体的新业务,而网络舆情监测是其中的一个方面。例如,人民网舆情监测室。除了以上四类公司之外,还有一类进行网络舆情监测业务的参与者,他们是主管部门或行业机构所属的网络舆情监测机构,但严格意义上讲,此类机构和参与完全市场竞争的公司是不同的,因此,单独另归为一类。
社会化网络媒体的兴起,正在改变传统的信息传播机制。网络传播具有匿名性、速度快、范围大、持续力强、传播渠道多元化、传播效果可测量等特点。一条负面信息从出现到形成舆论热点的周期,从原来的24小时(传统新闻媒体比较典型的更新周期)缩短到现在的4小时(微博热点话题达到第一个传播峰值比较典型的时间周期)。如果不能在这4小时内做出解释、反馈、制定应对策略,就可能出现舆论一边倒的局面,甚至可能发生极具品牌杀伤力的公共危机。由此,也就有了网络舆情监测响应“黄金4小时”的说法。
做出及时、准确应对的前提是,要能够在第一时间了解网络舆情的内容、发生源、关键传播途径等相关信息数据。由此,对于网络舆情监测软件的性能提出相应要求。
如何来评价网络舆情监测软件(系统)的性能呢?个人认为主要着眼于以下三个方面。
评价标准之一:对网络内容监测的准确性。
对于内容的判断是一个关键技术,目前的监测系统还不能做到对内容信息的完全自动判断和处理,在不能保证内容识别百分之百准确率的情况下,往往需要对监测分析的中间产物或不能识别的信息进行一定程度的人工校验和清洗。
中文信息在处理上具有一定特殊性和技术难点。英文每个单词之间用空格或标点符号进行分隔,与英文不同,中文字之间没有空格,由字组成词存在多种可能情况,中文分词是识别的一个难点。
分词难点:一是分词的歧义识别,歧义是指同样的一句话,可能有两种或者更多的切分方法。主要有“交叉歧义”、“组合歧义”、“真歧义”(相关定义参见附录)三类情形。“真歧义”必须要联系上下文才能够确定在文中的具体涵义;二是新词识别,随着时代的发展,中文新词不断涌现,如果没有被收录而要进行自动识别是非常困难的。与之相似的还有专业术语、名称(包括,人名、商标、简称、机构名、缩略语等)等的识别问题。新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。
在分词基础上,中文内容监测还需要对信息自动进行聚类、情感分析、提取摘要,特别是自动根据上下文内容判断情感倾向与危机度、区分正负面。而这正是网络舆情监测的核心工作之一。
为了提高内容识别的准确性,大部分网络舆情监测系统采取了专业化发展的策略,通过面向特定领域的知识、经验和基础数据的积累与不断更新,逐步建立起舆情监测系统在特定领域内的服务特长和功能优势。由此,也就有了舆情监测服务市场的细分化,有的专注于民生与社会动向、有的专注于消费品牌、有的专注于特定行业„„
也有一些监测系统提供全方位的监测服务,这些系统有较好的业务包容性,能够满足网络舆情监测的主要需求,或者能够根据客户需要做到定制化的服务,这类系统通常都会针对新客户有一个系统部署阶段,在部署过程中完成一些定制化的工作。
“专用型系统”与“通用型系统”各有特色,客户在选择时主要评估是否能够充分满足自身需求,同时拥有较好的性价比。两类系统相比较,我个人更看好“专用型系统”未来的发展。主要根据是,网络媒体和内容形式的发展非常迅速,一个好的舆情监测系统必须有一个持续而专业化的服务保障体系为支撑,而“专用型系统”在此方面会有比较明显的优势。另外,“专用型系统”还可以根据特定行业或其他特定领域的特殊需求事先预置一些特色功能,如果设计得当,这些功能会对目标客户有很大帮助和价值,也会成为营销中的主要卖点之一。
准确性方面不同系统的表现差异很大。从市场反馈的情况看,在商用领域,需要分行业进行监测服务的业务积累,在某个行业或细分领域有的系统监测得好、有的系统就不行;同样,在政府管理服务领域,也有数个细分领域,不同系统的表现也是参差不齐。
评价标准之二:网络内容监测时效性。
时效性的高低与软硬件技术和运营设备资源都有密切关系,其中涉及到的专业技术不是本文关注的范畴。这里要指出的是,时效性与前面提到的准确性是紧密相关的。如果系统对内容的判断准确性高,需要的人工干预就少(当然,理想状态是完全不需要人工干预),监测信息处理的时滞就少,监测的时效性自然就会有保障。如果系统需要一定的人工干预,通常情况下,会平均滞后0.5~3天左右。这个时间已经远远超出了前文提到的网络舆情监测及响应“黄金4小时”周期。如果系统的时效性低,就不能对网络突发舆情进行及时监测和应急处理,而这对危机公关服务是非常关键的。
有一些监测系统的结果是依赖于baidu、google等搜索引擎的搜索结果进行再分析(所谓的元数据抓取),而这些大型搜索引擎的数据抓取更新是有自己的特定规律和周期。对于排名靠后的网站,搜索引擎爬虫软件会隔几天,甚至更长时间,才会光顾一次。这种情况下,时效性自然不会有保障。
当然,对于时效性,不同的客户会有不同的要求。有的客户会要求做到“实时监测”,例如提供危机公关服务的公关公司、广告公司和一些关注于民生与社会动向的机构等;也有的客户对时效性要求不是这么高,例如对品牌价值进行评估的服务需求,对特定事件做事后评估的服务需求等等。
通常情况下,时效性高低是网络舆情检测系统定价的一个重要基础,从节约经费的角度出发,客户还是应当选择满足自身业务时效性需求前提下性价比较高的系统和服务,不一定非要求做到“实时监测”。
评价标准之三:网络内容监测全面性。
网络内容监测全面性的概念很好理解,就是系统所监测网站的类别及总量。通常情况下,监测系统不会做全网监测,先不说技术上的困难,仅在运营费用和投入上就是中小规模公司难以承受的。性能优越的监测系统会有选择地进行网络监测,客户关注领域的相关网站、排名靠前的大网站、热点网站是监测的主要对象。
绝大多数号称能够做到“全网监测”的系统都是依赖对搜索引擎的搜索结果进行再分析——元数据抓取。前文已经指出,这种方式可以达到了大覆盖,但牺牲了时效性。
不过在全面性方面也有一些技术问题需要处理,一些主要的内容服务网站、社会化网络媒体和电商网站对于爬虫软件已经做了限制。限制的原因有所不同,内容服务网站、社会化网络媒体(SNS网站、微博等)主要是出于对信息及用户数据的保护和主管部门的特定要求,电商网站(自主平台类)主要为了防范网络商品比价。
综合地看,相对于“准确性”与“时效性”而言“全面性”问题更容易解决,技术因素是一方面,通过加大服务器和带宽等运营资源的投入也能够取得显著地改善。
网络舆情监测软件及其服务市场的发展趋势
网络舆情监测软件及其服务市场具有很大的发展潜力,个人观点在今后5年内这个市场都会保持快速发展势头,年复合增长率在30%以上。
我很赞同计世资讯研究(CCW Research)的观点——“舆情监测分析软件市场未来的发展方向是行业化与服务化”。行业化主要是指软件及服务要与各行业的特点紧密结合,服务化是指舆情监测软件将采用软件运营服务SaaS模式,舆情监测运营服务将成为一种新的发展模式,在降低投入门槛的同时将受到更多客户的青睐。
目前,市场格局还很分散,还没有上规模的运营服务商,这是一个市场空白。近几年云计算技术的快速发展将创造新的发展机会,在通过云计算大幅度提升软件系统效能和服务品质的同时,也有利于催生在这个细分领域内上规模的运营服务提供商。
从服务对象角度看,专业网络舆情监测软件及服务公司主要服务于政府部门、专业服务公司(主要是,公共公司、广告公司、网络营销服务公司)和互联网公司。然而,随着互联网对社会经济发展的快速渗透和融合,越来越多的企业和机构认识到了网络营销、网络舆情的重要性,他们中的一小部分已经开始尝试使用网络舆情监测软件及服务。虽然他们在客户市场中目前所占的比重还不到10%,但是到2018年很有可能占到30%以上的比重。从商业服务角度,网络舆情监测软件及服务与网络营销服务之间存在着密切的联系。对于能够提供品牌监测的软件系统,如果能够把营销评估(营销决策支持)和营销管理工具结合起来,把系统服务延伸到营销管理与营销作业流程中,将具有更大的市场潜力。在这方面市场参与者还较少,做得好的系统很少,未来应该有不错的发展空间。(陈兴跃)附录:
中文分词的歧义类型
(此附录的相关内容来自互联网)
歧义是指同样的一句话,可能有两种或者更多的切分方法。例如:“表面的”,因为“表面”和“面的”都是词,那么这个短语就可以分成“表面▁的”和“表面的”。这种称为交叉歧义。像这种交叉歧义十分常见,前面举的“和服”的例子,其实就是因为交叉歧义引起的错误。“化妆和服装”可以分成“化妆▁和服装”或者“化妆▁和服▁装”。由于没有人的知识去理解,计算机很难知道到底哪个方案正确。
交叉歧义相对组合歧义来说是还算比较容易处理,组合歧义就必需根据整个句子来判断了。例如,在句子“这个门把手坏了”中,“把手”是个词,但在句子“请把手拿开”中,“把手”就不是一个词;在句子“将军任命了一名中将”中,“中将”是个词,但在句子“产量三年中将增长两倍”中,“中将”就不再是词。这些词计算机又如何去识别?
如果交叉歧义和组合歧义计算机都能解决的话,在歧义中还有一个难题,是真歧义。真歧义意思是给出一句话,由人去判断也不知道哪个应该是词,哪个应该不是词。例如:“乒乓球拍卖完了”,可以切分成“乒乓▁球拍▁卖▁完▁了”、也可切分成“乒乓球拍卖▁完▁了”,如果没有上下文其他的句子,恐怕谁也不知道“拍卖”在这里算不算一个词。