第一篇:煤炭资源税费属性研究
煤炭资源税费属性研究
摘要:一般理论研究中都将煤炭行业中的矿业权价款和使用费、资源税、矿产资源补偿费视为煤炭资源成本。基于租税理论,我国目前煤炭行业的资源税和矿产资源补偿费的本质属性是租,是市场对煤炭资源所有者的“赐予”;所有者可以借助煤炭资源租这一经济手段控制或影响开采者的行为,实现煤炭资源的可持续利用。因此,实现政治权利的税费制向所有权租税制的变革是煤炭资源税费改制的方向。
关键词:煤炭资源税费;成本;资源租;税费调整我国“缺油、少气、富煤”的能源结构决定了煤炭是我国国民经论文发表济发展的资源基础,煤炭在一次能源消费总量中的构成一直占70%左右,并且据预测,这一消费结构在近五六十年内难以改变。但煤炭却是不可再生资源,据BP(2007)估计,我国煤炭资源储量只有1145亿吨,可供开采年限只有45年。因此,煤炭资源产业的可持续发展问题、煤炭资源的接续能源开发问题等是我国政府必须关注的现实问题。本文从税费视角对煤炭行业面对的税费条款设置的目的及作用进行剖析,研究我国煤炭税费制度应发挥的作用及变革的方向。
一、我国煤炭资源税费结构特征我国现行的煤炭资源税费主要有矿业权(探矿权、开采权)价款及使用费、资源税、矿产资源补偿费(参见表1)。
1.矿业权使用费及价款。两权使用费和价款设立的初衷在于完善矿产资源有偿使用制度,形成高效的资源勘探资金机制,实现对煤炭资源有效地勘查、保护和管理。1996年国务院修订了《矿产资源法》、1998年出台了《探矿权采矿权转让管理办法》,初步确立了探矿权采矿权有偿取得、有偿使用的制度,建立了矿产资源有偿使用的制度框架。但我国目前煤炭资源无偿和有偿使用双轨制格局的存在,企业无偿或以极低投入获取矿业权,导致行业进入门槛过低,大量不具备安全生产条件的小煤矿纷纷进入,由此带来资源的浪费,所以,包括矿业权价款的二级流通市场完善等一系列问题仍有待完善。
2.资源税与矿产资源补偿费。矿产资源补偿费和资源税是我国矿产资源有偿使用制度的主体。资源税设立的目的是为了调节资源开发活动中的级差收益;而矿产资源补偿费设立的用意,在《矿产资源法》中明确将其作为对使用国家所有矿产资源的支付,也就是要实现国家对资源所有权的“绝对收益”。但在具体实施中,资源税的征收方式却是既适用于开采优质资源的煤炭企业,也适用于开采劣等资源的煤炭企业,也就是说,对煤炭资源“级差收益”的调整是通过“绝对收益”的获取方式,这本身就存在不合理性,所以,从实际效果看,资源税混淆了与资源补偿费的性质。基于此,有学者建议取消资源税,有学者主张取消矿产资源补偿费,趋于一致的观点是效仿国际惯例改征权利金取代资源税和矿产资源补偿费,提高征收比率,实现国家的所有权收益。
二、厘清煤炭资源税费因素的成本属性在一般的理论研究中,煤炭资源矿业权(探矿权、开采权)价款和使用费、资源税、矿产资源补偿费习惯上被称为我国煤炭企业资源成本。根据探矿权、采矿权价款和使用费的界定,虽然目前我国关于矿业权价款的二级流转市场还不完备,但是要获得煤炭资源的探矿权或教育论文发表/jylwfabiao/采矿权,为了获取或使用相应的经营权,支付价款是事前的程序(虽然目前价款可以分阶段上交),而支付矿权使用费是事后的程序,因此,很好理解矿业权价款和使用费是矿权人必须付出的经营成本;而按照租(或地租)相关理论,资源税和资源补偿费(或者权利金)本质上不应该被视为煤炭企业成本。
资源税和资源补偿费的本质属性是租。租是商品经济条件下资源所有权与资源使用权相分离的产物,是资源使用者为取得资源使用权向资源所有者支付的费用,是资源所有权在经
济上的实现。我国的矿产资源属于国家所有,国家作为煤炭资源所有者应当向资源使用者单位或个人征收资源租。由于我国目前对煤炭行业的资源税和矿产资源补偿费征收方式没变,同时对其改革方式还没有形成一致的看法,所以下文仍用资源税和矿产资源补偿费表示国家对煤炭资源应享有的煤炭资源租。
经营者(企业)对资源租的支付不同于对成本的支付。关于租的支付和衡量可追溯到经济学之父亚当·斯密的“三位一体”公式关于地租的解释。斯密认为工资和利润是决定煤炭资源产品价格高低的基本要素,租的有无及其大小则等于煤炭资源产品的价格在扣除工资和利润以后的余额,而煤炭资源产品价格的高幼师论文发表/yjlwfabiao/低则取决于人们对其需求的程度。当煤炭资源供不应求成为稀缺资源时,产品价格中才会有租的成分。也就是说,煤炭资源租是市场对煤炭资源所有者的“赐予”,租的所有权属于资源所有者,经营者应该将产品价格中的租转让给所有者而不是强留下来作为超额利润看待。并且这种观点一致延续下来.Hotelling基于此推导出了霍特林法则(Hotelling Rule);宋承先用“作为剩余的租
第二篇:服务质量属性的实证研究
服务质量属性的实证研究
广告服务质量管理是服务性企业经营管理的核心内容,服务质量决定服务性企业营销效果,经济收益和竞争实力的重要因素。
为了直到服务性企业管理人员做好服务质量管理工作,国外许多学者对服务属性进行了大量的研究,提出了一系列服务属性分类方法。
国外许多学者采用“多重属性模型”来评估服务质量。美国哈佛大学学者赛塞(W.Earl Sasser)、奥尔逊(R.Paul Olson)和华艾科夫(Daryl D.wyckoff)提出了七类服务属性,作为评估服务质量的基本属性。
(1)安全:指人身安全和财产安全;
(2)一致:指服务的规格化和可靠性;
(3)态度:指服务态度;
(4)完整:指服务项目是否完整;
(5)环境:指服务环境和气氛;
(6)方便:指服务时间和服务地点是否方便顾客;
(7)时间:指服务所需的时间和服务速度。
美国学者潘拉索拉曼(A.Parasuranman)、隋赛莫尔(Valarie A.Zeithaml)和贝里(Leonard L.Berry)经过大量调查研究,指出顾客主要根据可靠、可感知、反应、保证、移情等五类服务属性评估服务质量,并依据这五类属性的内涵,于1988年设计了由22个指标组成的SEVEQUAL服务质量评价方法,较好地解决了服务质量评价的难题。但是,SEVEQUAL反映的是顾客对服务过程的整体评价,利用这种方法得到的信息是粗线条的。于是他们在80年代末又提出了差距分析模型(Gap Analysis Model),该模型专门用来分析服务质量问题的根源,可以发现服务提供者与顾客在服务观念上存在的差距。
该文认为:这些欧美学者主要是从顾客如何评估服务质量的角度研究服务属性,但要知道服务性企业管理人员做好服务质量管理工作,理论工作者应研究管理人员从哪些方面加强服务质量管理。该文在实践中,从服务性企业人员的角度提出了5项服务质量属性:技术质量、感情质量、关系质量、环境质量和沟通质量。他们的研究结果显示对服务对象而言,技术质量是服务最重要的质量属性;而服务对象对服务人员的满意程度对总体满意度的影响最大。
第三篇:煤炭资源管理办法
城郊煤矿煤炭资源管理办法
为了加强煤炭资源的回收,减少煤炭资源损失,提高采区及采煤工作面回采率,搞好资源回收管理工作。并根据集团公司《煤生(2002)85号》文的有关精神,结合X煤矿的实际情况,特制定《X煤矿煤炭资源管理办法》。
一、成立煤炭资源管理领导小组:
下设办公室,办公室设在生产技术科。
二、储量技术数据的收集方法
1.工作面调查和丈量一般每五天一次,当工作面推进速度较快或构造复杂时,应适当增加丈量次数。
2.工作面采高及煤厚丈量应沿切眼方向每10米丈量一个点,丈量的位置应尽量选择在靠近煤壁处,皮尺应垂直于顶底板,点位分布尽量均匀。煤层厚度及采高的丈量误差应小于煤层厚度的3%。工作面的伪顶不能作为采高丈量。
3.工作面丈量内容应包括:工作面实际进度、采高、夹矸厚度、挑顶厚度、破底厚度、工作面丢失的顶煤、底煤及浮煤厚度。以上数据均应在同一个测点上进行。
4.对综采工作面局部煤层厚度大于3米时,要沿顶回采。最大采高3米,超过3米部分不记入采高;当工作面煤层厚度在2.1~3.0米时,必须见顶见底回采,采高达到煤厚;当工作面煤厚低于2.1米时,根据情况挑顶或破底,保证采高为2.1米,但严格控制挑顶或破底高度。
5.回采工作面过断层时,采煤队应提前以书面形式通知生产科,说明断层落差、长度、位置,由生产科审批过断层方案。采煤队应把审批后的过断层措施报储量管理部门。过断层时,应尽量减少挑顶或破底高度。当采高达到2.1米,采煤队随意超高挑顶或破底,煤质科应根据煤质管理办法对采煤队超高回采岩石给予重罚。
6.采煤队过断层时,如不以书面形式通知生产科储量管理人员,工作面挑顶或破底工程量将不予上报。
三、管理办法
1.生产科储量管理人员应对实际回采率进行测算、统计,及时准确填报报表。资源管理小组成员每月不低于三次到采煤队检查浮煤及底煤损失情况,及时通知储量管理人员及生产单位进行处理,储量管理人员并把处理结果以书面形式报告给办公室主任及领导小组组长、副组长。
2.煤炭资源回收率标准为:综采工作面回采率不低于98%,炮采工作面回采率不低于95%。采区回采率不低于80%。
3.各类煤柱的留设,必须按照有关规定执行,不得随意扩大煤柱。对工作面内落差2.5-10米的断层,两侧可留设5-10米的煤柱。对各类煤柱在安全、经济、合理的前提下,均应采取积极措施予以回收,顺槽煤柱大于20米的应予以回收,回采率不低于70%;采区上下山煤柱回采率不低于60%。要积极推行沿空送巷及对拉工作面采煤方法。资源管理小组领导及成员针对上述几条留设煤柱及回收规定要进行认真检查、监督,确保煤炭资源的彻底回收。
4.煤炭资源管理小组对合理开采矿井煤炭资源和保证全矿井各类回采率指标达到计划要求负直接责任;凡因地质测量工作失误而造成的不合理损失由地测部门负责;因设计不当造成的不合理损失由设计部门及审查批准者负责;在掘进过程中由于地质情况发生变化,按原设计继续施工将造成不合理损失时,该队技术员应及时报告技术主管。否则造成的不合理损失,由该队技术人员负责;在回采过程中,超过设计的顶、底煤和浮煤损失以及超设计规定的煤柱损失由回采队长及有关技术人员和造成损失的班组长负责。资源管理领导小组不定期召开煤炭资源分析会,分析丢失煤炭资源的形成原因并追查责任人,对责任人处罚根据丢失储量多少而定,最低罚款100元,最高罚款1500元。
5.一次性损失煤炭资源在5000吨以上时需提前5天上报公司审批,以办理手续为准。不经批准而丢弃不采的按不合理损失处理。不合理损失每丢失一吨煤罚有关生产单位5元和责任人0.5元。
6.储量管理人员要加强责任心,抱着对公司和矿负责的态度,严格按照《矿产资源法》和《生产矿井储量管理规程》的要求,认真搞好工作,实施对矿产资源的管理和监督,确保煤炭资源回收率达到上级及公司的规定要求。如储量管理有不按有关规定执行,监督不力,执法不严,或滥用权力,徇私舞弊行为的,每发现一次罚本人200元,三次以上者(包括三次)调离储量管理岗位。
7.如工作面遇到特殊的地质变化,或安全原因,需降低回采率时,须经资源管理领导小组审查批准并制定专项措施,方可改变回采率。
8.生产科要建立健全储量管理图纸和台帐,并按《生产矿井储量管理规程》的要求填绘与编报,做到内容齐全,数据准确。
9.公司和地矿部门,让报送的图纸和报表均按公司及地矿部门规定的时间内上报,不得延误。
10.储量管理人员定期或不定期随时深入井下检查,对不合理丢顶、底、浮煤,每发现一次按五次扣罚。每丢失一吨煤对采煤队罚款50元,罚跟班队长、班长、验收员每人5元。
11.对随意丢失顶、底煤及浮煤的采煤队,由生产科予以通报,并下达《预防丢煤通知书》,限期24小时整改,并对生产单位罚款1000元,队长、书记各罚200元。
12.煤质科、调度室应加大对采煤工作面的检查力度,对不按措施执行,随意破顶、破底的采煤队应给予重罚。以提高我矿的煤质。
13.采煤工作面必须把清扫浮煤,作为一道正式工序执行。要把浮煤作为工作面工程质量的一项主要验收项目,工作面两平方米内浮煤平均厚度不得超过30mm。
14.工作面停采前,生产科应及时下发工作面停采通知书,并及时在工作面标出停采线位置。工作面结束后,生产科储量管理人员,应及时测出停采线的实际位置并上图。
15.工作面回采率应每月考核一次,对工作面回采率每月都达到规定要求的采煤队,每季度对采煤队队长、书记各奖300元,副职(包括技术员)200元。完不成回采率指标的将按奖励标准扣罚。
16.每季度全矿各采煤队完成采区及工作面回采率标准的,对成绩显著的采煤队,奖励1500元,对资源管理领导小组正副组长每人奖励1000元,成员每人奖励500元。
14.煤炭资源回采率罚款应在财务建立专帐管理,有关奖励基金从罚款中支出。超出部分,由矿予以补贴。
15.本办法自下发之日起由生产科、经营科、调度室、煤质科、市场办监督执行。
第四篇:税费改革体系研究论文
税费体系这个概念,指的是应由哪些税和费(定性)、以什么样的比例(定量)来共同参与国民收入的分配。另外,税费改革体系也是指通过一种什么样的渠道或方式,来实现由旧的税费体系向新的税费体系的转换,从而使国民收入的分配达到公平和最优化。现时的研究,更多的注重税费体系的破与立,而忽略了税费改革体系的整体研究。
一、通过多边的税费改革建立对称的税费关系
税费并存是新一轮税费改革应该选择的合理格局。国外的许多研究表明,经过精心设计的收费往往比税收更少对经济产生扭曲,从而也更少效率损失,收费之所以有其存在的必要就在于,作为提供准公共产品的收入来源,收费较之于税收可以较好地解决拥挤性问题和效率低下问题,因此,西方国家将提供准公共产品作为确定收费范围标准的做法值得借鉴,片面地主张“以税代费”是一种形而上学的观点。
由此可以得出基本结论一:税费改革体系是多边的,既有“费改税”,又有费的保留和“税改费”;税费改革体系所建立的税费关系是对称的,税费归位,各行其道。
二、站在全盘角度确立税费改革目标
所谓全盘角度,即要从“国民收入分配”的角度来安排税费改革目标。在当前政府收入体系中,政府履行职能所需的资金显然只能通过规范化的税收渠道去获取。然而,种种因素的制约,给税收制度的正常运行带来了严峻挑战。政府部门多年习惯于以行政命令的办法、非税的方式组织收入,在各方面的政府支出猛增、规范化的税收渠道不畅的情况下,一个自然的反应,就是转而采用非规范性的办法,自立收费项目,介入财政性分配,“税的缺位”与“费的越位”在这种情况下应运而生。规范的国民收入分配体制是“税费归位,各行其道”的制度基础。“费的越位”根源于国民收入分配的制度短缺,反过来看,“税费归位”则取决于国民收入分配的制度供给。如果我们不从规范国民收入分配的角度进行制度的供给和创新,在制度严重短缺的情况下,就不可能实现“税费归位,各行其道”。
由此可以得出基本结论二:税费改革体系的目标是规范国民收入分配体制,而不应局限于“治乱减负”等功利性目标;只有从“国民收入分配”的角度来安排税费改革目标,才不至于顾此失彼,才能达到整体效益最大化。
三、在公共财政框架下构筑税费改革体系
“预算内”与“预算外”资金、“体制内”与“制度外”资金相交织,是中国转轨时期的特殊现象。按照市场经济的客观要求,政府收入体系应确立“三而二,二而一”归并的远景目标,即中期实现将制度外财力纳入预算内、外,相应将三块财力变为两块的目标;远期达到依托于市场经济体制而实现政府预算完整性,相应将“预算外资金”予以取消的目标。如此,国民收入分配机制相应规范,税费亦能达到“归位”。
在公共财政框架下,对于那些为提供纯公共产品的收费,应主要改为以税收方式提供;对于确实具有服务于准公共产品性质的收费,应该予以保留;对于为提供准公共产品而征的税,则应改为收费。
在公共财政框架下,税费分配格局需进一步优化,建立税费并存的政府收入机制,在收入规模上体现财权与事权相统一,在课征权限上建立以立法权为核心的适度税费管理权限体系。税制体系要进一步完善,通过新开一批、合并一批、废除一批,对现行税种进行优化组合。费制体系要进一步规范,按收费性质进行优化整合。
在计划经济向市场经济转型时期,公共财政的构建是渐进的,在公共财政框架下构筑的税费改革体系也必然是渐进的。
由此可以得出基本结论三:税费改革体系是置于公共财政框架下的,按照公共产品的程度来确定税费,并进行税费的优化组合,以渐进的方式达到国民收入分配机制的规范。
四、在互补和统一的原则下构筑税费改革体系
作为一个“体系”的税费改革,其内部各系统在内涵和外延上具有互补性和统一性。其一,税收改革与费收改革是互补、统一的。孤立的“费改税”、“税改费”未免会顾此失彼。上个世纪90年代以来,西方某些发达国家相继出现了“税改费”的倾向,国际税费改革中的“税改费”倾向与我国当前强调的“费改税”方向之间并不存在矛盾,两者的立足点仍然是“税费归位”这一本质。其二,“费改税”中的各项政策是互补、统一的。如农村税费改革和燃油税改革同属“费改税”范畴,如果置于互补和统一的原则下,就不会出现前者对农民“减负”、后者对农民“增负”的矛盾。其三,“税改费”(包括费的保留)中的各项改革是互补、统一的。现阶段改革中存在的费的保留、未来一定时期可能会出现的“税改费”,不仅应是规范的,各项改革之间还应是互补和统一的。
作为一个“体系”的税费改革,其在时间进程上具有延续性和递进性。改革开放以来,收费得到广泛的运用,成为政府建设资金的主要财力,收费将在较长历史时期存在是一个客观事实。在收费形式等国民收入形式第一次分配和第二次分配过程中,已经形成了各种利益格局。在转轨时期计划经济与市场经济体制碰撞的宏观背景下,我们不能不承认计划经济体制下所形成的利益格局,并需要通过税费改革的整体推进,把计划经济体制下所形成的利益格局合理地转换到市场
经济体制上来。
由此可以得出基本结论四:税费改革体系以普遍联系和历史唯物主义为构筑原则,在“体系”的内涵和外延上坚持互补和统一,在时间进程上坚持延续和递进。
第五篇:淘宝商品评价属性分类研究
淘宝商品评价属性分类研究
摘 要: 设计了一个基于API技术的淘宝商品评价分类系统。利用淘宝开放平台提供的API接口获取商品评价信息,然后将这些评价信息按照质量、物流以及服务态度等属性分别分出好评和差评,通过对典型操作实例的理论分析和实验结果,验证了该方法的有效性。
关键词: 淘宝API;评价属性;评价分类
淘宝开放平台是一个综合性、商业性的开放平台[1]。TOP发布的API涵盖了商品、产品、类目、用户、交易、评价和物流等不同专业领域的开放接口。使用这些预先定义好的函数,可以更加方便、快捷地调用这些接口来完成一些有关处理工作。
淘宝网作为国内最大的电商网站,每月每天甚至每小时的交易量都是相当大的,而作为买家在淘宝网上购买商品之后,无论对商品满意与否,都可以通过淘宝网提供的商品评价系统对所购买的商品作出自己的评价,这就产生了大量的评价信息。这些评价对今后购买同种商品的买家可以产生重要的指导作用;评价信息里反映出的买家对商品比较关注的一些问题也为卖家不断改进商品提供了方向。
但是目前淘宝评价系统只是单纯地将买家的评价罗列在产品信息页面上,这些评价包含了买家对该商品在做工、款式、服务态度、发货速度和物流速度等相关评价属性的信息反馈,这对想查看该商品某种评价属性信息的买家和卖家带来了很大的困难。有些商品评价信息较少,可以通过逐条查看的方法来获取需要的信息。但是对于有几千条甚至上万条评价信息的商品来说,逐条查看必定会耗费大量的精力,也无法取得较好的效果。同时,淘宝提供的好评、中评和差评都是由买家人工选择的。有时候买家对商品并不很满意,但是由于卖家服务态度较好等原因也给出了好评;而有些差评则是因为卖家服务态度不好或者物流送货不及时等原因,但是商品本身质量并没有问题,这就对信息获取造成了误差。针对上面的问题设计并实现的淘宝商品评价属性分类系统,利用淘宝开放平台提供的API技术获取相关评价信息,然后按质量、物流和服务这3项关注度最高的属性将评价信息进行分类,并对每种属性按评价内容情感倾向度分别判别出好评和差评。本系统实现了买家在淘宝网意向商品的大量评价中筛选出自己希望了解的关于商品某属性的评价信息,同时也帮助卖家了解在售商品各个属性的买家反馈信息,更好地改进商品。
相关工作
本系统通过评价API接口获取商品评价信息作为基本的数据来源。系统中的商品评价主要分为两类。(1)按照商品属性进行分类。商品的属性特征都是由它的特征词来表现的,主要是能够定义属性的名词或者名词短语。本系统将评价信息按照质量、服务、物流3个属性进行分类。(2)按照情感倾向度进行分类。本系统提取评价信息中的情感词并按照一定规则组成短语模型与事先建立好的短语模型情感倾向库进行匹配,开发了一种计算情感倾向度的算法,按照此算法将商品的每个属性都分为了好评和差评。
系统的具体设计
2.1 评价API获取评价内容
该模块主要是获取评价文本和文本转存两个功能。使用API要先创建一个ITopClient对象,向接口地址/router/rest发起连接请求,请求成功后,建立TraderatesGetRequest评价文本查询请求对象,设置请求的字段和参数,再建立TraderatesGetResponse对象接收返回的数据,把获得评价文本内容保存到文本文件。格式是Json字符串。
2.2 建立商品属性特征词库
商品特征词的抽取主要有分词标注和按规则抽取特征词两个步骤。
(1)要抽取特征词,必须要用分词工具先把句子分成词语,然后对词性进行标注,才能分析每个词语的意义。使用SHARPICTCLAS分词工具分词标注,例如:衣服/n很/d/a!/w很/d合身/a!/w店家/n服务/vn态度/n也/d很/d好/a,/w虽然/c中间/f出/v了/ul点/q小/a插曲/n,/w但是/c很/d快/a都/d给/v解决/v了/y。/w店家/n工作/vn相当/d给/p力/n。/w快递/vn也/d很/d给/p力/n!/w赞/vg一个/m!/w
(2)分词标注之后,还要过滤掉一些没有意义或者不是想要的词。首先就是根据词性过滤。例如店家/n服务/vn态度/n也/d很/d好/a,这个是标注完毕的句子,看到“服务态度”这个名词短语其实就是商品服务的一个特征,也可以简化成“态度”。前面提过,只有名词或名词短语才能表示商品的属性特征,所以可以把名词短语以外的非名词词语过滤掉,上面的例子过滤后就是“店家/n服务/vn态度/n”,其他词性就不要了。然后再根据手工收集的一些无意义词文件,过滤掉无意义词,最后去除词性标注,合并同类项,再利用Apriori算法中的频繁项定义,过滤掉噪音词,属性特征词库就建立了[2]。将需要分类的评价信息分词标注之后与属性特征词库进行匹配,实现按照商品评价属性分类。
2.3 基于构造短语模型的情感分类方法设计
文本中能表达情感倾向的词语组成的短语模型是判断文本情感倾向的基础,文本最终的情感倾向和短语模型所表达出的情感倾向是一致的。本文的情感分类方法包括两部分。(1)建立情感词词库和短语模型库,其中情感词词库就是抽取的有情感倾向的词,短语库是从训练文本中选取的比较有代表性的短语模型,计算它们的情感倾向值,组成一个短语模型的匹配库[3]。(2)进行情感分类,对一个新文本进行分析,得出其情感倾向。
2.3.1 建立情感词词库
一篇文本中有很多词语都能表达情感,需要知道哪几个词的情感倾向性最强。现在已经有了不少成熟的提取情感词的算法,由于本系统是针对淘宝网这个特定领域的评价信息,这些评价信息情感词的精确度比较高而且量也不太大,所以采用人工选取的方法从200篇好评样本和200篇差评样本中人为地选出情感词[4],并与中国知网情感词库共同组成情感词库。
2.3.2 建立短语模型
在分析文本时,仅仅依靠情感词的情感倾向性来判断文本的情感倾向性是不准确的,需要找出情感词对应的评价对象,把情感词和评价对象组成情感模型,然后把这些情感模型作为判断文本情感倾向的基本元素[5]。
首先找出样本中出现的情感模型,同时找出与之相关的连词、副词、否定词,然后把他们组合成短语模型,利用这些短语模型去分析情感倾向。基于短语模型的情感分类的方法目前有很多,本系统选用了如表1的短语模型[2,6]。
抽取的短语模型不是一般语法意义上的短语,而是从文本中选取能表达情感的词按照短语模型规则组合成的。
把从样本中选出的情感词以及相关的连词、副词、否定词和评价对象进行二次标注[3,7],约定:
(1)在好评情感词前面加注“@!”;
(2)在差评情感词前面加注“@?”;
(3)在连词、代词前面加注“@”;
(4)在评价对象前面标注“@*”;
(5)在否定词前面标注“@~”。
根据表1所示的短语模型,用以下选取短语模型的算法。
(1)寻找标注为“@*”的短语;
(2)如果没有找到标注为“@*”的短语,则跳到(6);
(3)如果找到标注为“@*”的短语,则寻找标注为“@!”、“@?”的短语;
(4)如果没有找到标注为“@!”、“@?”的短语,则跳到(6);
(5)取出标注为“@”的短语,加上(2)和(3)中找到的短语,把这些短语按原来的顺序组成一个短语模型;
(6)处理下一个训练语料,重新从(1)开始执行,循环。
2.3.3 计算短语模型情感倾向
通过上面介绍的方法,已经建好了短语模型,然而每个短语模型表达的情感倾向以及强度是不尽相同的。人工将倾向于好评的短语模型赋值1,倾向于差评的短语模型赋值-1的话,最后的分析结果误差明显比较大,无法得到比较好的效果。
本文采用的短语模型情感倾向值的计算方法为统计一个短语模型在好评情感短语模型中出现的次数(记为Gi)和在差评情感短语模型中出现的次数(记为Bi),然后计算Gi与Bi的比值,具体计算公式如式(1)所示:
V=log2(Gi/Bi)Gi≠0andBi≠0 log2((Gi+1)/Bi+1))Gi=0orBi=0(1)
由计算出来的表2和公式(1)可知:
(1)当0 (2)当Gi>Bi>0时,V>0,该短语模型表达的是好评的情感倾向; (3)当Gi=Bi时,V=0,无法确定该短语模型的情感倾向,需要根据实际情况进行判断; (4)当Gi=0,Bi≠0时,V<0,该短语模型表达的是差评的情感倾向; (5)当Gi≠0,Bi=0时,V>0,该短语模型表达的是好评的情感倾向。 2.3.4 计算评价文本情感倾向值 有了短语模型的情感倾向值,就可以分析评价文本的情感倾向了。评价文本都是由一个个句子组成,而句子可以分词标注后组成短语模型,所以评价文本的情感倾向值是由其分解出的短语模型情感倾向值加成得到的。具体公式如下: S=Vi(i≥0)(2) (1)如果S>0,判定这条评价文本为好评; (2)如果S<0,判定这条评价文本为差评; (3)如果S=0,判定这条评价文本为中评。 实验结果分析 通过淘宝评价API接口获取某女装的好评、差评各300条评价作为测试的数据来源如表3所示。 经过简单过滤,过滤掉一些无意义的评价,如“好!”,“good”,“„„”等无意义的评价,然后手工分别筛选出224条好评和224条差评,选取数目相等,是为了比较直观。将获取的评价数据导入系统中,首先进行分词标注: 0衣服/n很/d好/a!/w很/d合身/a!/w店家/n服务/vn态度/n也/d很/d好/a,/w 经过初步的分词标注,整个评价内容结构已经清晰,然后按照上文中的约定对评价内容进行二次标注。标注结果如下: 衣服/@*n很/d好/@!a。很/d合身/@!a。店家/@*n服务/@*vn态度/@*n也/d很/d好/@!a。 根据“二次标注”结果,抽取评价文本的每个句子的短语模型,与短语模型情感倾向库对比,匹配极性情感值,将每个短语模型的情感值相加,就是整个文本的情感值。同时还要对照分类特征词,如果评价文本中句子含有上述特征词的,就把这个文本划分到对应的分类,做上标记,同时,这个句子的情感倾向值也是这个文本在这个分类上的情感倾向表示。 表4所示是本项目在实践过程中的实验结果。 经过人工排除异类,尽可能保证测试文本类别正确的情况下,看到差评的查准率有83.9%,要比好评的查准率82.6%高,而且中评数量上的判断结果(28>17)也高。这是由于在淘宝上顾客表达厌恶和愤怒的情感要更明确一些,有些顾客有不满意的地方,但是可能还是给予好评,只是表达勉强,所以好的情感表达上就会模糊,相比之下,差评更容易判断。 通过表4可以看出,两类评价由情感倾向值累加得出的情感倾向值的方法的查准率都达到80%以上,说明采用情感倾向值累加的方法效果还不错,在抽取少量样本的情况下,能比较准确细致地判断文本的真实情感倾向。但是效果还不够好,如何选取准确的评价对象,抽取真正的短语模型,使方法结果逼近真实将是继续研究的方向。
/nx虽然/c中间/f出/v了/ul点/q小/a插曲/n,/w但是/c很/d快/a都/d给/v解决/v了/y。/w
/nx店家/n工作/vn相当/d给/p力/n。/w
/nx快递/vn也/d很/d给/p力/n!/w赞/vg一个/m!/w
/nx
/nx虽然/@c中间/f出/v了/ul点/q小/@?a插曲/@*n。但是/@c很/d快/@!a都/d给/v解决/v了/y。
/nx店家/@*n工作/@*vn相当/@!d给/p力/@*n。
/nx快递/@*vn也/d很/d给/p力/@*n。赞/vg一个/m。
/nx。