第一篇:运用金数据在线表单工具处理数据的心得体会
运用金数据在线表单工具处理数据的心得体会
1、自由搭配字段,像小时候玩积木一样简单
精心准备了十余种字段,用户可按照自己的需求自由搭配,几分钟就能建好一份精致的表单,剩下的就是等着数据滚滚而来了。
2、想让谁填,就让谁填
这份表单是公开给任何人、凭密码填写还是只有管理员自己能填,您可以随意控制。无论是分享到社交平台、还是嵌入自己的网页,在金数据,只需轻轻一点。
3、想用手机填表单?
在移动互联网时代,您一定希望用户在手机上就能填写问卷调查、下订单。金数据为表单定制了精致的手机浏览样式,缩减了填写时的流量损耗。考虑周到,只为能让您无忧无虑。
4、不喜欢单调的外观,没关系
金数据提供了几十种主题样式,肯定能找到最适合的那一款。让自己的表单以夺目的方式出现在填写者面前。
5、你辛苦收集的数据,就真的全是你的 在金数据,用户收集来的所有数据都可以自由地进行编辑、删除、筛选,想全部导出到Excel也只是点下按钮的事儿,最大化地方便您对数据进行后续处理。
6、想看报表?何必再圈、拖、选、调
想更直观地浏览下数据?不必再自己费神在Excel里折腾啦。金数据已经为这些数据自动生成了报表,您需要做的只是端杯茶过来,坐下来慢慢看。
7、不知怎么建表单?模板中心里,现成的
想做个订单收集系统、顾客满意度调查之类,但又不知道该怎么设计?到模板中心去逛逛吧,那里有精心准备的大量模板。
8、控制字段显示/隐藏,在这里你就是魔法师
你希望填写者做出特定选择后才出现某些字段?没问题!金数据提供了非常简单的“规则”编辑工具,所有规则一目了然。挥动你的魔棒吧,让字段活起来。
9、方便、好用,还免费噢
相较于大型报表和OA系统而言,金数据更为轻态和便于使用,支持用户自主设计表单,免费使用金数据的基础功能。利用金数据创建一份问卷或者报表,分享链接让别人填写,这样数据就会源源不断地流入到你的账户中去了!在移动互联网先行的时代,金数据表单能够和微信、微博结合,在手机上也能查看表单,帮助用户随时随地地填写、收集数据。
第二篇:数据分析工具
数据分析工具
概述 数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。
数据是事实,也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。
分析工具 excel作为常用的分析工具,可以实现基本的分析工作,在商业智能领域Cognos、Microstrategy、Brio、BO和Oracle以及国内产品如北京永洪科技的Yonghong Z-Suite BI套件,奥威智动的Power BI也比较常用。
自商业智能这一领域被开拓以来,国内外BI工具层出不穷。IBM cognos、SAP BO、oracle BIEE、Microsoft BI、MicroStrategy、思迈特 BI、奥威智动 Power-BI等都是传统的BI软件,而Qliktech QlikView、tableau、永洪科技 Yonghong Z-Suite等是下一代BI的代表。
传统BI工具基于数据驱动,以瀑布开发模式建设BI系统。传统BI工具需要预先形成CUBE,交付时间在半年左右,如果需求发生变化,相关模块调整周期按月计算。通常传统BI工具模块较多,操作复杂,无法形成自服务BI。
新一代BI软件区别于传统BI软件,基于业务驱动,无需预生成Cube,交付周期按周、月计算,能够形成自服务BI系统。对于需求变化,交付周期按天、周计算,相关模块调整不大。Yonghong Z-Suite、tableau、QlikView等新一代BI工具带有数据集市,可以处理海量数据。以Yonghong Z-Suite为例,其主要有以下特点:
驱动模式:业务驱动。
开发模式:以敏捷开发模式建设BI系统。
交付周期:交付周期偏短,项目失败率低;乐意在客户现场做POC(Proof of Concept)。需求变化:可以应对变化,新需求交付周期很短;相关模块调整不大,交付周期在一两天之内。
成本:一站式平台提供数据集市和BI软件,无需购买MPP数据仓库,费用低。自服务BI:能够形成自服务BI。
分析:展现只是起点,分析功能强大。
海量数据:X86通用平台,以Scale-out扩展模式处理海量数据。基于CPU收费,具有较高性价。
数据集市:Yonghong Z-Data Mart专业数据集市处理大数据。
第三篇:超市数据分析工具的实践运用
超市数据分析工具的实践运用
2015年04月27日
浏览数(32219)评论数(5)好评数(18)
绝大多数超市都购买使用了信息系统管理工具,但是作为系统供货商,毕竟是写软件的,不是搞管理,所提供的报表系统只能反映企业常规的经营指标,比如库存、周转率、销售额、毛利率。
纳尔森在长期的研究和实践中,发现这样的笼统的报表,尽管可以反映出企业经营效果,但是不能够进一步的分析这个结果的原因。比如企业的库存比较高,那一部分的库存高呢?库存高就是一定不合理吗?报表上看到企业利润低,那到底是那一部分经营行为影响了企业的利润呢?我们只有找到这些原因,才有可能去改变现状,提升管理水平。
经过长期实践,纳尔森形成了一套数据分析系统化工具,即通过多层次、多类别、交叉的数据抓取,结合纳尔森咨询师丰富的经验,找出企业经营管理中的实际存在的问题。
自2015年3月纳尔森推出专业数据分析以来,很多企业在纳尔森的数据分析中获得很大的收获,每天均有很多企业咨询,但是因为纳尔森人手有限,不能一一满足,为使更多企业掌握超市数据分析的思路和方法,今天尝试从一个案例,简单说明数据分析的思路和运用。
因为这个案例是完全是依靠企业报送来的数据所做的分析,我们没有做实地的考察,所以所得到的结论,完全依靠企业提供的数据。但是随后的企业访问中,企业老板认为我们的数据分析是令人信服的,而且帮助企业更清晰、准确地找出了问题和原因。
企业概况:
某四线市场连锁超市,拥有连锁超市6家,便利店25家。在当地属于最大的连锁超市,占据领先的市场地位。纳尔森根据企业目前的管理水平,制定了一些组合报表,(有一些报表,企业信息管理人员因为对系统的熟练程度,跑不出数据来)。最后我们得到报表有:
一、综合日报表
二、问题库存报表(仅A店04.13日数据采样)三、三大区销售占比表
四、大店BOTTOM50及TOP50单品明细表
五、问题库存报表
六、6、1~3月份小类销售报表(超市)
七、1~3月份小类销售报表(便利店)
一、报表反映基本情况如下: 201 x年1~3月销售与上年同期比 销售增长2.75%,毛利上升1.89% 来客数下降4.77% 客单价上升19.37% 库存周转天数增长2.32% 同期库存上升3.59% 如果仅从这个报表上的数字来看,企业销售、毛利、平均客单价都有所增长,尽管比较小。库存增长也在合理范围内。来客数下降,客单价增长,可以解释为企业高价值客户的增长和优化。
我们分析如下:
1、销售相比上年略微上升2.75%,但是考虑到一季度(居民消费价格指数)CPI同比上升了3.8%,以及可能存在的新开店因素,所以销售实际上是下降的。
2、来客数下降了4.77%,也应证了销售下降的实际情况。
3、与来客数下降相反的是,客单价上升了,原因可能有两个: 一是因为竞争对手的影响,导致低端客户的流失引起的。因为低端客户流失,来客数下降,从而显得客单价格在上升。警惕顾客的流失,长期下去将造成重大的损害。二是因为物价上涨引起的。(后经询问,确实有竞争对手新开店大规模低价促销)
4、在销售同比实际下降的情况下,库存却上升了3.59%。这里面不排除有物价上涨因素,但可能有实际库存的上升。
5、相比库存额上升,库存天数的上升更能说明实际库存存在的问题。
6、从销售额绝对值看似乎还是不错,但是和1~3月销售在全年销售占比中不到20%,还是偏低了,因为该年春节较晚,这一占比应该达到30%以上。以此销售额预计全年增长,很不乐观。
二、销售TOP50商品(50个畅销商品)分析
TOP报表是我们经常使用的一种分析工具,主要是为了找出销售、毛利、周转等表现最好的商品,并且进一步分析的原因是什么,举一反三加以推广。
但是如果更进一步呢?我们还要从这张报表里面找出问题所在。既要看到优点,更要看出问题。
我们分析如下:
根据对于便利店TOP50商品销售的分析,最畅销商品中香烟+液态奶就占了TOP50商品的68%。而在超市中,这两项合计居然也占据48%。与香烟液态奶销售占比极高对应的是,食用油、米面、酒水所占比例较低;生鲜商品中,不论在大店还是便利店,除了鸡蛋,别的都没有进入销售前50名。
说明:
1、该企业与当地烟草部门具有良好的合作关系,烟草供应充足;
2、门店销售严重依赖个别品类商品和供货商;,采购能力低下;
3、销售以自然销售为主,缺乏有目的、分品类的营销行为,企业营销水平低;
4、生鲜经营水平很低,原有的对手可能比较弱,但是未来市场竞争力堪忧。为了进一步说明存在的问题,我们将这家企业的便利店TOP数据与纳尔森所改造管理的生鲜加强型便利店数据做了对比:
对比表明,该生鲜加强型便利店在烟酒、奶制品、粮油、生鲜食品四大类销售分布更为均衡。且销售为该客户便利店销售额的4~5倍。
同时我们看到大店的生鲜部门带来的客流占店比只有19.76%,再一次说明即使是超市的生鲜经营效果也是很差的。
风险提示:
因为不论在超市还是便利店里,烟草和液态奶的销售占比很高,另外在小类销售报表里,我们发现连续三个月烟草销售都排第一,一旦被竞争对手抓住香烟和液态奶这两大项,主推或者大力度促销,会极大的打击到这家连锁店的销售商誉。(这就是我们所说的单店寻找对抗连锁店的方法之一)
三、分区销售报表中非食品和生鲜食品占比 非食品销售占比19.77%,毛利占比26.16%。生鲜品销售占比13.2%,毛利占比15.82% 从数据看,尽管非食品占比19.77%不算低了,但是因为毛利占比能达到26.16%,说明非食品销售还有一定提升空间。
生鲜销售占比较低,与TOP报表成对应关系,准确的反映了生鲜经营的弱项,而毛利占比高,可能包括两方面的原因,一是生鲜食品价格过高抑制了销售,二是联营扣点计入其中。
四、问题库存
大部分超市管理人员都会认为负库存、0库存是绝对的问题库存,是不应该存在的。但是往往忽视那些库存量为1、2、3个的商品,在实际上是很难销售的,而且随时可能转化为0库存,所以也视为断货。否则每天就会有大量的1、2、3库存转化为零库存。
所以我们把负库存、0库存和1、2、3库存统称为问题库存。我们对其中一个超市门店的问题库存进行了统计:
这家店铺的营业面积在5000平方米左右,一般这么大的面积的超市,我们的单品数大约有8000~15000种,但是这家店的问题库存就达到了4595个。如果按照12000个单品计算,缺断货率就是38.29%,很难想象这样的一家卖场会有好的销售水平。
这个数据给我们的第一感觉就是,这家店的库存问题长期没有得到过重视。而根据门店问题是来自总部的这个原则,我们认为总部长期不重视库存管理的。
据此分析如下:
1.0库存达到2920个,在系统中没有得到及时解决,首先会影响信息系统的工作效率,降低系统运行速度,增加管理难度;2.仅一个店0、1、2、3库存合计达到4588个,说明除了空编号问题外,断货是普遍性的;3.从历史的经验看,断货商品往往是畅销品,那么这么大的断货量将极大的打击销售;4.不排除自采商品引起的空编号问题,如果有,说明自采商品行为缺乏连贯性,随意性较大;5.如果很久没有销售的商品,且处于0库存状态,还大量存在于系统之中,说明采购部门长期没有做应有的商品信息维护,而信息部门也缺乏监督;6.空编号的大量存在也提供了潜在的串卖和人为调整毛利的风险。
7.1、2、3商品达到1668个,随时可能转化为零库存,造成实际上的断货。不管理好1、2、3库存,就管理不好0库存,就管理不好断货问题。
最终得出的结论;
因为对方信息部能力有限,很多报表都跑不出来,要一个一个问系统提供商,无法按时提供。所以,我们只能基于这些有限的数据分析,但是也能够说明主要存在的问题。
1.整个连锁系统的销售处于停滞或略微倒退的状态,预计全年增长困难。2.顾客已经开始出现明显流失。
3.店铺销售仍然以自然销售为主,营销工作缺乏明确的目标和手段。
4.商品结构不合理,过分依赖于某些品类的销售,存在有较大的潜在商品结构和竞争风险。
5.生鲜经营水平较低,长此以往,必将严重制约整个连锁企业的经营水平和市场竞争力。
6.门店日常商品库存管理不到位,商品再订货及补货作业不及时。缺断货较为普遍,已经严重影响销售。7.企业内可能存在大量的,较为随意的自采行为。
8.采购部对于商品信息及数据库长期缺乏管理,财务及信息部门监管缺位。9.总部信息部掌握运用信息系统能力有问题,很多数据、报表跑不出来,要临时向系统提供商询问才会做。
10.门店出现的问题,反映出总部运营部对于门店工作指导能力不够强。
综上所述,该连锁企业整体经营管理水平处于较低水平,且存在较大的管理和经营隐患,在缺乏竞争的市场上尚可存活,一旦有更强的竞争者出现,比如较大区域性、全国性连锁超市进驻,或者其他管理水平较高的超市竞争,势必面临巨大困难和严峻的挑战。
我们给出的建议:
1.努力提升采购、营运、营销、信息部门人员的基本工作能力,加强业务培训和学习。2.招聘培养生鲜管理经营人才,提高生鲜经营水平。
3.立即对问题库存分门别类进行清理,该关闭编号要关闭,该进货的进货。
4.对于企业商品引进流程、再订货流程、门店商品管理流程等相关流程要重新编写、培训,执行。
5.将商品、门店日常管理和流程执行列入绩效考核,分项细化,挂钩个人收入、评级。6.财务部要制定相关流程,严格自采行为和自采资金管理。7.加强对于信息系统的监控,对于非正常数据变动及时研究处理。
8.联系信息系统供货商,提出更为细致的要求,并且请系统供货商培训信息部人员。9.采用针对性的营销措施提升弱势品类业绩,以营销活动带动采购、营运部门对于弱势品类的关注。要特别一提的是,在实践在工作中,我们经常遇到一些企业领导认为原有的信息系统不好用了,要求更换系统,向我们打听哪种信息系统更为合适。而我们则常常发现,其现有系统大部分的功能都是闲置的。
说实话,除了沃尔玛、麦德龙这样的大企业自行开发、定制信息管理系统之外,国内主流的商业管理信息系统实际上都差不多。那些数据本来就存在于系统之中,只是系统公司和企业不知道如何灵活抽取、排列、组合这些数字,使之成为有用的信息,并且分析其中的含义,来准确的反映管理经营中的问题。
更多精彩文章,欢迎光临纳尔森指导 www.xiexiebang.com
第四篇:数据分析软件和工具
以下是我在近三年做各类计量和统计分析过程中感受最深的东西,或能对大家有所帮助。当然,它不是ABC的教程,也不是细致的数据分析方法介绍,它只 是“总结”和“体会”。由于我所学所做均甚杂,我也不是学统计、数学出身的,故本文没有主线,只有碎片,且文中内容仅为个人观点,许多论断没有数学证明,望统计、计量大牛轻拍。
于我个人而言,所用的数据分析软件包括EXCEL、SPSS、STATA、EVIEWS。在分析前期可以使用EXCEL进行数据清洗、数据结构调 整、复杂的新变量计算(包括逻辑计算);在后期呈现美观的图表时,它的制图制表功能更是无可取代的利器;但需要说明的是,EXCEL毕竟只是办公软件,它 的作用大多局限在对数据本身进行的操作,而非复杂的统计和计量分析,而且,当样本量达到“万”以上级别时,EXCEL的运行速度有时会让人抓狂。
SPSS是擅长于处理截面数据的傻瓜统计软件。首先,它是专业的统计软件,对“万”甚至“十万”样本量级别的数据集都能应付自如;其次,它是统计软 件而非专业的计量软件,因此它的强项在于数据清洗、描述统计、假设检验(T、F、卡方、方差齐性、正态性、信效度等检验)、多元统计分析(因子、聚类、判 别、偏相关等)和一些常用的计量分析(初、中级计量教科书里提到的计量分析基本都能实现),对于复杂的、前沿的计量分析无能为力;第三,SPSS主要用于 分析截面数据,在时序和面板数据处理方面功能了了;最后,SPSS兼容菜单化和编程化操作,是名副其实的傻瓜软件。
STATA与EVIEWS都是我偏好的计量软件。前者完全编程化操作,后者兼容菜单化和编程化操作;虽然两款软件都能做简单的描述统计,但是较之 SPSS差了许多;STATA与EVIEWS都是计量软件,高级的计量分析能够在这两个软件里得到实现;STATA的扩展性较好,我们可以上网找自己需要 的命令文件(.ado文件),不断扩展其应用,但EVIEWS就只能等着软件升级了;另外,对于时序数据的处理,EVIEWS较强。
综上,各款软件有自己的强项和弱项,用什么软件取决于数据本身的属性及分析方法。EXCEL适用于处理小样本数据,SPSS、STATA、EVIEWS可以处理较大的样本;EXCEL、SPSS适合做数据清洗、新变量计算等分析前准备性工作,而STATA、EVIEWS在这方面 较差;制图制表用EXCEL;对截面数据进行统计分析用SPSS,简单的计量分析SPSS、STATA、EVIEWS可以实现,高级的计量分析用 STATA、EVIEWS,时序分析用EVIEWS。关于因果性
做统计或计量,我认为最难也最头疼的就是进行因果性判断。假如你有A、B两个变量的数据,你怎么知道哪个变量是因(自变量),哪个变量是果(因变量)?
早期,人们通过观察原因和结果之间的表面联系进行因果推论,比如恒常会合、时间顺序。但是,人们渐渐认识到多次的共同出现和共同缺失可能是因果关 系,也可能是由共同的原因或其他因素造成的。从归纳法的角度来说,如果在有A的情形下出现B,没有A的情形下就没有B,那么A很可能是B的原因,但也可能 是其他未能预料到的因素在起作用,所以,在进行因果判断时应对大量的事例进行比较,以便提高判断的可靠性。
有两种解决因果问题的方案:统计的解决方案和科学的解决方案。统计的解决方案主要指运用统计和计量回归的方法对微观数据进行分析,比较受干预样本与 未接受干预样本在效果指标(因变量)上的差异。需要强调的是,利用截面数据进行统计分析,不论是进行均值比较、频数分析,还是方差分析、相关分析,其结果 只是干预与影响效果之间因果关系成立的必要条件而非充分条件。类似的,利用截面数据进行计量回归,所能得到的最多也只是变量间的数量关系;计量模型中哪个 变量为因变量哪个变量为自变量,完全出于分析者根据其他考虑进行的预设,与计量分析结果没有关系。总之,回归并不意味着因果关系的成立,因果关系的判定或 推断必须依据经过实践检验的相关理论。虽然利用截面数据进行因果判断显得勉强,但如果研究者掌握了时间序列数据,因果判断仍有可为,其中最经典的方法就是 进行“格兰杰因果关系检验”。但格兰杰因果关系检验的结论也只是统计意义上的因果性,而不一定是真正的因果关系,况且格兰杰因果关系检验对数据的要求较高(多期时序数据),因此该方法对截面数据无能为力。综上所述,统计、计量分析的结果可以作为真正的因果关系的一种支持,但不能作为肯定或否定因果关系的最 终根据。科学的解决方案主要指实验法,包括随机分组实验和准实验。以实验的方法对干预的效果进行评估,可以对除干预外的其他影响因素加以控制,从而将干预实施后的效果归因为干预本身,这就解决了因果性的确认问题。关于实验
在随机实验中,样本被随机分成两组,一组经历处理条件(进入干预组),另一组接受控制条件(进入对照组),然后比较两组样本的效果指标均值是否有差 异。随机分组使得两组样本“同质”,即“分组”、“干预”与样本的所有自身属性相互独立,从而可以通过干预结束时两个群体在效果指标上的差异来考察实验处 理的净效应。随机实验设计方法能够在最大程度上保证干预组与对照组的相似性,得出的研究结论更具可靠性,更具说服力。但是这种方法也是备受争议的,一是因 为它实施难度较大、成本较高;二是因为在干预的影响评估中,接受干预与否通常并不是随机发生的;第三,在社会科学研究领域,完全随机分配实验对象的做法会 涉及到研究伦理和道德问题。鉴于上述原因,利用非随机数据进行的准实验设计是一个可供选择的替代方法。准实验与随机实验区分的标准是前者没有随机分配样本。
通过准实验对干预的影响效果进行评估,由于样本接受干预与否并不是随机发生的,而是人为选择的,因此对于非随机数据,不能简单的认为效果指标的差异 来源于干预。在剔除干预因素后,干预组和对照组的本身还可能存在着一些影响效果指标的因素,这些因素对效果指标的作用有可能同干预对效果指标的作用相混淆。为了解决这个问题,可以运用统计或计量的方法对除干预因素外的其他可能的影响因素进行控制,或运用匹配的方法调整样本属性的不平衡性——在对照组中寻 找一个除了干预因素不同之外,其他因素与干预组样本相同的对照样本与之配对——这可以保证这些影响因素和分组安排独立。
随机实验需要至少两期的面板数据,并且要求样本在干预组和对照组随机分布,分析方法就是DID(倍差法,或曰双重差分法);准实验分析用截面数据就 能做,不要求样本在干预组和对照组随机分布,分析方法包括DID(需两期的面板数据)、PSM(倾向性得分匹配法,需一期的截面数据)和PSM-DID(需两期的面板数据)。从准确度角度来说,随机实验的准确度高于准实验和非实验分析。
关于分析工具的选择
如果根据理论或逻辑已经预设了变量间的因果关系,那么就无需使用实验方法。我对非实验数据分析工具的选择原则如下。
因变量为连续变量,自变量至少有一个连续变量,进行多元线性回归; 因变量为连续变量,自变量全部为分类变量,进行方差分析;
因变量为分类变量,自变量至少有一个连续变量,使用Logit模型或Probit模型; 因变量为分类变量,自变量全部为分类变量,进行交叉表分析和卡方检验;
因变量在某个闭区间内分布,并且有较多样本落在闭区间的边界上,使用Tobit模型;
因变量不唯一,如多产出问题,进行数据包络分析(DEA);
因变量为整数、数值小、取零个数较多,使用计数(Count)模型; 数据具有层次结构(嵌套结构),使用多层线性模型(HLM)。
随着统计和计量经济学的发展,各种前沿分析工具层出不穷,但我认为最靠谱的分析工具不外乎以下四种:DID(针对随机实验),多元线性回归,固定效 应变截距模型(FE,针对面板数据),Logit模型或Probit模型(针对分类因变量数据)。其他方法或适用条件苛刻,或分析过程折腾,或方法本身不 可靠(尤其是聚类分析、判别分析,超级不靠谱),因此能用以上四种方法分析问题时,不必为“炫方法”而瞎折腾。关于拟合优度、变量选择原则及估计值绝对大小的意义
在人人的“数据分析”小站中,某同学提出这样一个问题:“多元回归分析中,怎么选择自变量和因变量,可以使R方达到80%以上?”
很显然,问这个问题的同学要么没学好计量,要么就是犯了功利主义的错误,或者二者皆有。拟合优度的大小很大程度上取决于数据本身的性质。如果数据是 时序数据,只要拿有点相关关系的变量进行回归就能使拟合优度达到80%以上,但这样的高R方根本说明不了什么,很可能使分析者陷入伪回归的陷阱,严谨的做 法当然是做平稳性检验和协整检验;如果是截面数据,根本没必要追求R方到80%的程度,一般来说,有个20%、30%就非常大了。
如果一定要增大R方,那么最应该做的的确是对纳入模型的变量进行选择。选择纳入模型的原则我认为有三条。第一,从理论和逻辑出发,将可能影响因变量 的变量作为自变量纳入模型,即理论上或逻辑上能影响因变量的自变量必须纳入模型,即使该自变量的回归系数不显著。第二,奥姆剃刀原则——如无必要,勿增实体,即理论上或逻辑上不能影响因变量的自变量不能纳入模型,即使该自变量的回归系数显著。第三,防止纳入具有多重共线性的自变量。
前面说了,对截面数据进行计量分析,R方能达到20%、30%是非常了不起的事情。但是,如果拟合优度(或类似拟合优度的指标)在20%、30%或 更低时,回归系数只具有定性或定序上的意义,强调其绝对数值的大小没什么意义。譬如lnY=alnA+blnB+„+zlnZ+c回归的R方为20%,a 为0.375,b为0.224,且二者的T检验显著,那么我们可以说,A、B对Y有影响,也可以说一百分点的A变化对Y的影响大于一百分点的B变化对Y的影响(控制其他因素的情况下),但说一百分点的A变化对Y的影响较一百分点的B变化对Y的影响大0.151%,就没什么意义了。
第五篇:如何运用IDEA工具开展商业银行审计数据分析
如何运用IDEA工具开展商业银行审计数据分析
IDEA(Interactive Data Extraction and Analysis),即互动式数据提取及分析,它最大的特点是审计人员可以根据自己的思路,不通过编程就可以创造个性化的数据分析路径。通过视窗化界面,审计人员可以很方便地从所得到的数据文件中进行数据的读取、显示、分析、操作、采样或提取数据。因此产品功能比较切合审计人员对数据分析的需要,被广泛应用于内部审计领域。
一、推广使用IDEA数据分析工具,是搞好内部控制审计的客观需要
(一)使用IDEA数据分析工具可以全面审计前台业务政策制度风险
使用IDEA数据分析工具,可以通过大集中管理系统,对被审计对象基层营业网点执行总行及监管当局政策法规的情况进行非现场审计检查。IDEA数据分析工具的应用为开展验资业务管理、账户管理和反洗钱管理等高风险业务的专项审计提供了便利,克服了原来政策、法规、制度等合规审计检查只能到现场才能进行的局限性,可以有效地提高审计的覆盖面和审计效能。
(二)使用IDEA数据分析工具可以全面审计和过滤大额资金支付风险
使用IDEA数据分析工具,为非现场资金支付风险分析、检查创造了条件。商业银行内控审计人员可以通过IDEA数据分析工具和IFSS综合文件系统的各种报表数据,对客户大额资金支付风险进行非现场跟踪检查,分析客户大额支付情况及资金走向,判断被审计对象的客户资金支付是否存在风险隐患。
(三)使用IDEA数据分析工具可以全面审计贷款资金使用风险
贷款资金能否按规定用途使用,直接关系到客户归还贷款的第一资金来源能否实现,关系到贷款的安全。IDEA数据分析工具的使用,为审计贷款资金使用提供了条件。商业银行内部审计人员可以通过IDEA数据分析工具和大集中系统管理工具,检查贷款是否按规定用途使用,尤其是可以检查贷款资金是否违规流入股市、房市及期货市场,是否作为资本金用于注册,是否通过关联交易挪作他用等。
(四)使用IDEA数据分析工具可以全面审计前台业务操作风险
前台会计核算操作流程长、环节多、风险大,是商业银行内控管理的重点。基层营业机构点多、线长、面广,是经济案件的高发区,也是商业银行内部审计监督的重中之重。推广使用IDEA数据分析工具,为全面审计前台业务核算操作风险提供了极大便利。商业银行内控审计人员可以通过大集中管理系统信息,对前台操作风险进行全面的过滤、分析和检查,尤其是通过后台系统对账务核算、交易、验印和授权等高风险控制环节进行全面的审计检查。这样不但可以有效地扩大审计覆盖面,提高审计的效能,而且可以规避审计责任风险。
(五)使用IDEA数据分析工具可以全面持续跟踪审计整改情况
屡查屡犯是商业银行内控管理和审计监督中普遍存在的顽疾。IDEA数据分析工具的使用,为全面持续跟踪审计整改创造了条件。审计人员可以通过IDEA数据分析工具和其他各种管理系统工具,对审计发现问题的整改情况进行跟踪检查,既可以有效提高审计跟踪的力度,又可以降低审计监督的成本。
二、建立健全IDEA数据分析工具应用流程和管理机制,是IDEA技术工具推广应用的重要途径
(一)建立IDEA数据分析需求论证制度,把好需求质量关,是搞好数据分析的重要基础
1.培养IDEA数据分析技术骨干,全员普及IDEA数据分析基础知识。IDEA数据分析工具是专业性很强的计算机管理软件系统。要有效使用IDEA数据分析工具,必须要有专门的计算机技术人才,并且要组织全体审计人员开展专题培训,普及IDEA数据分析工具基础知识。
2.结合产品审计主审制度,全面准确提出IDEA数据分析需求。产品审计主审要把IDEA数据分析需求的提取与实施产品审计主审制度结合起来,按照产品审计主审项目的分工,每个产品审计主审应根据现场审计项目安排,对自己主审的产品提出数据分析需求。这样,既能很快普及IDEA数据分析需求提取的方法、技巧,推动工作,又能不断提高IDEA数据分析需求的质量,促进产品审计主审制度的实施和IDEA数据分析工具的应用。
3.建立IDEA数据分析需求论证制度。为了保证IDEA数据分析需求的质量,进而保证数据提取及分析的质量效果,商业银行内部应建立IDEA数据分析技术骨干和现场审计主审联合会审、论证数据分析需求的制度,并进一步组织IDEA数据分析技术骨干和现场审计主审,对产品审计主审提出的IDEA数据分析需求进行会审论证。
(二)建立疑点问题分析论证和管理制度,准确甄别疑点问题,是提高IDEA数据分析质量的关键
1.全面、系统和深入分析数据,查找问题疑点。通过数据分析,查找疑点问题,是审计分析的重点和关键环节。在数据分析中,审计人员要重点从三个方面开展工作,一是按产品开展IDEA数据分析;二是按项目开展IDEA数据分析;三是建立现场IDEA数据分析制度。
2.建立疑点问题分析论证制度。通过对IDEA数据分析产生的大量疑点信息进行分析论证,筛选过滤,确认疑点信息,有利于不断提高疑点问题的准确性,有利于整合审计资源,提高审计效能,扩大审计成果,增加审计价值。
3.建立疑点问题管理制度。建立疑点问题管理制度,落实疑点问题管理,是有效运用IDEA数据分析工具,搞好审计效能的重要措施。
4.严格执行保密制度,保证数据信息安全。推广使用IDEA数据分析工具,是提高审计效能的有效手段,但生产数据在审计中使用存在审计信息安全风险。所以,从数据获取到管理、分发、使用和销毁的全过程,都要严格执行审计数据管理规定。
(三)以IDEA数据分分析工具为基础,整合审计资源,综合运用大集中系统管理工具开展审计,是不断提高审计效能的重要途径
IDEA数据分析工具,是建立在银行数据大集中下的审计信息分析系统,具有业务信息量大、数据处理手段先进和审计分析功能齐全等特点,但是,大集中系统业务运行的新变化和业务创新的不断发展,对审计工作提出了新的更高要求。商业银行的审计人员要在充分运用IDEA数据分析工具的基础上,积极适应业务发展、创新的变化,大胆探索使用数据大集中系统管理工具和基层分支行监控录像等技术手段开展审计分析、审计检查,实现审计手段科技化、信息化、专业化,进而实现审计价值最大化。
三、建立IDEA数据分析后评价反馈机制,不断提高审计人员IDEA数据分析能力
(一)通过现场审计班后分析会反馈审计疑点问题检查结果,指导现场审计分析和审计检查
相关审计人员要坚持召开现场审计班后分析会,并通过现场审计班后分析会,交流沟通审计检查信息。审计人员特别应通过对审计分析所发现疑点问题的核查情况进行交流分析,结合现场审计发现的疑点线索,探索在审计现场使用IDEA数据分析工具进行审计分析和审查检查的思路、方法,以推动现场审计工作,真正把每个疑点问题都查深查透,充分识别和揭示风险,或者确认审计事实排除问题疑点,不断提高IDEA数据分析工具在现场审计中的应用水平与成效。
(二)通过审计项目实施质量讲评分析会,评价IDEA数据分析的质量效果和存在问题
对通过现场审计核查确认的审计事实疑点问题,审计人员应总结、交流审计分析的经验、体会,并研讨通过IDEA数据分析,成功查找疑点问题的因果分析依据、综合判断方法和数据分析体会;对通过现场审计核查排除疑点的问题,审计人员应总结研究当时的IDEA数据分析,判断疑点问题的主客观依据,查找形成分析偏差的因果联系,提出纠错参考意见,指导今后IDEA数据分析工作。
(三)通过持续不断的IDEA数据分析工具应用研讨,提高审计队伍的IDEA数据分析能力和技术水平
为了更好地实现IDEA数据分析从审计骨干向全体审计人员的普及,商业银行应组织学习现场审计项目成功案例,开展IDEA数据分析技术培训和IDEA数据分析工具在审计中应用经验的交流;通过现场审计案例分析,详细介绍、交流运用IDEA数据分析工具进行审计分析、审计检查的做法、经验和体会;组织审计人员就运用IDEA技术工具开展审计分析检查的方法、流程和重点等进行深入的研讨;不断提高审计人员运用IDEA技术工具开展审计分析检查的能力和水平,提高审计监督的质量效果。^