第一篇:英语论文翻译
Reliability Survey of Military Acquisition Systems Jonathan L.Bell, Ph.D., Institute for Defense Analyses Matthew R.Avery, Ph.D., Institute for Defense Analyses Michael C.Wells, Institute for Defense Analyses
Key Words: Survey, Department of Defense, Military, Reliability
SUMMARY & CONCLUSIONS
Improving the reliability of military systems within the Department of Defense(DoD)is a key priority.Test results from the last few decades indicate that the DoD has not yet realized significant statistical improvements in the reliability of many systems.However, there is evidence that those systems that implemented a comprehensive reliability growth program are more likely to meet their development goals.Reliable systems cost less overall, are more likely to be available when called upon, and enable a longer system lifespan.Reliability is more effectively and efficiently designed‑in early(design for reliability)vice being tested‑in late.While more upfront effort is required to build reliable systems, the future savings potential is too great to ignore.At the request of the Director, Operational Test and Evaluation(DOT&E), the Institute for Defense Analyses(IDA)has conducted annual reliability surveys of DoD programs under DOT&E oversight since 2009 to provide a continuing understanding of the extent to which military programs are implementing reliability-focused DoD policy guidance and assess whether the implementation of this guidance is leading to improved reliability.This paper provides an assessment of the survey results.Overall survey results support the understanding that systems with a comprehensive reliability growth program are more likely to meet reliability goals in testing.In particular,the results show the importance of establishing and meeting Reliability, Availability, and Maintainability(RAM)entrance criteria before proceeding to operational testing(OT).While many programs did not establish or meet RAM entrance criteria, those that did were far more likely to demonstrate reliability at or above the required value during OT.Examples of effective RAM entrance criteria include(1)demonstrating in the last developmental test event prior to the OT a reliability point estimate that is consistent with the reliability growth curve, and(2)for automated information systems and software-intensive sensor and weapons systems, ensuring that there are no open Category 1 or 2 deficiency reports prior to OT.There is also evidence that having intermediate goals linked to the reliability growth curve improves the chance of meeting RAM entrance criteria.The survey results also indicate that programs are increasingly incorporating reliability-focused policy guidance,but despite these policy implementation improvements, many programs still fail to reach reliability goals.In other words, the policies have not yet proven effective at improving reliability trends.The reasons programs fail to reach reliability goals include inadequate requirements, unrealistic assumptions, lack of a design for reliability effort, and failure to employ a comprehensive reliability growth process.Although the DoD is in a period of new policy that emphasizes good reliability growth principles, without a consistent implementation of those principles, the reliability trend will likely remain flat.In the future, programs need to do a better job incorporating a robust design and reliability growth program from the beginning that includes the design for reliability tenets described in the ANSI/GEIA-STD-0009, “Reliability Program Standard for Systems Design, Development, and Manufacturing.” Programs that follow this practice are more likely to be reliable.There should be a greater emphasis on ensuring that reliability requirements are achievable, and reliability expectations during each phase of development are supported by realistic assumptions that are linked with systems engineering activities.Programs should also establish RAM entrance criteria and ensure these criteria are met prior to proceeding to the next test phase.A program’s reliability growth curves should be constructed with a series of intermediate goals, with time allowed in the program schedule for test-fix-test activities to support achieving those goals.Finally, when sufficient evidence exists to determine that a program’s demonstrated reliability is significantly below the growth curve, that program should develop a path forward to address shortfalls and brief their corrective action plan to the acquisition executive.INTRODUCTION
DOT&E is the principal staff assistant and senior advisor to the Secretary of Defense on operational test and evaluation(OT&E)in the DoD.DOT&E oversees major DoD acquisition programs to ensure OT&E is adequate to confirm operational effectiveness and suitability of the defense system in combat use [1].Data from DOT&E reports to congress suggest that despite establishment over the years of policies intended to encourage development of more reliable systems, DoD system reliability has not improved.From 1997 to 2013, only 56 percent of the systems that underwent an OT met or exceeded their reliability threshold requirements [2].Further analysis suggests there has been no improvement in the fraction of programs meeting their reliability requirements over time.To better understand these trends, DOT&E requested IDA to conduct a survey of military programs in each of the past five years to determine the extent to which reliability-focused policy guidance is being implemented and to assess whether it is leading to improved reliability.IDA developed a survey and distributed it to research staff members that are subject matter experts on the programs of interest.Survey topics included questions on the program’s reliability growth plan,plans for tracking reliability during development, whether the program has a process of calculating the reliability growth potential, and questions on reliability performance in OT.Select survey questions are listed in Table 1.For most questions, respondents were required to answer “yes,” “no”, or“unknown.”
Respondents were also provided with opportunities to enter comments for each question.The most recent survey was conducted in 2013 and focused on programs that submitted a Test and Evaluation Master Plan(TEMP)to DOT&E or had an OT in FY 2012.The TEMP is the overarching document that describes the program’s test plan [3].1.1 Survey Analysis Approach
Analysis of each survey question considered how the responses varied by time by comparing responses in the most recent survey to the earlier surveys by TEMP date.Duplicate survey entries between surveys were removed.The analysis also considered differences by lead service including the Army, Navy, and Air Force(Marine Corps responses were grouped with the Navy), and by acquisition phase.The analysis binned the responses using the following TEMP date categories to maintain consistency with the methodology used in previous survey analyses: •
Dated before July 2008, prior to approval of a key DoD reliability policy(75 responses)•
Dated between June 2008 and October 2010(81 responses)•
Dated in FY 2011(57 responses)•
Dated in FY 2012 or FY2013 13(52 responses).Where appropriate, contingency tables were used to record and analyze the relationship between two or more categorical variables.This allowed the determination of whether the observed results were statistically significant.1.2 Population of Survey Responses
IDA analysts completed 97 responses in the most recent reliability survey conducted in 2013.Of the 97 responses, 52 were for programs that had an FY 2012 or 2013 TEMP, 66 were for programs that had an FY 2012 OT, and 7 were for programs that did not have an FY 2012 or 2013 TEMP or OT.Of the 66 programs with an FY 2012 OT, 28 also had an FY 2012 or 2013 TEMP.Table 2 shows the breakdown of responses by acquisition phase, lead Service, and test type.Approximately 63 percent of systems represented by survey responses were past their Initial Operational Test(IOT).SURVEY RESULTS
Overall results, based on analysis of survey responses and user comments, reinforce the understanding that systems with a robust reliability growth program are more likely to reach reliability goals.In particular, analysis results revealed the importance of establishing RAM entrance criteria and intermediate goals that are linked to the reliability growth curve.As shown in Table 3, programs that establish and meet their RAM entrance criteria are more likely to demonstrate reliability at or above the required value during OT.Examples of effective RAM entrance criteria include(1)demonstrating, in the last DT event before the IOT&E, a reliability point estimate that is consistent with the reliability growth curve, and(2)for automated information systems, ensuring that there are no open category 1 or 2 deficiency reports prior to OT [4]
Of the 15 programs in Table 3 that established and met their RAM entrance criteria in DT, 13 met their reliability goals in OT.None of the seven programs that failed to meet their entrance criteria in DT went on to meet their reliability thresholds in OT.The Pearson p-value in shown in Table 3 indicates that this result is statistically significant.This result suggests that programs that do well in DT are more likely to so well in later OT.However, despite this obvious result,many programs do not establish RAM entrance criteria, and programs that fail to meet entrance criteria in DT are still permitted to move forward and participate in OT.This result confirms that moving programs forward that perform poorly in DT increases the risk they will fail to reach reliability thresholds in OT.There is also evidence that programs that have intermediate goals that are linked to the reliability growth curve are more likely to meet their RAM entrance criteria asshown in Table 4.Overall results also suggest that implementing RAM policies alone, without the support of a robust reliability growth program, is insufficient to improve the chance of success in OT.Analysis of responses collected in 2013 for programs that had an IOT&E or FOT&E provide no significant evidence that implementation of RAM policies alone improves the chance of demonstrating RAM threshold during OT.As shown in Table 5, there was no single policy area that could be correlated with success in OT.In fact, a smaller fraction of programs with growth curves met their RAM entrance and exit criteria compared to programs that do not have reliability growth curves.User comments report a variety of reliability growth plan inadequacies such as requirement deficiencies, policy implementation concerns, and testing limitations.For example, some respondents commented that reliability growth curves were constructed as an afterthought,retrofitted in the TEMP only after DOT&E requested information on it.In these instances, the construction of reliability growth curve was to comply with a paper policy, rather than to reflect systems engineering activities.Other respondents indicated that the reliability requirements were not achievable, because they were based on faulty modeling assumptions or they were unrealistically high compared to similar system.Finally, some respondents commented that there was insufficient testing in OT to evaluate the reliability requirement or the reliability growth model inputs were not based on realistic assumptions.Consistent with the result of previous surveys, survey responses collected in 2013 provide no evidence of improvement in the percentage of programs that met their RAM entrance or exit criteria.Compared to other types of OT, FOT&Es had the highest fraction of programs that met their exit criteria or demonstrated reliability above the requirement(Figure 1).This suggests that many programs do not reach their reliability goals until after fielding.2.1 Comparison of Responses by TEMP Date Analysis of responses shows that the fraction of programs that implement reliability-focused policy guidance continues to improve.Areas of continuous policy implementation improvement over time included the following: •
Having a reliability growth(RG)strategy •
Documenting reliability RG in the TEMP •
Incorporating RG curves into the TEMP •
Having a process for calculating RG potential.The results for these questions are listed in Table 6 for known “Yes” or “No” responses.Analysis results suggest that the improvement over time is statistically significant at the 90 percent confidence level.As shown in Table 7, the fraction of FY 2012 or 2013 TEMP programs that use the reliability growth curve to develop intermediate goals improved(59 percent)compared to FY 2011 TEMP programs(48 percent), but remained below the fraction observed for programs with TEMPs approved between June 2008 and October 2010(73 percent).The fraction of FY 2012 or 2013 TEMP programs that use reliability metrics to ensure growth is on track to achieve requirements also increased, reaching a higher percentage than that observed for older TEMP date categories.The fraction of programs that have reliability growth curves has remained relatively constant over time.Approximately 60 percent of programs with FY 2012 or 2013 approved TEMPs link their reliability growth goal to an OT event.2.2 Differences Across Lead Services Among programs with FY 2012 or 2013 TEMP approvals, all Services are generally following guidance to: •
Establish a reliability growth or improvement strategy and describe it in the TEMP •
Incorporate reliability growth curves into the TEMP •
Use reliability metrics to ensure growth is on track to achieve requirements.Army and Navy programs show improvement in implementing the following RAM policies: •
Establishing a reliability growth or improvement strategy(since July 2008, more than 80 percent of Air Force programs have had a reliability growth or improvement strategy)•
Having reliability growth curves and documenting them in the TEMP •
Calculating reliability growth potential.A larger fraction of Army and Navy programs with FY 2012 or 2013 TEMPs establish and link intermediate goals to the reliability growth curve compared to the Air Force.As shown in Figure 2, Army programs were more likely to link reliability growth goals to OTs compared to the other Services.3 RECOMMENDATIONS
Survey results suggest that military systems should carry out the following activities to improve their chance of meeting reliability requirement in OT: •
Establish OT entrance criteria and ensure these criteria are met prior to proceeding on to the next test phase.•
In accordance with existing USD(AT&L)policy, ensure that that reliability growth curves are stated in a series of intermediate goals and tracked through fully integrated, system-level test and evaluation events until the reliability threshold is achieved.•
Ensure that reliability growth curve assumptions are based on realistic inputs from systems engineering.•
Review the adequacy of requirements to ensure they are achievable.•
Updating reliability growth curves as needed.•
Ensure that enough test time is resourced to support an evaluation of the reliability requirement(s).REFERENCES 1.Title 10, United States Code, Section 139, “Director Operational Test and Evaluation.”
2.“Director, Operational Test and Evaluation FY 2013 Annual Report,” January 2014.3.“Defense Acquisition Guidebook,” section 9.5.5, October 2012.4.DOT&E Memo to the USD(AT&L), “Reliability Survey of Select Acquisition Programs on DOT &E Oversight,”October 30, 2013.BIOGRAPHIES Jonathan L.Bell, PhD Institute for Defense Analyses Operational Evaluation Division 4850 Mark Center Drive Alexandria, VA 22310 USA.e-mail: jlbell@ida.org Jonathan L.Bell is a Research Staff Member at the Institute for Defense Analyses(IDA).He earned his doctoral degree in Materials Science and Engineering at the University of Illinois at Urbana Champaign in 2008 and his bachelor’s degree in Materials Science at Carnegie Mellon University.Dr.Bell’s work at IDA is focused on operational testing of ground vehicle systems with a specific emphasis on reliability.Matthew R.Avery, PhD Institute for Defense Analyses Operational Evaluation Division 4850 Mark Center Drive Alexandria, VA 22310 USA.e-mail: mavery@ida.org Matthew Avery, a Research Staff Member at the Institute for Defense Analyses(IDA), earned a Master of Science and doctoral degree in Statistics from the North Carolina State University.Dr.Avery’s work at IDA focuses on statistical aspects of operational test and evaluation.Michael C.Wells Institute for Defense Analyses Operational Evaluation Division 4850 Mark Center Drive Alexandria, VA 22310 USA.e-mail: mwells@ida.org Michael C.Wells, a Research Staff Member at the Institute for Defense Analyses(IDA), earned a Master of Science degree in Operations Research from the University of California, Berkeley, a Master of Science in Information Management from Marymount University, and a bachelor’s degree from the United States Military Academy.Mr.Wells joined IDA following 24 years of service with the US Army.Mr.Wells’ work at IDA has focused on operational testing of Army fire.军事采集系统可靠性的调查
Jonathan L.Bell博士,国防分析研究院研究员 Matthew R.Avery博士,国防分析研究院研究员 Michael C.Wells, 国防分析研究院研究员
关键词:调查,国防部,军事,可靠性
摘要和结论
改善军事系统内部的可靠性一直是国防部(DoD)优先的关键项目。从过去几十年的测试结果表明国防部尚未意识到利用可靠性统计来改进许多系统的重要性。然而,有证据表明,那些系统实现了全面的可靠性增长的程序更容易满足他们的发展目标。可靠的系统总体成本更低,使用时更可靠,系统寿命也更长。在早期设计(可靠性设计)和后期测试中可靠性是更具有效性和高效性的。虽然需要更多的前期努力来构建可靠性系统,但是其在未来巨大的潜力却是不容忽视的。
在主管作战测试和评估部门(DOT&E)的要求下,国防分析研究院(IDA)自2009年以来已经在国防部监督下每年进行可靠性调查,在国防部政策指导下不断深入的提供以可靠性为中心而实施的军事计划,和评估是否实施该计划。从而提高了军事计划的可靠性。本篇论文提供了一份评估调查结果。
整体调查结果显示对系统全面的可靠性增长计划更容易在测试中实现可靠性目标。特别的,调查结果表明在进行测试之前建立可靠性、可用性和可维护性(可靠性、可用性和可维护性)的标准的重要性。虽然许多程序没有建立满足可靠性、可用性和可维护性的标准,但是这却更容易在测试中展示达到或超可靠性过所需要的标准值。有效的可靠性、可用性和可维护性标准的例子包括(1)证明在过去测试事件之前不可靠性点的估计和可靠性增长曲线是一致的,(2)自动信息系统、软件集成传感器和武器系统,确保在没有开始测试前存在1或2个缺陷报告。也有证据表明,可靠性增长曲线的中间目标有提高满足可靠性、可用性和可维护性标准的机会。本次调查结果还表明,越来越多的方案以可靠性为重点,尽管这些方案实施了改善,但很多方案仍未能达到可靠性目标。换句话说,这些方案尚未证明在提高可靠性的趋势方面有效。计划无法达到的可靠性目标的原因包括:需求不足,不切实际的假设,缺乏可靠性设计工作,并没有采用一个全面的可靠性增长过程。虽然美国国防部在一段时期内很好的强调了可靠性增长的原则,但却没有始终如一地贯彻这些原则的政策,所以系统的可靠性趋势可能会保持不变。
在未来,每个方案都需要结合强大的设计和可靠性增长计划。按照ANSI/ GEIA-STD-0009中描述的可靠性设计原则,“可靠性项目标准系统设计,开发,与制造。”来开始一个更好的工作。而遵循这一做法的方案才更有可能是可靠的。一个更加强调确保可靠性的要求应该是可以实现的,而且在开发的每个阶段的可靠性的期望是由与系统工程活动相联系的假设来支持的。计划还应该建立可靠性、可用性和可维护性的标准,并确保这些条件都满足之后才继续进行下一个测试阶段。系统的可靠性增长曲线应该是由一系列中间目标构成的,同时安排测试修复等测试活动,来确保实现这些目标的时间。最后,当有足够的证据能证明系统的可靠性明显的在增长曲线之下时,该系统应制定一个改进方案,以解决不足之处,并且纠正其执行计划。.导言
主管作战测试和评估部门是国防部主要的参谋助手,高级顾问,在国防部是国防部长进行作战测试和评估的手段。主管作战测试和评估部门主要负责国防部采办项目,以确保测试和评估足以验证防御系统的作战有效性和适宜性。从主管作战测试和评估部门向国会报告中的数据显示,尽管成立多年来旨在鼓励更多系统发展可靠性的政策,但国防部系统的可靠性并没有得到改善。从1997年到2013年,该部门的测试系统的只有56%达到或超过其可靠性门槛的要求[2]。进一步的分析表明,出现了在一段时间内他们可靠性要求的方案没有得到改善。
为了更好地来理解这些趋势,主管作战测试和评估部门在国防分析研究院的要求下进行军事项目的调查,在过去五年来确定以可靠性为重点的政策正在实施,以评估其能够提高可靠性的程度。国防分析研究院制定了调查计划,并分发给研究人员和对项目感兴趣的专项专家。调查内容包括对测试收集可靠性表现和在程序中可靠性增长计划问题,计划和在开发过程中跟踪的可靠性,该方案是否有可以计算的可靠性增长潜力的过程,问题列于表1。对于大多数问题,要求受访者回答“是”,“否”或“不知道”。受访者的意见也提供了研究人员发现每个问题的机会。
最近的调查是在2013年进行,调查集中在提交测试和评估总体规划,首要文档是主管作战测试和评估部门进行的FY 测试和评估总体规划,描述系统的测试计划的方案[3]。
1.1调查分析方法
分析每个响应是如何变化的,通过在最近的一项调查测试和评估总体规划日期比较早前调查的每个问题,被调查项目之间的重复调查项。分析还考虑到每个优先服务的差异,包括陆军,海军和空军(海军陆战队应答分组在海军),并通过采集不同响应的阶段。
使用下面的测试和评估总体规划日期类别,以保持与以往调查所用的分析方法和分析分级响应的一致性:
•2008年7月之前,以前国防部的一个关键可靠性政策的批准(75答复)•2008年6月至2010年10月之间(81答复)•时间点为2011财年(57答复)
•时间点为2012财年和2013财年(52答复)。
在适当情况下,用列联表来记录和分析两个或更多个分类变量之间的关系。这使得观察到的统计结果变得明显的更有意义。
1.2人口调查答复
国防分析研究院的分析师在2013年完成的最新97份答复中所进行的可靠性的调查,2012财年和2013年测试和评估总体规划有52份答复,2012财年测试项目有66份答复,2012年和2013 测试和评估总体规划有6份答复。表2显示了回应采集阶段,系统服务和测试中63%的受调查答复结果代表了系统已经通过了初始作战测试(IOT)。
2.调查结果
在强调整体效果的基础上,对调查结果和用户的意见进行分析,加强对调查结果的理解。即只有拥有强大的可靠性增长项目的系统才更容易达到可靠性目标。特别是,分析结果显示建立的可靠性、可用性和可维护性标准和链接到所述可靠性增长曲线的中间目标的重要性。如表3所示,即建立和满足他们的可靠性、可用性和可维护性标准的方案更可能展示出可靠性等于或高于测试期间所需的值。有效的可靠性、可用性和可维护性标准例子包括:(1)证明在过去测试事件之前不可靠性点的估计和可靠性增长曲线是一致的和(2)自动化信息系统,确保在没有开始测试前存在1或2个缺陷报告。
即建立并满足其可靠性、可用性和可维护性的标准,计划表3中,展示了满足测试系统的可靠性目标和未能满足测试系统的标准。包括测试在内的七个方案,建立了满足其可靠性门槛的标准。在表3中所示的在p值表示此结果在统计学上是显然成立的。这一结果表明,做好前面的测试计划才更有可能做好后面的测试计划。然而,有一种明显的现象,很多的程序并没有建立可靠性、可用性和可维护性标准,而这些不符合标准的项目在测试仍然被继续允许存在,参加测试项目。这个结果证实,在测试中继续增加这些不符合标准的项目,系统将无法达到在测试中的可靠性阈值,也有证据表明,具有能链接到可靠性增长曲线的中间目标的项目是可能满足其在可靠性、可用性和可维护性中的标准的。
总体结果还表明,单独的实施关于可靠性、可用性和可维护性的政策,却没有一个强大的可靠性增长项目的支持,并不足以提高测试成功的机率。在2013年收集的信息中即有一个初始作战评估和在中期作战评估没有提供显著的证据证明下,实施的可靠性、可用性和可维护性政策仅提高了测试期间与规定可靠性、可用性和可维护性标准的相符合。如表5中所示,有可能是与在测试中没有成功的区域相关联所导致的。事实上,不具有可靠性增长曲线的程序与拥有可靠性增长曲线的系统相比,不具有可靠性增长曲线的程序只有较小的部分满足它们的可靠性、可用性和可维护性的标准。用户反馈的报告也暴露了可靠性增长计划的各种不足之处,如实验条件不足,对政策实施的担忧,测试受到各种限制等等。
例如,一些受访者回复说,当可靠性增长曲线构造后,而且在进行改造后,从主管作战测试和评估部门要求下就可以知道关于测试和评估总体规划的信息。在这种情况下,可靠性增长曲线的结构只是遵从表面上的要求,而不是反映系统真实的工程活动。其他受访者表示,可靠性要求都无法很好的实现,因为它们是基于错误的假设,只是建立类似的系统模型。最后,一些受访者评论说,没有经过足够可靠性要求的测试,其可靠性增长模型不是基于现实的假设来进行评估的。
与以前的调查结果相比,在2013年收集的调查结果表明没有提供满足其可靠性、可用性和可维护性标准的改善方案。相比其他类型的测试,后期作战测试是在满足或超过它们要求的标准的表现出可靠性最高的测试(图1)。这表明,许多项目最初并没有达到它们的可靠性目标,直到调整后才达到其可靠性目标。2.1在测试和评估总体规划中响应的比较
响应分析表明,实施的以可靠性为重点政策的方案得到了改善。持续实施的政策随着时间的推移改进着每个领域。包括以下内容: •拥有一个可靠性的增长(RG)策略
•将可靠性RG在测试和评估总体规划中进行文档化 •将RG曲线代入测试和评估总体规划 •具有用于计算的RG潜在值的方法。
总结,这些问题被列在表6中已知的“是”或“否”的响应中。分析结果表明,随着时间的推移大约有90%的方案得到了改善。
如表7中所示,与2011财年的测试和评估总体规划计划(48%)相比,2012财年和2013年的测试和评估总体规划(59%)其可靠性增长曲线的发展中期目标比例有明显的提高 但仍观察到其计划的比例还是低于2008年6月到2010年10月之间的测试和评估总体规划(73%)。提高其使用的可靠性指标,以确保2012财年和2013年测试和评估总体规划的百分数实现增长,达到一个比以前的测试和评估总体规划百分数更高的比例。
具有可靠性增长曲线的方案一直保持在相对稳定的状态。2012和2013年大约有60%的FY计划通过了格林尼链接的可靠性增长目标的测试。2.2差异性的服务
2012财年和2013年审批的测试和评估总体规划程序,所有程序的要求都一般如下:
•建立一个可靠的增长或改善的策略,并说明它在测试和评估总体规划的意义 •将可靠性增长曲线计划入测试和评估总体规划中
•使用合理的的可靠性指标,以确保可靠性的增长要求是有望实现的。陆军和海军的计划显示了他们将改善实施以可靠性、可用性和可维护性为重点的政策: •建立一个可靠性的增长和改善策略(自2008年7月,有超过80%的空军计划建立可靠的增长和改善的策略)•具有可靠性增长曲线,记录他们在测试和评估总体规划中的曲线 •计算可靠性增长潜力。
与2012财年和2013财年的陆军和海军计划建立的项目和中间目标链接到可靠性增长曲线相比,空军如图2,与其他计划相比陆军的方案更能够接近可靠性增长曲线的目标。3.建议
调查结果表明,军事系统应该进行以下改进,以提高其满足可靠性要求的水平: •建立测试的标准,并确保前面的测试阶段满足这些标准之后,才继续到下一个测试阶段。
•根据现行美元(AT&L)的策略,确保该可靠性增长曲线表示其相关联的中间目标,并通过完全集成的系统级测试和评估事件跟踪,直到达到可靠性阈值。•确保可靠性增长曲线的假设是基于系统工程的现实状况。•检查要求是否达成,以确保它们是可以实现的 •根据需要随时更新可靠性增长曲线。
•确保足够的测试时间和资源来支持的可靠性要求(S)的评价。参考资料
1.标题10,美国法典第139条,“导演作战试验和评估” 2.“导演作战试验与评估2013财年年度报告”,2014年1月 3.“防务采办指南,”9.5.5节,2012年10月
4.主管作战测试和评估部门备忘录(AT&L),“选择采办项目上主管作战测试和评估部门监督,可靠性调查”,2013年10月30日 作者简介
乔纳森·L·贝尔博士国防分析研究院业务评价司4850马克中心传动 亚历山大,VA22310 USA 电子邮件:jlbell@ida.org 乔纳森·L·贝尔,一名在国防分析研究院(IDA)工作的研究人员。他在2008年获得伊利诺伊大学香槟分校的材料学和工程学博士学位,并在卡内基·梅隆大学获得材料学学士学位。贝尔博士在IDA工作的重点是地面车辆系统与特定的强调可靠性运行测试 马修·R·艾弗里博士 国防分析研究院业务评价司4850马克中心传动 亚历山大,VA22310 USA 电子邮件:mavery@ida.org 马修·艾弗里,一名在国防分析研究院(IDA)工作的研究人员。获得了北卡罗莱纳州立大学的统计学硕士学位和博士学位。艾弗里博士在IDA工作主要集中在作战测试和评估统计方面。
迈克尔·C.威尔斯国防分析研究院工作评价司4850马克中心传动 亚历山大,VA22310 USA 电子邮件:mwells@ida.org 迈克尔C.威尔斯,一名在国防分析研究院(IDA)工作的研究人员,获得了运筹学的硕士学位。来自加州大学伯克利分校,获得了Marymount大学信息管理硕士学位和美国军事学院的学士学位。威尔斯先生加入IDA的24年来一直为美国军队服务。威尔斯先生在IDA的工作重点是陆军火力运行测试。
第二篇:英语论文翻译
计算机技术和应用3(2012)361-367 监控高速公路事件检测使用霍特林T ^ 2控
制图
1.理工学院的纽约大学,六MetroTech中心,布鲁克林,纽约11201,美国。
2.乔治敦预备学校,10900年罗克维尔市梭子鱼、北马里兰州贝塞斯达20852,美国。
3.部门的工业和系统工程,哈利法Universiyt科学、技术和研究,阿布扎比,阿拉伯联合酋长国。4.部的自然科学,华盛顿浸会大学,安嫩代尔,弗吉尼亚州22003,美国。
收到了:2012年3月12日/接受:2012年3月31日/出版:2012年5月25日。
文摘:在现实生活中的公路交通运输系统,一些数量的事件观察(非常罕见的事件)可用而存在 大量的正常状态数据集大多数的研究高速公路事件检测已经考虑这一事件检测问题分类一然而,因为不足的事件事件,最先前的研究利用模拟事件事件发展高速公路事件检测模型以便克服这个缺点这提出了一个霍特林T ^ 2噪声控制图对高速公路事件检测,集成了一个小波变换成一个abnorma1检测方法首先,小波变换提取特征usefu1嘈杂的原始交通observations.1eading减少维度的输入向量然后,旅馆业T ^ 2控制图描述了一个决策边界只有正常流量观测与选择的特性在现有事件不同域的小波变换检测算法,需要大量的事件观察来构造事件检测模型,该方法可以决定一个决定边界只给予正常训练观测结果进行了评价方法相比,加州算法明尼苏达州算法和传统神经网络实验结果呈现,本文提出的算法是一种很有前途的altemative高速公路自动事件侦测到。
关键词:高速公路事件,事件检测算法,旅馆业T ^ 2控制图,小波变换、特征选择。1.引入
自动检测在高速公路上的事件本质上是的一个主要功能一个先进的交通管理系统(ATMS), 这是最重要的部分智能运输系统(ITS)的精确和快速的事件检测是特别重要的改进。高速公路的能力,因为事件原因严重减少交通流量或次要的事件,这可能导致许多牺牲人类生活和成本许多高速公路事件检测算法是发展在过去的几十年。
通讯作者:Yotmgsul Jeong,博士,教授,研究领域:环境工程、环境和交通信息和数据挖掘的电子邮件:ysjeong@wbcs.edu。
这些算法包括加州算法[1],明尼苏达州算法[2],基于神经网络算法【3】,非参数回归[7],支持 向量机(SVM)【8】,决策树学习[9],和小波变换的基础算法[13]。然而,由于交通数据依赖和高 误警率(远)现有的算法,大多数交通信息中心并不是操作它们。最近,一个小波变换,这是其中的一个有前途的技术领域中的信号分析和数据挖掘,已经申请了交通事故检测[12]因为高超的能力的去噪,小波变换用于提取信息功能从嘈杂的原始流量使用前输入向量测量到事件。
第三篇:英语论文翻译
新鲜果蔬的产品质量
摘要
由于果蔬损坏和暴露的组织和没有保护好外皮,鲜切的水果和蔬菜极易腐烂。利用修剪工具、酶促褐变、抑制剂、调节气体含量和低温可以把凌乱的生产最小化。在低温和特定的大气中,可以生产出高质量的产品可以维持适当的成熟度。通过专业的知识和控制腐烂的因素,让优质鲜切产品达到较长的保质期。由Elsevier Science BV 1999年出版的。保留所有的权利。
关键词:鲜摘的果蔬,质量,蔬菜。
新鲜水果和蔬菜产品部分准备是为了不用在必要的时候去作额外的准备。它们是提供给餐厅,公共餐饮,快餐食品商店和零售市场。新鲜果蔬包装在薄膜包装或缠绕有膜的重量范围为0.5〜4公斤。在不同的新鲜果蔬中,当保持在一个合适的温度下,果蔬能放置7到20天。消费者希望新鲜果蔬产品没有什么缺陷的,并且是最佳成熟度和新鲜。条件一般包括外观,感官质量(材质/硬度和味道)和营养品质。新鲜果蔬产品很容易变质,由于受损的细胞和组织和缺乏保护外皮。切割和切片胡萝卜具有非常锋利的刀片可以减少损坏量,当与这些相比,细胞和脱水,切片用常规的烹饪刀。脱水也减少到最快处理切割胡萝卜钙,在大气湿度上它们的相关性非常高。((Cisneros-Zevallos 等人1997).有一些产品的表面会出现着色的问题,例如白菜、生菜、马铃薯、苹果和蜜桃。氧化多酚类氧化酶催化的结果导致酶促褐变。酚类化合物是一种产品催化反应,PAL的活性被用于作为指标对潜在褐变。对苹果切片酶促褐变可用4.5%氯化钠减少了切片处理。抑制作用减弱,存储持续时间和不同苹果品种也会有所不同。可控气调包装能有效延缓褐变或发生PAL反应。当在空气中,在5℃下保持生菜丝变成褐色8天,而一个1%氧气+12%二氧化塘的延迟2周。有20%的CO 2的气氛减少了PAL活性和苯酚切生菜中脉的含量在2.5°C,保持其被认为是由于减少组织pH值。因此保持较低温度,以减少褐变反应。
不同的品种有着不同的褐变程度。矢野和西条检查的25品种白菜丝,发现8品种对棕色略少,两个品种对后褐变在20℃24小时之后。Kim等人发现对12种苹果品种,切片土地','帝国','金冠','纽约674“和”美味“显示,至少在在2℃温度下3天后才会褐变。因此,选择适当的品种对于控制褐变产品是重要的。
成熟是果蔬中一个重要的质量,因为缺乏好的不成熟的水果感官质量和过成熟水果有限保质期。我们指出,没熟蜜瓜立方体可溶性固形物8.8%低于更成熟的水果,13%可溶性固体几天后存储。没成熟的蜜瓜多维数据集在不成熟成熟的阈值水平(8.8%可溶性固体)“3”的平均质量分数后3天10°C和得分的“4” 7天后在5°C(数据不提供)。非常成熟的瓜(可溶性固形物13%)平均“5”的质量分数(公平)在10°C温度下 3天后分“6”(公平)在5°C温度下7天后。质量分数来自得分一般外观、剪切力值和品味分数。这些可溶性固体未能为8.8%保留蜜汁味道、香味和恶化,可溶性固体更快比13%。蜜瓜数据为13%,可溶性固形物有好味道、香味,但恶化得更快高于11%的。因此,与鲜切水果的有限的货架寿命,它必须使用成熟的果实可以接受的食味品质进行处理,但不能过熟水果,这会迅速恶化。
一般质量状况,其中包括外观上,硬度、质地和维生素含量,受各种因素的影响。最重要的因素是温度。当温度升高从0到10℃时,呼吸速率增加Q 10的范围从3.4到8.3之间,各种鲜摘的产品。增加呼吸率,提高速度可比恶化产品的外观。因此,低温对维护至关重要。
大约40%的新鲜果蔬产品市场的敏感,因此冷冻的伤害是一个问题鲜切产品在冷冻的温度下。由于鲜切产品的保存周期短,很容易腐烂,当相比与整个产品中,温度这会导致冷冻伤害的少量是优于导致迅速恶化,对于自然的温度来说。在我们的南瓜切片的实验中,所有的一式三份的切片样本在经过17天的0°C储存下都严重的极端冻伤;大约50%的一式三份的切片样本在经过16天的5°C储存后出现了轻度到中度的病变和腐败导致冻伤和自然腐烂;还有大约90%的一式三份切片样本在经过12天的10°C储存后出现了中度到重度的褐变和腐烂。对比在0°C时的损伤和在10°C时的自然腐烂,5°C 是最适宜的保存温度,尽管也会带来一些冻害。也有报告说,新鲜的蜜瓜和厚皮甜瓜应该在4°C保存,因为在这个温度下发生的冻害数量要比在较高的温度下发生的数量要少的多。最佳的温度也要对应不同的保存持续时间和产品,因为产品的不同类型和种类的寒冷敏感性不同。改善鲜切容器或包装里的空气含量对保证鲜切产品的质量是很有帮助的。跟据整个产品的建议来改善包装里适合的气体混合。
切割蔬果表面会产生褐变这是一些产品问题,如白菜,生菜,土豆,苹果和桃子。氧化酚类通过多酚氧化酶导致催化复杂的褐变。酚是一种产品,由苯丙氨酸催化的裂解反应酶(PAL)和PAL的活性被用于作为指标潜在褐变。苹果的表皮酶促褐变可以用4.5%氯化钠减少治疗和0.2%的氯化钙。酶的抑制效果降低与存储持续时间,与不同苹果品种有很大的关系,控制气体的成分,大气气调包装(也是可以是有效延缓褐变和一支PAL活动。当在空气中5℃下保持8天的状态下,生菜变成褐色,在0°C和 5°C时的含氧水平降至0.5%,10°C时降至1.0%,对于西兰花来说仍然可以获得有益的结果。一些鲜切产品的在含氧水平接近或者达到呼吸商断点(RQB)时仍然保持无损伤。对于西葫芦片,其含氧水平可以降至0.25%,对于胡萝卜(Izumi等人, 1996c)和小白菜(O’Hare等人, 1995)是0.5%,菠菜是0.8%, 卷心菜和生菜是1%,而对于洋葱块则是2%.这样的低氧水平对于这些产品的质量保持是有益的。,在15℃下,比在5°C,最大PAL活性发生较早,因此低应保持温度,以减少褐变。
品种不同的褐变程度。矢野和西城研究了25品种切碎的白菜,发现8到品种,棕色的两个品种为褐色。对于鲜切水果质量来说成熟是一个重要属性,因为不成熟的水果缺乏好的感官品质,过于成熟的水果的保质期有限。我们注意到在储存了几天后,刚成熟方形哈密瓜可溶性固形物含量为8.8%,要比那些比较成熟的水果的13%可溶性固形物含量要低。刚熟的方形哈密瓜经过3天温度为10°C的条件下,位于不成熟到成熟临界水平(8.8%的可溶性固形物含量)时的平均质量分数为“3”分(差),在经过7天温度为5°C(没有提交数据)后则为“4”分(及格-差)。非常成熟的方形瓜(可溶性固形物含量为13%)在经过3天温度10°C的条件下的平均质量分数为“5”分(及格),在经历了7天温度为5°C的条件下分数为“6”分(好-及格)。这个质量分数从品相,剪切力值和味道分数得来。那些可溶性固形物含量为8.8%的哈密瓜没有没有保留哈密瓜的味道/气味而且对比起那些可溶性固形物含量为13%的哈密瓜来说更容易变坏。可溶性固形物含量为13%的哈密瓜拥有更好的味道/气味,不过在10°C的温度下比可溶性固形物含量为10%的更容易变坏。因此,鲜切蔬菜的保质期是有限的,这对于成熟水果而言合理的食物品质处理必不可少,但对于过度成熟的水果则会加速其变坏。
空气控制系统用于对模拟的空气含量中相似气体成分的空气质量进行质量的评估。10% 氧气 + 10% 二氧化钙已被证实可以延缓荷兰芹的叶绿素衰落。控制空气含量为5–10% 的氧气+5–15% 的二氧化碳可以延缓碎白菜的褐变和疾病(Kaji等人, 1993)。控制空气含量为3%的 氧气+10%的 二氧化碳的气体对卷心莴苣有益,对生菜稍微有益,对卷心菜则没有益处。西兰花在控制空气含量为2%的 氧气 +6% 的二氧化碳的4°C空气中可以推迟变黄和霉变达2星期。在0°C和 5°C时的含氧水平降至0.5%,10°C时降至1.0%,对于西兰花来说仍然可以获得有益的结果。一些鲜切产品的在含氧水平接近或者达到呼吸商断点(RQB)时仍然保持无损伤。对于西葫芦片,其含氧水平可以降至0.25%,对于胡萝卜和小白菜是0.5%,菠菜是0.8%, 卷心菜和生菜是1%,而对于洋葱块则是2%.这样的低氧水平对于这些产品的质量保持是有益的。
在略低于RQB,胡萝卜切丝改变他们的呼吸途径,不断产生化学能,产生果糖-2,6-二磷酸合成。在低O 2的水平,来提高酶焦磷酸依赖激活酶活性。增加的酶活性,在果糖-1,6-二磷酸产生时,加速了糖酵解产生ATP以及乙醇。在这种条件下,克雷布斯循环就是所有功能的最低限程度,如此一来组织就会变得依赖于糖酵解来获得ATP来保持最小代谢。
乙烯生产受到刺激时植物组织受伤,它放在包装密封的鲜切的产品,这可能会导致不良的影响。2毫升浓度的L−1乙烯在20°C 时加速软化奇异果和香蕉片,当用乙烯吸收剂(氯化钯炭)去减少乙烯等级时软化被延缓了。加速软化储存了一天后的标记,所以这也是控制乙烯产品保持质量的关键。酚类化合物是一种产品催化反应,PAL的活性被用于作为指标对潜在褐变。对苹果切片酶促褐变可用4.5%氯化钠减少了切片处理。抑制作用减弱,存储持续时间和不同苹果品种也会有所不同。可控气调包装能有效延缓褐变或发生PAL反应。当在空气中,在5℃下保持生菜丝变成褐色8天,而一个1%氧气+12%二氧化塘的延迟2周。有20%的CO 2的气氛减少了PAL活性和苯酚切生菜中脉的含量在2.5°C,保持其被认为是由于减少组织pH值。因此保持较低温度,以减少褐变反应。鲜切的产品是很容易受到褐变,因为内部组织暴露并且缺乏皮肤角质层的保护。不过,在较湿环境下,通常是非常高密度的薄膜袋或容器中或者外包装薄膜,因此脱水通常是不是问题。可食用涂层还可以用来保持高的相对湿度。虽然膜或涂层提供较高高相对湿度,但是还是存在两个潜在的问题。首先,水分凝结在薄膜包装的内表面,不仅影响观察里面的物质,里面的水分也会成为分解和微生物生长的环境。第二个问题是,如果该膜或涂层不能提供足够的传输氧气和二氧化碳,过度调节气体的成分可能导致产品的伤害。因此,薄膜和涂层不仅是需要选择维持相对高的湿度,而且能给予适量的气体。
综上所述,虽然鲜切产品是极易腐烂,高品质的产品可以保证通过选择加工了适当的成熟度的产品,以及防止对产品的伤害,以及保持合适温度,气体成分和相对湿度。
第四篇:英语论文翻译
游客的观点和他们选择的旅游目的地图片:一个情感和励志评价
文章信息
文章历史: 2012年4月11日收到 2012年4月16日发表 网上xxxx 关键词:情感图片 动机 目的地形象 感知 小册子 旅游促进
形象是旅游目的地营销的一个重要组成部分 ,因为它通过刺激多个创造性活动和经历来影响游客的行为。以前的研究已经表明,目的地图片形成影响旅客的想法和感受。因此,探索目的地形象的作用对促进旅游目的地作为度假资源是极其重要的。我们非常有兴趣探究在选择用于宣传目的旅游形象的旅游者的观点。因此,本研究的目的是调查影响和激励因素对于案例目的地目的地,比较两组的图片。结果表明,游客认为第一组图片是老套的,然而那些在第二组唤起更多的情感和激励属性,增加了他们参观展现地方的渴望。逻辑回归分析的结果突显出,游客们更受第二组图片的影响。最后,讨论了营销影响。
2012爱思唯尔有限公司版权所有
1.介绍
旅游目的地形象在当代旅游研究是一个关键挑战。这是被广泛认可的,形象从他们的心理结构有关的目的地属性决策过程影响游客的行为,(作者)。关于目的地形象个人和组织开发了他们自己的心理结构和表述,专注于几个属性,这影响了他们的信念、思想、态度、观念、和印象(作者)。有一个伟大的文献,认为目的地形象作为一个多维构造包含两个主要因素:情感和理智(作者)。例如,为了澄清感知形象和旅游行为之间的关系 ,一些研究已经检查过包括旅游手册和明信片在内的图片(作者)。手册对潜在游客沟通目的地利益和资源有推广作用。一个重要的元素,这些调查出来的是相对自然的形象,这表明他们专门影响人类个性和旅游行为的不同层面(作者)。
最近研究认为旅游目的地是推动和拉动因素的结合。激励机制引起游客思想的拥护,这表明目的地形象是个人和社会结构的结合(作者)。在这种观点看来,目的地的核心部分是形象,这代表旅游吸引物简化。形象被用来租金旅游目的地,旅游管理者应明白游客人气感兴趣的可视化属性倾向于其他的(作者)。由于国际竞争增长和游客动机及需求的变化,传播良好的目的地形象在成功的旅游管理和目的地营销中已经成为首要事情(作者)。
尽管我们认为旅游形象选择是一个重要的营销过程,但我们发现大多数为了促进旅游目的地选择的形象,经常是基于传统象征。卡特和格特断言传统形象是现实的极其简化。他们不是准确无误的并且极少提供旅游目的地信息。实际上,我们发现形象曾经促进阿曼泰阿,这项研究的案例旅游目的地,只考虑摄影师的观点和他个人印象来选择,而不是提供其他信息考虑有价值的事情。总之,大多数形象是过期的。
实证研究表明,形象引发吸引游客的关注和激发他们决策过程的情感(作者)。鉴于图片的重要性,排除专业的人才以及游客他们的选择来促进目标可以降低该目的地的真正的潜力。因此,本研究的目的是探索两组图片是否代表相同的旅游目的地可以从情感、动机和决策的观点影响游客的行为。我们需要了解是否形象对游客而不是其他人没有选择用来促进旅游案例目的地是真的很重要。在我们看来, 从旅游视角第二组图片是有意义的。我们认为,旅游经理可以考虑这些结果为了最大化促进本地旅游资源和改善营销策略。为此,本文开篇根据受试者文献简要概述旅游目的地形象和动机方面。然后提出了用于数据收集的方法,了,后面跟着一个研究结果的演示。最后,结论考虑了从研究旅游案例旅游目的地派生出的营销影响。文献综述和研究问题
亨特介绍了形象和旅游目的地之间关系分析的重要性(1975)并且最近的无数的研究已经调查这一现象(作者)。有许多贡献在旅游文学旨在评估旅游目的地的概念形象。大多数这些使用术语如“印象”、“感性”,和“心理表征”(作者)。其他的研究发现旅游领域文化的重要性,作为一个变量,该变量支持旅游目的地形象的形成和假日的最后的选择地方(作者)。在这种情况下,作者得出目的地形象的精神形成基于参访前照片是适度的被与受试者民族文化相关的不确定废除水平所影响的。其他的研究已经应用结构方程模型(SEM)来定义一个旅游消费的模式,其中包括因素如知觉价值、质量满意度、目的地形象,与服务质量,目标是预测旅游的意图重新审视该目的地(作者)。研究结果显示目的地形象影响服务的质量和认知价值。最后一个因素对满意度和忠诚也有显著影响。之前的研究已经证明感知的目的形象和决策之间存在关系(作者)。积极形象在游客思想中生成一个关于感知目的地的好印象,影响他们的行为意向和未来的活动。由于目的地形象作为影响游客行为的行为要素的重要性,目前的研究旨在识别的主要因素定义、修改和巩固这一概念构造(作者)。
最近,一些研究已经调查了目的地形象宣传资料的效果(作者)。具体地说,作者应用精化可能性模型(ELM),它为“组织”、“分类”,和“理解”的一些影响说服性人际沟通的认知过程提供了一个概念性的框架。涉及游客行为视觉效果影响,这种通信模型可以提供更具体的分析。
旅游目的地信息对于游客、旅游促销和行业是特别重要。众所周知,游客收集目的地信息通过使用非正式的策略(如亲人、朋友等等)和正式的策略(比如海报、宣传册等),这为他们建立一种直接接触地方的方式提供支持(作者)。此外,互联网最近已成为另一个旅游目的地信息的重要来源(作者)。互联网服务在几个方面影响当代旅游业务,改变游客在信息检索与通信的行为(作者)。更具体地说,与旅游目的地有关的不同信息来源旨在促进游客精神意象的形成过程。形象形成可以定义为目的地心理表征的发展基于从正式的和非正式的材料收集的有限信息,(作者)。信息来源,特别是手册,其中包括专业视觉内容和表现旅游资产的形式描述,影响游客精神的目的地形象形成。手册比其他的信息来源有更大的可信度,因为它们通过使用建设性语言描述地方并且它们是主要宣传工具。尽管一些实证研究建立了一种信息来源和旅游行为关系的存在,一些调查分析图片是否符合游客的需求和他们的目的地形象。这些观点的基础上,我们制定了以下研究问题: RQ1。做宣传材料(例如,旅游宣传册)对旅游目的地形象的形成有情感影响吗? 动机是影响环境感知的认知组织和随之而来的旅游行为的心理因素(作者)。从概念的角度来看,动机是一个内部机制,促使人们采取行动而不是另一种方式来满足他们特定的需求和欲望(作者)。旅游文学清晰地显示了当一个个人决定旅行,这是通过几个动机和原因来影响。所有这些方面都致力于减少游客意识产生的旅游需求这种紧张的状态。几个作者对影响旅游行为和他们如何形成一致的旅游目的地形象激励机制做了调查(作者)。因此,宣传图片应该精心挑选对应于不同的动机状态调节游客。游客们的动机和愿望越来越复杂、精密并被吸引到后台越来越多现实,游客需要看到的图片,暴露出更多的亲密甚至一个地方的有争议的现实(作者)。
古森斯(2000)提供了一个集成的概念模型这包括动机和情感方面的旅游目的地形象,这些关系如何影响决策决策过程。特别是,该模型是相关的旅游经理有兴趣了解游客的情感和激励反应在他们观看的促销材料。其他的调查旨在分析积极性如何直接影响游客的情感成分(作者)。然而,对当前文学在旅游动机表明了研究旨在调查内部和外部机制的影响游客的形象情感成分行为(作者)。在这个关于动机和情感方面的初步调查之后(作者),一些额外的研究探索了这个情绪之间的关系和激励维度的游客的意见选择图片为宣传目的。因此,第二个研究问题如下: RQ2。在旅游动机因素和旅游目的地形象因素之间有一个积极的关系吗?最后,基于文献之回顾以前的研究问题,我们对参与参观案例旅游目的地话题进行验证也感兴趣。我们考虑了这两种形象策略的不同。因此,第三个研究问题是: RQ3 这样做的阿曼泰阿目的地形象特征有助于生成新的旅游吸引力吗? 3.研究
想要旅行的游客需要获得信息目的地。为此,游客咨询不同的信息源代码视图来开发他们的精神目的地形象。然而,目的地形象只有在这个地方被访问后,才会形成在游客的思想中(作者)。对于搜索目的地信息游客们会考虑几种类型的内容(作者)。此外,随着信息技术的到来,游客们有机会去探索不同的地方和产品“实际上”支持他们的信息获得过程。因此,下面的一般性问题在这个研究中被考虑:小册子上的形象影响目的地形象吗?小册子的形象和旅游目的地资源一致吗? 把这些问题作为起始点,本研究尝试比较两组图片旨在促进阿曼泰阿,我们的案例旅游目的地。第一组图片当前选中的促销计划。这些都包括在旅游手册和政府旅游网站。尽管第二组图片显示了许多旅游潜力方面的风景和老住宅,当地旅游经理不会选择他们作为宣传目标。因此,我们研究了两组图片是否诱导不同情感和激励的反应以及他们如何影响旅游的决定。
这个研究是在阿曼泰阿进行(意大利南部)。阿曼泰阿镇不仅提供传统的海滩沙滩阳光设施和卡拉布里亚特色美食产品,它也在有历史和农村地区的老镇附近,。阿曼泰阿的选择是由于便利的原因(例如,出现的几个酒店),由其战略地位联系其他重要的度假胜地城镇。在卡拉布里亚阿曼泰阿是最重要的一个度假胜地,国家和国际游客每年都参观它。方法论 4.1 样本
坐落在阿曼泰的5家旅馆的意大利客人接受了采访。总体来说,75位意大利的客人被认为是一种便利本研究样本。53%的被访的人女性,47%为男性,56%是年龄介于25至40年,27%的人40岁到50岁,10%是年龄介于20至25年,7%的人年龄在50到60年(表1),研究选择不同星级酒店并且采访客人得到酒店经理的允许。所有的受访者面试之前没有来过阿曼泰阿这个古镇,但他们知道海滨小镇的一部分。在这种背景下,地域知名度没有影响到研究的结果研究(作者)。
4.2 材料
10张代表阿曼泰阿古镇不同的场景和一个自答问卷被用来测试研究问题。索尼数码相机是用来拍照所有的图片场景。然后,我们在10×15厘米大小相纸上用高色彩分辨率打印照片。这些照片是有组织的分为两大类。第一类包括五名图片目前用于宣传册和在政府官方网站推广阿曼泰阿作为旅游目的地。第二类包括5个意象是现在不用于宣传目标。研究人员记住这项研究的研究问题确定这些最后的照片。
进行这一研究,自答结构式问卷组成使用4个部分。第一部分的问卷指选择图片和他们的情绪影响。它包括由罗素四项基于情感形象规模的发展(1980),它的目标是为了检查是否案例旅游目的地图片影响情感评价(作者)。这个规模已经应用在先前的研究中针对调查形象角色作为情感因素(作者)。特别是,它包括四双相情感形词:不高兴-高兴;困倦的-唤醒的;痛苦的-放松的和难过-兴奋。每个微分语义项被评为上一个8规模,更高的数字代表一个肯定的答复反之亦然。
第二部分问卷是关于相关代表风景的旅游动机评估。游客动机进行评估通过用5级里克特特征量值表(1 =绝对不会和5 =肯定是的)。这个问卷语句是考虑到皮尔斯的制定(2005年),该研究总结旅游动机如下:新奇、逃避和放松、关系、自治、自然、自我发展(主客交互),刺激、安全、自我发展(个人发展)、隔离、怀旧、浪漫、识别。动机如新奇、逃避、放松、关系和个人发展考虑在内,因为它们更好地代表阿曼泰阿的地方特征。
调查问卷的第三部分包括三个旨在评估游客参观案例旅游目的地意图的项目。主体的答案被评为使用二分法的价值(是/否)。最后,第四个也是最后一个部分的问卷包括人口信息(性别、年龄、婚姻状况、研究和旅行行为)。
4.3 刺激
用于本研究选中的风景分为两个主要类别。第一类包括代表教堂和一些历史建筑物的小镇阿曼泰阿张的五张风景图片。这些照片都是目前使用的宣传册和交付的阿曼泰阿市政网站(图1)。
第二类图片代表五张分别展现阿曼泰阿古镇特有的老房子建筑细节的归属感流行文化(图2)。这些提到的地方,就是被一名研究人员,专家在旅游和拍摄的基础上研究问题。我们确定了这些地方作为新的旅游景点。
阿曼泰阿的历史和文化已经被极大地取决于存在的重要流行的海事传统探索,参观许多小街道、房屋和查看其他场景阿曼泰阿老城区是完全有可能的。第一个类别中的图片显示刻板的地方。同时, 在第二类图片展现的地方是独一无二的建筑风格。在我们看来,他们能够更好地代表阿曼泰阿的文化和历史特性/特点增加游客积极情绪的影响。这些图片是当地人如何住在城市的这一部分,为游客提供机会来接触这个流行文化和传统的生活方式。
4.4 过程
这项调查发生在2010年12月和2011年2月之间位于阿曼泰阿的五个酒店大厅。开始采访之前,研究人员首先确保客人从未访问过阿曼泰阿古镇,然后向他们解释这个研究的主题和过程,包括几个步骤。这个受试者走进房间,坐在桌旁。接下来,研究员给受试者十张印刷彩色图片和三份问卷调查。每个受试者被要求从被提议的十组自由选择三个最有吸引力的图片。对于每个选择图片受试者完成一份问卷,问卷由四个部分。总的来说,每个受试者花了20分完成会话。这项调查是在酒店一个安静的房间里进行。在完成了调查,每个受试者被盘问。
首先,情感维度的图片是通过四双相的形容词评估的。第二,用5分克量表评估受试者的动机。第三,测量受试者访问案例旅游目的地的意图,二分法结果的三个项目被提出: 1)“你想参观这张图片展现的地方吗?”2)“你愿意在这张图片展示的地方度假吗?”和3)“你会把这照片发给一个朋友劝他/她拜访这个地方吗?”最后,社会概要文件中包含了问卷。
4.5 数据分析
不同类型的统计分析应用于以处理数据。进行了描述性统计分析受试者的概要文件。量表的可靠性阿尔法分析用于评估问卷的内部一致性。一系列的物流回归分析运行测试在第一和第二类别之间的关系游客的情绪评估和动机(自变量)和他们渴望参观地方代表在选定的图片(因变量)。这个变量的值依赖两分法:在物流回归分析、积极的问题的答案都表示与1,而消极的回答是表示0。反应相关的图片的第一个和第二个类别被命令执行统计分析。最后,用卡方测试的计算回归模型的意义。
换句话说,物流运行回归测试是否是的/ 没有 受试者的答案:1)“你想参观这张图片展现的地方吗?”2)“你愿意在这张图片展示的地方度假吗?” 3)“你会把这照片发给一个朋友劝他/她拜访这个地方吗?” 由情感和动机方面影响。回归方法使用的是向前逐步似然比。我们应用这个方法来测试这情感和激励项目最能影响受试者下面的意愿:参观的地方,多度假的地方和给朋友发送该地的照片。
通过这种方式,我们评估这些图片两个类别是否从唤起游客的不同的情绪和动机”的思想和它们是如何影响游客参观案例旅游目的地的意愿。
4.6 结果
我们收集了225份有效问卷。表2报告受试者选择的图片。
对于情感项目,我们得到了第一个类别图片的阿尔法可靠性量表值为0.90(包括在宣传手册)和第二类图片位0.83(不用于促销目的)。第一类的图片动机规模阿尔法值是0.87和第二类为0.79。所有的阿尔法值超过最低量表的门槛0.70(作者)。逻辑回归模型的重合物流是事先分析,实例证明, 项目之间没有共线的问题。
4.6.1 情感评价
三个逻辑回归进行预测的受试者想去的地方,在这些地方度假和发送照片给朋友(因变量)。第一类情感反应图片是独立变量或预测因子。指数的预测表明,赏心悦目、放松和令人兴奋的情感属性依赖是第一类鱼片因变量的具体预测(完成结果请参见表3)。
想要参观第一个类别图片展示地方显著是被取悦变量影响。预测指数显示,价值是5.08,给“取悦”值增加一个单位的优势比,即,这种可能性,即旅游欲望参观地方的值是5.082(表3)。该模型具有较高的预测精度,92.7%的事件被正确分类。
第二个逻辑回归分析检验愿意在第一类图片展示地方度假的情感反应的影响。我们发现指数的参数表示,给游客增加一单位的 “放松”比值增加1.95(表3)。该模型具有较高的预测精度,分类正确72.9%的观察事件。
第三个逻辑回归分析检验情感的影响反应与想给朋友发送第一类图片有关的情感反应。“令人激动的”显着预测输出。参数的指数显示,每给游客增加一单位的 “兴奋”影响渴望寄照片的值是1.954(表3)。当前的模型正确分类81.3%的观察事件。
最后,表4显示了所有的三个模型提供了统计在固定重大改进模型。
关于第二个类别中的图片,三个逻辑回归分析用来检查受试者的情感回应关于渴望参观地方的影响,在该地度假和发送照片给朋友(见表4完整的结果)。
在第一个分析“令人兴奋”的显著预测的受试者行为。参数的指数显示,一个单一的增加在给定的值的受试者“令人兴奋”增加了比值或可能性,旅游欲望访问的地方第二个图片分类下1.696(表4)。这个模型是否正确分类所观察事件的88.4%。
“令人激动的”对在该地旅游也是一个重要的预测。参数的指数表明,一给游客增加一单位的“令人兴奋”增加比值为1.684(表4)。正确的百分比为72.1%的预测精度分类所观察到的事件,是令人满意的。
结果分析表明,第三个“取悦”是一个巨大的预言者的朋友发送图片。指数的预测表明,增加一个单位在“取悦”价值增加了一种可能性,那就是,旅游欲望发送图片从第二个类别2.533(表4)。这个模型是否正确分类所观察事件总数的73.6%,这是一个令人满意的百分比。
卡方测试的结果表明,所有三个模型显著提高预测的结果(表5)。结果表明,两种类型的图片唤起情感反应在受影响他们的愿望:访问目的地在一个不同的方式,有一个度假的地方和代表发送图片。受访者相关的愉悦和放松感官的,希望在第一类别地方参观和度假。从第二个图片类别被认为主要是“令人激动的”影响受试者访问和呆在这些地方的欲望。至于发送的可能性图片,图片从第一类诱导一个兴奋的感觉在受试者的心灵,而第二个类别的图片被认为是愉悦。回归分析的结果积极研究证实本研究的第一个问题。他们证明图片对受试者的行为有一个情感影响和改变他们的旅游目的地形象塑造。
4.6.2 动机分析 逻辑回归分析用来检查动机相关的机制来参观的地方,来该地旅游和给朋友发送图片(见表6完整结果)。
历史吸引力显著预测一个受试者想要去参观第一个类别图片展示地方的可能性。指数的预测表明,历史吸引力规模的单一增长会以3.719增加游客对餐馆地方感兴趣(表6)。我们得到了结果,89.6%的观察事件被正确分类,即模型有一个令人满意的预测的精确性。
支出的空闲时间很重要预测游客的欲望有一个节日在这些地方。它很大程度上预示结果。所显示的指数的预测因子,增加一个单位价值的支出的空闲时间增加了可能性比率3.123(表6)。76%的预测精度值这个模型是令人满意的。
第三个分析等图片的第一类表明“建议”是一个重要的预测。“建议”显著预测的可能性,是一个受试者希望第一个类图片发送给朋友。建议成分每增加一单位把第一类别图片发送给游客的比值增加2.992(表6)。这个模型76%的预测精度值是令人满意的。
预测指标包括在这三种模式导致了统计学显著改善固定模型(表8)。逻辑回归分析是进行检查动机机制关于来参观的地方,来该地度假和发送图片给朋友。我们从第二个类别发现了图像分析的类似模式,但指数值均高于第一套图片图片(请参阅表7完整的结果)。
提出地方支出的空闲时间显著预测去参观它们的可能性。指数的预测表明,支出增加免费时间尺度每增加一单位对应的实现的优势比增加3.300(见表7)。预测模型的准确率为91.5%,这是一个令人满意的百分比。
支出的空闲时间的重要性还在第二个回归分析。这明显预示受试者愿意在第二类图片展示的地方度假。
指数的预测表示受试者免费时间增加每增加一单位,在度假的地方消费的可能性增加4.039(表7)。80.6%的事件被正确分类的,所以模型具有较好的预测精度。
第三个回归分析表明,建议显著预测受试者的行为。指数所显示的那样的预言,每增加一单位建议价值,游客发送图片给朋友的可能性增加5.670(见表7)。该模型的预测精度令人满意,因为它正确分类的76%的事件。
卡方测试的显示,所有三个模型显著提高预测的结果(表8)。我们发现,不同的动机引发受试者想要访问案例旅游目的地。
渴望参观第一个类别地方的的大部分是通过他们的历史魅力影响而支出的空闲时间主要影响了渴望第二个类别参观的地方。在这些地方度假和发送图片被两个类别的图片同样的动机影响:支出空闲时间和建议,分别。指数值所显示的那样,结果还表明, 跟第二个类别图片相关的动机更有可能影响游客像度假和发这些地方照片的可能性。
研究第二个研究问题被支持。图片与影响目的地形成和随之而来游客最终决定的动机有关。
这两个类别的图片唤起了不同的情感反应即使没有他们如何影响游客行为非常显著的证据。然而, 第一类图片的情感反应与第二类相比,隐含低水平的情感参与。至于动机,这两个类别的图片显示了受试者的反应是类似的。最主要的证据在于,第二个类别图片关联的动机更多的积极影响游客的决定这个事实。这可能意味着这图片在目的地形象形成代表的是一个核心的因素。结果有关阿曼泰阿古镇的图片目前没有用作宣传目的,这证明他们可以代表新的感知刺激并能显著地提高旅游业的潜力。这些结果积极证实了研究问题3。结论
本研究为旅游作为一个信息来源以促进案例旅游目的地阿曼泰阿评估了情感、动机和形象决策处理。图片作为刺激被组织分为两个主要类别:图片用于促销目标(第一个类别)并没有使用(第二个类别)。尽管几项研究强调目的地形象在认知和情感的过程的影响,没有系统调查研究分析作为促销目的形象的选择过程。因此,在很多情况下,宣传材料,如小册子,可以包括刻板的图片和信息会负面的影响影游者去参观一下这个地方的旅游动机和他/她的目的地形象形成。正如科特勒和格特纳(2002)认为,刻板的图片是一个极度简化的现实,而这些通常提供很少的旅游目的地的信息。这个调查不同从以前的研究中,因为它探讨了旅游者形象选择促进案例旅游形象目的地应有的价值。因此,主要的研究问题是:两类图片是如何影响游客的情感和动机评估?两不同类别图片影响潜在顾客的决策过程吗?
本研究的案例旅游的目的地是阿曼泰阿南部意大利),其中在尤其是以其古老的城镇卡拉布里亚最出名的度假胜地。问卷包含的情感评估包括是基于罗素的规模(1980),并被用于以前的研究(作者)。旅游动机调查考虑皮尔斯的模型(2005)。最后,通过向受试者注射三个两极化的问题,探讨了游客参观案例目的地的决定。
逻辑回归分析结果表明这两个类别图片有显著的差异。第一个类别中的图片,用于促销的目的,在游客心中唤起的情感相关的放松和愉悦,不显著的刺激他们渴望参观阿曼泰阿。相反,该图片的第二个类别引发了旅游思想更多的情绪激动。这些结果使明显,图片是与目的地感知密切联系。第二个类别的图片变化引起游客行为的变化, 相比第一类他们更感兴趣的选择这些。作为(1990)州,从日常的地方和分离图片确定情感反应和受试者参与的新旧迷人的视觉和情感体验。如上所述,图片用于促销目标是肯定的工具,一个积极的影响旅游目的地精神建设(作者),它们在旅游决策过程可以发挥决定性的作用。
因此,图片,用来促进具体的目的地不仅应该支持的游客们选择度假的地方,但也应该影响旅游行为方面的利益,欲望,尤其旅游体验相关的新行为(作者)。有几个领域也已经研究了在目的地形象,但在旅游领域很少有系统的研究。在这样的框架下,目前的研究还贡献了一些真知灼见,旅游经理专门集中在旅游目的地形象和游客意见之间关系来选择特定的图片,为宣传目的。
从励志的观点,受试者被第二个类别图片所吸引中的原因不同。至于参观第一类图片影响受访者历史吸引力方面的动机。支出的空闲时间的影响渴望参观的地方所倡导的第二个类别的图片。两类图片在来这些地方度假和发照片有同样的动机。然而,幂值表明,受试者更有动力访问用于促进阿曼泰阿第二个类别中的的地方比目前的图片。这些结果是按照之前的研究表明当旅游目的地是积极的感知到的,它影响受试者在个人的动机和决策方面的行为(作者)。在这项研究中很明显如果和第二类别图片有关,动机在决策该过程中有不同影响。古森斯(2000)指出,“从享乐的消费的观点,本文强调了“快乐价值”,并定义了作为一个心理状态的参与动机在一个点上时间特征的认知和情感的自我刺激的好处”(第306页)。同样,虽然该研究没有证明直接关系,很明显,通过视觉刺激来评价性向目的地过程是情绪和动机两个相关的和基本的方面。
随着动机和渴望的游客越来越更复杂的并被吸引越来越变成后台的现实,消费者需求生产的图片那暴露更多的亲密,甚至有争议的现实当地的生活(作者)。在目前的研究中对案例旅游的目的地这似乎是来说尤其如此。作为这些结果一个实际的后果,比较同一目的地的图片可以帮助旅游经理在发展新的旨在促进阿曼泰阿作为旅游目的地的营销战略。
图片之间的关系、情感、动机代表一个重要的因素,旨在满足游客的需求和定义一个投资组合的新旅游景点(作者)。这个研究的结果也反映出那些先前的研究旨在分析照片的角色,他的发现表明,摄影表示在旅游通常可产生标准化目的地图片(作者)。图片也应该有助于开发有竞争力和可持续的旅游目的地,通过提供信息在多元化的潜力地方。
因此,给定的交际的重要性的图片,他们的选择代表一个依据,确定最佳实践促进各种各样的目的地的吸引力和资产。
第二个类别中的图片目前不用于宣传目的。结果表明,它们可能代表新的感知刺激并有助于改善当地的旅游业。
我们认为,拟议的案例旅游目的地在和许多其他几个代表特色的旅游吸引物旅游地但支持传统大量旅游被忽视有共同点(例如,阳光和海洋旅游)。
历史的地方像教堂和纪念碑中视觉表现的旧城镇发挥重要作用主要是因为对有生活经验的人们是很重要的。第一次潜在游客可能会在数以百计的宣传册看到第一个类别图片和不被鼓励深化知识目的地。然而,不能称从旅游的角度来看一些目的地形象没有价值。但他们通常使用的促销的观点建设模式化目的地的形象,它隐藏当地其他的潜力和吸引力。在这样的框架下,旅游经理对地方的熟悉可能消极影响最佳促进活动识别。出于这个原因,我们强调涉及游客选择作为宣传目的图片的重要性。这项研究的结果表明,游客的初步评估增加目的地形象感知的价值。
然而,我们知道,目前的研究结果是不自由的的局限性。从概念的角度来看,我们认为只有几个旅游变量尽管在事实上,旅游目的地形象的形成是一个复杂的研究领域。事实上,逻辑回归分析只包含了一些变量。因此,其他的研究是需要的这些研究问题的调查通过涉及其他目的地和其他图片。从方法论的角度来看,这项研究只涉及意大利课题和研究仅限于相同的旅游目的地两类图片的分析。此外,我们只考虑了代表特定客群户游客的意见。然而,未来的调查应该被引入更大的和广义样品。上述变量影响的泛化了研究结果。这个案例旅游目的地允许结果只将参与者和用作研究的刺激类型泛化。
开始从以往形象认知研究上,通过不同的市场细分(例如年龄、地理和文化的起源)将帮助您了解如何优化旅游目的地促销,强调特殊情感和动机。然后,因为图片仅代表宣传小册子和网站复杂结构的一个元素,未来的研究可以调查旅游手册其他可视化方面的认知, 从情感和认知点看像设计和颜色。营销影响
旧城镇文化遗产及旅游潜力常常被充分开发。在许多情况下,文化的局限性和熟悉性与地方部分上的本地旅游管理人员可以促进本地资源成为成功的旅游发展构成一个障碍。由于旅游业是独特的视觉,照片被认为是派拉蒙,成功地创造和交流旅游目的地(作者)。视觉图片具体创建一个一致的形象,尤其是当目的地是未知的和个人并不熟悉的地方。包括文化景观案例,追求新奇是最重要的旅游激励因素。
因此,采用古板的图片可能会导致创建一个困惑或司空见惯的最初的目的地形象的形成。它是一个可取旅游经理,不同的目标市场的意见和需求是主要考虑的促销计划避免的概括的发展。
增强目的地文化特征主要提供海水—沙滩—阳光,旅游景点将允许一个分化的旅游供给和吸引新的市场领域。
图片不能完全与目的地形象的形成相一致,因为促销工具在小册子和网站像消息和设计是众多而复杂的。然而, 为每个特定的目的地选择合适的和准确的形象无疑是旅游信息搜索后续阶段的一个至关重要的元素。
应答
作者要对这两个匿名裁判和主编克里斯·瑞恩他们有用的评论和在本文早期版本的一个建议表示感谢。通常的免责声明适用。
第五篇:英语论文翻译
心理辅导缺失数据管理的最佳实践 加布里埃尔·l·Schlomer施瑞鲍曼和诺尔卡 亚利桑那大学
这篇文章敦促咨询心理学研究人员识别和报告丢失的数据 处理,因为消费者的研究不能准确地解释发现不知道数量 缺失的数据和模式或策略被用来处理这些数据。缺失的数据模式 综述了,和一些常见的策略来处理他们。作者
提供一个例子,数据模拟和评估3处理缺失数据的方法: 意味着替代,多个归罪,完整的信息极大似然。结果表明, 意味着替代是一个贫穷的方法处理缺失数据,而多个归责和完整 信息极大似然推荐这种方法。作者建议 ,研究人员充分考虑并报告缺失数据的数量和模式和策略 在心理咨询研究和处理这些数据,编辑建议研究人员 期望。
关键词:缺失数据、最佳实践、咨询心理学、多个归罪,完整的信息 最大似然
缺失的数据出现在大多数研究行为科学
(翘起的,2005;埃里森,2005;Orme &里斯,1991;Pigott,2001;史蒂文斯,1996;Streiner,1996),APA特遣部队在统计推断(威尔金森&特遣部队在统计推断, 1999)建议研究人员报告失踪的模式 数据和统计技术用来解决问题
这些数据创建。虽然适当的报告和处理 缺失的数据对于理解至关重要的结果,这个元素 从报告的研究数据分析通常省略(彭, 哈维尔,宾利,&伊曼,2006;桑德斯et al.,2006)。与 增加计算内存和处理速度、复杂
现在可以通过对缺失数据的分析研究人员 没有昂贵的专用软件。然而,许多
研究人员不知道报告的重要性和管理缺失的数据,和编辑基本上没有坚持
作者提供这些基本信息。
最佳实践与研究要求两个缺失的数据 项目的基本信息,应该在每一个报道 研究:(一)缺失数据的范围和性质和(b)程序用于管理缺失的数据,包括使用方法选择的基本原理。在本文中,我们首先检查 最近完成的《咨询
Psychologyto确定作者在这个杂志上有解决这两个项目。然后我们提出建议改善缺失数据报告的期刊文章。最后,我们 提供一个对几种常见的管理方法 缺失的数据为调整的方法和现在的指导方针 处理缺失数据的具体情况研究。目前在网上的咨询 心理学
我们检查了所有的文章在最新的完整的卷(卷55 2008年)的《咨询Psychologyto定位文章 定量数据分析报告。我们发现37(这样的文章 46卷的文章),检查每一个决定 缺失数据的比例是否报道,是否 指定的方法来处理这些数据,是否
方法提供了理论基础。只有14个文章报道 缺失数据的百分比(其中一个指出没有失踪 数据),尽管三其他物品丢失的数据的数量 从其他资料可以推断。在11日的文章中, 方法(陈述或推断)listwise删除;病例 从分析与缺失的数据了。在一篇文章中, 10%以上的情况下缺失的数据被删除listwise,但是 中并未提及nonresponse项是如何处理的 剩余的病例。另外,作者(年代)listwise的合理使用 删除(9%的病例)指出,因为没有意义 排除变量和之间的关系被发现
感兴趣的其他变量,下降情况下没有偏见的结果。Listwise删除被用在另一项研究与解释 缺失数据的数量并不可观,虽然
没有指定的数量。在另一项研究中,意味着替代 丢失的数据时使用小于预定的截止
加布里埃尔·l·Schlomer和诺埃尔卡,家庭研究和划分 亚利桑那大学人类发展,施瑞鲍曼 的残疾和心理教育研究,亚利桑那大学。
作者要感谢黛博拉·m·卡斯珀托马斯c.DeBaca和 阿什利·c·王对他们有用的评论本文的草稿。我们 还要感谢保罗Allison为他计算的建议吗 本文的早期版本。
通信有关这篇文章应该寄给雪莉
鲍曼,残疾和心理教育研究,210069年邮政信箱,图森市亚利桑那大学阿兹8572110 00223884),与这些多个执行很多常见的分析估算数据集和结合这些 结果提供无偏的参数估计与准确 标准错误。Mplus Mplus(我们评估版本5.21)是一个统计建模 项目主要用于评估结构方程模型, 虽然足够灵活,能够执行最基本的(例如。(例如,回归)和复杂。分类数据,潜在类别分析)分析(Muthe´n & Muthe´n,1998-2007)。Mplus也有能力进行MI和FIML。从5.0版本开始, 当命令TYPEMISSING成为默认的过程 分析数据缺失值。在这种默认和使用 ESTIMATORML(最大似然),缺失的数据 FIML处理,这使得它容易的新用户 程序来实现。应该注意,Mplus不是
只有程序FIML功能;其他专门的软件如阿莫斯和采(结构方程建模)和高级别(多级建模)也可以与FIML估计参数。免费下载软件
阿梅利亚II(Honaker、王&布莱克威尔,2009)和规范(版本2.02;网站还包含包含在参考列表 类似的包missingness可能的其他类型的数据 在场)免费下载的程序,执行MI。虽然有一些小的差异可用性和 潜在的污名算法这两个项目, 对于大多数用户来说非常相似的目的。两个程序都可以使用 创建多个估算数据集,并结合参数 估计这些多个数据集,但必须执行 大多数分析这些估算数据集(获得的参数 估计在每个估算数据集)在单独的程序。阿梅利亚接口与R(免费),与S-Plus和标准接口(必须购买),使这些多个分析合理 这些程序的简单用户。总结
五个软件包,我们简要回顾了没有
捕获的全部范围的可能性。几乎每一个统计分析 包有一些功能总结的失踪
数据、评估missingness模式和执行某种类型的 缺失的数据归责。可能软件中最可变性 包来自归责过程。我们建议 使用软件,至少执行随机回归归责, 他们是更好的。最好的方法是MI和FIML 程序,虽然这些可以更难以使用和/或不是 包括在一些包(如。,SAS这些功能;SPSS MI选项添加到MVA模块版本17)。幸运的是, 免费下载的软件可以执行MI即使平常 软件的选择不。一个说明 方法
为了说明上述方法之间的差异, 我们模拟一个数据集的60个参与者。相对较小的样本 大小选择反映了适度的样本大小的
咨询心理学的研究。提供上下文对于这个例子,我们可以想象,这些数据来自60岁以下的客户
21年大型大学心理咨询中心被称为
院长咨询的学生由于侵犯未成年人饮酒。虚拟咨询中心随机分配的学生
两种治疗方案之一,它使用的危害之一 还原方法,和其他基于12步 模型。(即结果。因变量)可能分数
衡量清醒的自我效能感。在这个虚构的示例中,我们 参与者的态度也有一个衡量权威 更高的分数代表更大尊重权威。
这些虚构的数据用SPSS,这样生成的特征数据。我们指定的大小产生影响
通常被认为是大型(r.50)组(伤害的影响 减少与12步)的结果(清醒的自我效能感)。然而,我们也创造了协变量(态度)与大型协会组(r.50)和一个非常大的 相关的结果(r.70)。这些参数估计可以 被确认的数据集可以在在线补充
这篇文章中,“说明样本的语法分析”(请参阅 在线补充材料)。我们接受这个虚构的数据集 各种模式和missingness率来说明不同 结果。具体来说,数据是(a)随机删除
(MCAR)利率为10%,10%,和50%或(b)删除概率的基础上协变量的值(MAR)的
缺失值的结果强烈的可能性负相关(r-.70)协变量,3月的利率 考虑missingness的10%、20%和10%。这3月的情况代表了一个似是而非的场景在我们的说明,它是可能的 学生用更少的尊重权威和强制 参加咨询不太可能完成的测量 这些项目的研究比那些有更多的尊重 权威。
数据被删除,之后失踪的数据处理
三个策略:意味着替换(一个贫穷的处理方法
缺失的数据),心肌梗死,FIML(MI和FIML推荐方法)。利用SPSS归咎于对的意思
替代分析。MI,10个罪名被用于SAS、协变量,占missingness的机制
包括在归责模式。因为FIML是基于模型的, 我们使用一个饱和关联建模技术 3(见格雷厄姆, 2003年)包括协变量(权威)的态度 预测(条件)和结果变量在模型中。使用FIML Mplus被用来估计参数。2 马尔可夫链蒙特卡罗(采样)算法是数学 复杂,充分的描述超出了本文的范围(见SAS 研究所,2008年,页。2008-3784)。获得优势超过他们 缺失的数据模式,是任意的,而不是单调(见SAS 研究所,2008年,p.3766)。3 协变量是包含在模型通过允许它共变 预测和剩余的结果。6 SCHLOMER、鲍曼和卡片
对于每个数据集,我们回归结果(清醒的自我效能感)到集团来评估不同的大小
参与者接受康复治疗(编码为0)那些收到的伤害减少治疗(编码为1), 每组30参与者。请注意,这是回归分析 相当于执行一个独立samplest测试中 两组比较结果(见如。科恩, 1968);unstandardized回归系数在这里报道 int和相当于意味着差异测试。比较 每个方法在不同的相对有效性
(10%、20%、50%)和类型的missingness(MCAR MAR)总结在表1。在表1和在随后的讨论中, 偏见在parametersis定义为不同的百分比 完整的数据结果失踪(0%)和使用结果 不同的方法处理缺失数据的六种不同
数据集与缺失的数据。差异转化为百分比来帮助读者当比较不同方法。结果
意味着替代。表1中可以看出,意味着替代了回归系数和相当大的偏见 标准错误,即使在低水平的missingness,并系统地低估了平均值差异和标准错误。
令人惊讶的是,意味着替代倾向于执行更糟糕的是,平均而言,在MCAR(回归coefficient27.55%;标准 error13.42%)与3月相比(回归系数 25.00%;标准error9.59%)。这可以归因于 异常表现不佳MCAR 50%。条件下 极度缺失的数据(例如50%),意味着替代执行 极其糟糕的MCAR和3月的情况
整体导致45.31%的偏差计算回归系数和23.23%偏差在标准错误。此外,意味着
替换更常见的大量缺失的数据(如。,不含缺失数据50%)继续导致相当大的偏差
回归系数(16.76%)和标准错误(5.64%)。多个归责。正如所料,MI表现良好 常见的大量缺失的数据,在严重的相当不错 大量的丢失的数据。在常见的大量缺失的数据(如。、10%和20%),心肌梗死导致平均偏差为11.42% 回归系数和标准误差为7.3%。缺失的数据极端时,回归系数是有偏见的
12.05%和12.05%的标准误差平均水平。比较 MCAR下的偏见与3月透露,心肌梗死导致 估计回归系数在3月更多的偏见
(15.22%)与MCAR(8.03%)相比,同样是真的 估计标准误差(3月:15.34%;MCAR:15.34%)。然而,这些差异很先进的
意味着替代。总的来说,心肌梗死导致11.63%的偏见回归 系数和标准偏差12.46%错误。最大的偏差 在3月的20%,回归系数为21.67% 结论对缺失的数据
我们强烈敦促作者遵循最佳实践报告 处理缺失数据,我们敦促编辑建立政策 坚持认为缺失的数据是出席在定量的文章。如果不这样做,就意味着发现和解释
结果,可能很有偏见。结论(或确定政策)的基础上有偏见的结果不科学 事实上,可能需要在一个不合适的方向。在心理咨询领域,scientist-practitioner 模型是培训和实践的基础
构造。如果科学准确地通知实践,它不得 忽视会计等良好的科学的一个重要元素 缺失的数据是如此常见的研究。就像 研究人员经常屏幕前和清洁他们的数据分析 和收集描述性数据的样本,他们应该 缺失的数据分析系统的第一步的一部分数据 分析。研究人员知道他们必须报告回应率 调查数据,包括统计上显著的影响大小 结果。准确的报道的相同的期望应该适用 缺失的数据管理。忽略这一步是可怜的科学, 和结果报告没有注意缺失的数据就误传我们科学理解和误导的政策和实践。我们相信心理咨询领域的努力 传播,因此必须高质量研究 报告缺失数据领域的最佳实践。讨论
在本文中,我们研究了三种不同的方法来处理
缺失的数据:意味着替代,MI,FIML。独立samplesttests的结果表明,与此前许多一致 研究,意味着替代是一个可怜的处理的首选方法
缺失的数据(Allison,2001;班纳特,2001;格雷厄姆et al., 2003;Pallant,2007)。在我们的例子,意味着替代
归责方法导致明显的偏见回归系数和标准误差即使的数量 缺失的数据是典型的(如。、10%和20%)。此外,意味着 当缺失的数据替换导致相当大的偏见 严重(50%)。观察到的偏见意味着替换时使用 咨询心理学家,应该是相当大的关注 因为标准的系统错误是高估了, 导致减少电力检测效果
礼物。因此,我们强烈建议不要使用的意思 替代的方法改动缺失的数据。在我们的虚构的 例子,意味着替换可能会引导我们得出这样的结论: 没有差异(或只有微小差别)之间的两个 咨询方法对学生自我效能感的清醒, 当事实上,实际上是一个温和的或者大的差异。在 实践中,这可能会导致一个错误的决定提供治疗 小的效果。
所以如果意味着替代是一个贫穷的选择,什么其他的选择 研究人员?我们这里显示,符合多 理论和仿真工作之前
文章中,心肌梗死和FIML方法都是可行的策略来处理缺失数据。在我们的示例中,两个小姐和FIML提供
可接受的估计回归系数和标准错误在两种类型的缺失数据(MCAR和MAR)缺失的数据在10%和10%。虽然不是分析
这项研究中,心肌梗死和FIML也表明当数据执行的相当好NMAR和丢失的数据的数量
适中(如。,25%;Buhi,古德森& Neilands,2008)。尽管MI和FIML表现意味着替代,因为
他们介绍了足够的偏见时关注的数据 失踪在50%,我们建议,当严重的失踪 数据存在,咨询心理学家利用额外的 辅助变量,可能为了预测缺失值
改善缺失的数据模型和后续分析。这两个
这些方法(MI FIML)将允许更多的信息,更有效的治疗方法。