淘宝技术架构发展总结（写写帮推荐）

第一篇：淘宝技术架构发展总结（写写帮推荐）

从个人网站到淘宝网仰观Java时代淘宝的技术发展(1)

引言

光棍节的狂欢

“时间到，开抢！”坐在电脑前早已等待多时的小美一看时间已到2011年11月11日零时，便迫不及待地投身于淘宝商城一年一度的大型网购促销活动——“淘宝双11购物狂欢节”。小美打开早已收藏好的宝贝——某品牌的雪地靴，飞快的点击购买，付款，一回头发现3000双靴子已被抢购一空。

小美跳起来，大叫一声“欧耶！”

小美不知道，就在11日零点过后的这一分钟内，全国有342万人和她一起涌入淘宝商城。当然，她更不知道，此时此刻，在淘宝杭州的一间办公室里，灯火通明，这里是“战时指挥部”，淘宝技术部的一群工程师，正在紧盯着网站的流量和交易数据。白板上是他们刚刚下的注，赌谁能最准确地猜中流量峰值和全天的交易总额。他们的手边放着充足的食物和各类提神的饮料。

一阵急促的电话声响起来，是前线部门询问数据的，工程师大声报着：“第1分钟，进入淘宝商城的会员有342万”。过一会工程师主动拿起电话：“交易额超过1亿了，现在是第8分钟。”接下来，“第21分钟，刚突破2亿”。“第32分钟，3亿了”。“第1个小时，4.39亿”。这些数据随后出现在微博上，引起一片惊呼。

“完蛋了！”突然有人大喝一声，所有的眼睛都紧张的盯着他，只见他挠挠头，嘿嘿的笑道“我赌的少了，20亿轻松就能过了，我再加5亿”，他跑去白板边上把自己的赌注擦去，写上25，接下来有人写上28，有人写上30，有人跑到微博上开下盘口，同事们纷纷转载下注。接下来的这24个小时，战时指挥部的工程师们都不能休息，他们盯着网站的各种监控指标，适时的调整机器和增减功能。顶住第一波高峰之后，这些人开始忙里偷闲的给自己买东西，大家互相交流着哪家买的移动硬盘靠谱，哪家衣服适合自己的女朋友，不时的有人哀嚎宝贝被人抢了、信用卡额度不够了。同时，旁边白板上的赌注越下越大。

11月11日，这个棍子最多的日子被网民自我调侃的变成了一个节日——“光棍节”。而淘宝网又用疯狂的折扣促销给它赋予了另外一个意义——“购物狂欢节”。2011年11月11日这一天，淘宝商城与淘宝网交易额之和突破52亿，这个数字是“购物天堂”香港一天零售总额8.5亿的6倍。

网民感受到的是疯抢的喜悦，而网站的技术人员感受到的却是“压力山大”。就如同你家办酒席，宴请左邻右舍，这个办起来容易。倘若宴请十里八乡所有的人，吃饭的人自然开心，但却不是一般人家能够办得起来的。能办得起来如此盛宴者，需要强大的财力物力、组织能力、技术实力（例如做这么多菜，你的炒锅一定要是“分布式的”、“可复制的”、“可扩展的”，洗菜切菜要有“工作流引擎”，上菜的路径要用图论来计算出来，甚至连厨房的下水道都要重新设计）。

淘宝能够举办如此盛宴，网站的技术实力可见一斑。淘宝网拥有全国最大的hadoop分布式计算集群之一，日新增数据50TB，有40PB海量数据存储。分布在全国各地80多个节点的CDN网络，支持的流量超过800Gbps。淘宝的搜索引擎能够对数十亿的商品数据进行实时搜索，另外还拥有自主研发的文件存储系统和缓存系统，以及java中间件和消息中间件系统，这一切组成了一个庞大的电子商务操作系统。另外从商业数据上来看，AMAZON的财报显示2011年完成了大约 480亿美金的交易额，EBAY2011年财报全年完成了大约600亿美金的交易额（不包括其独立的汽车交易平台）。不管从交易额、商品数量、同比增速等指标上看，淘宝网均远超于此，是目前全球最大的电子商务平台。（由于淘宝非上市公司，未公布2011年业绩，以上内容来自淘宝网技术副总裁@_行癫的微博）

以上这些技术数据可能已经让一些同学产生不适的感觉，为了让更多的人读懂这本书，我们从技术的角度来看，小美访问淘宝网的时候，网站上发生了什么事情。下参考资料：《你刚才在淘宝上买了一件东西【技术普及帖】》，来自南京邮电大学孙放同学

为了有个更直观的对比，我们说一个同行，他在2011年光棍节之前做促销，流量上去之后，达到12Gbps（他们有这么大的流量，老板很高兴，在微博上面说了这个数据），这时候流量达到了极限，网站几乎挂掉，用户无法下订单。而淘宝网光棍节当天网络的流量最高达到800多Gbps，带给各家银行和快递公司的流量也让他们压力山大，如临大敌（后来，他们以能够撑住淘宝带来的流量为荣而到处宣传）。另外如果你在网上购买过火车票的话，更能体会到网站能支持多大的流量有多重要。但这不是一朝一夕做出来的，也不是有钱就能办到的。

以上对比的这些网站，也许读者很容易就猜到是哪一家，这里拿出来作对比，绝对没有嘲笑人家的意思，采用通常的网站技术方案，能做到这种程度已经不错了。任何网站的发展都不是一蹴而就的，在什么样的阶段采用什么样的技术。在发展的过程中网站会遇到各种各样的问题和业务带来的压力，正是这些原因才推动着技术的进步和发展，而技术的发展又会反过来促进业务的更大提升。二者互为因果，相互促进。如今淘宝网的流量已经是全球排名第12、国内排名第3（美国的ebay全球排名23，国内前两名是百度和腾讯）。淘宝网的系统也从使用一台服务器，到采用万台以上的服务器。本书就为大家描述淘宝网在整个发展过程中，所有的主动和被动的技术变革的前因后果，这由很多有趣的故事组成。

正如同很多人或组织成功了以后，就会为自己的出身编造一个美丽的传说。淘宝网的出身，网上也有非常多的传说，下面我们就从它的出生开始讲起。个人网站

2003年4月7日，马云，在杭州，成立了一个神秘的组织。他叫来十位员工，要他们签了一份协议，这份协议要求他们立刻离开阿里巴巴，去做一个神秘的项目。这个项目要求绝对保密，老马戏称“连说梦话被老婆听到都不行，谁要是透漏出去，我将追杀到天涯海角”。这份协议是英文版的，匆忙之间，大多数人根本来不及看懂，但出于对老马的信任，都卷起铺盖离开了阿里巴巴。

他们去了一个神秘的据点——湖畔花园小区的一套未装修的房子里，房子的主人是马云。这伙人刚进去的时候，马云给他们布置了一个任务，就是在最短的时间内做出一个个人对个人（C2C）的商品交易的网站。现在出一个问题考考读者，看你适不适合做淘宝的创业团队。亲，要是让你来做，你怎么做？

在说出这个答案之前，容我先卖个关子，介绍一下这个创业团队的成员：三个开发工程师（虚竹、三丰、多隆）、一个UED（二当家）、三个运营（小宝、阿珂、破天）、一个经理（财神）、还有就是马云和他的秘书。当时对整个项目组来说压力最大的就是时间，怎么在最短的时间内把一个从来就没有的网站从零开始建立起来？了解淘宝历史的人知道淘宝是在2003年5月10日上线的，这之间只有一个月。要是你在这个团队里，你怎么做？我们的答案就是：买一个来。

买一个网站显然比做一个网站要省事一些，但是他们的梦想可不是做一个小网站而已，要做大，就不是随便买个就行的，要有比较低的维护成本，要能够方便的扩展和二次开发。那接下来就是第二个问题：买一个什么样的网站？答案是：轻量一点的，简单一点的，于是买了这样一个架构的网站：LAMP（linux+apache+mySQL+PHP）。这个直到现在还是一个很常用的网站架构模型。这种架构的优点是：无需编译，发布快速，PHP功能强大，能做从页面渲染到数据访问所有的事情，而且用到的技术都是开源的，免费。

当时我们是从一个美国人那里买来的一个网站系统，这个系统的名字叫做PHPAuction（他们的官方网站 http://），这个框架易于扩展，方便组件化开发，它的页面模板支持JSP和velocity等、持久层支持ibatis和hibernate等、控制层可以用EJB和Spring（Spring是后来才有的）。项目组选择了这个强大的框架，这个框架如果当时开源了，也许就没有webwork和struts2什么事了。另外，当时Sun在全世界大力推广他们的EJB，虽然淘宝的架构师认为这个东东用不到，但他们还是极力坚持。在经历了很多次的技术讨论、争论和争吵之后，这个系统的架构就变成了下图的样子：

Java应用服务器是Weblogic，MVC框架是WebX、控制层用了EJB、持久层是ibatis，另外为了缓解数据库的压力，商品查询和店铺查询放在搜索引擎上面。这个架构图是不是好看了一点了，亲？

这帮Sun的工程师开发完淘宝的网站之后，又做了一个很牛的网站，叫“支付宝”。

其实在任何时候，开发语言本身都不是系统的瓶颈，业务带来的压力更多的是压到了数据和存储上。上面一篇也说到，MySQL撑不住了之后换Oracle，Oracle的存储一开始在本机上，后来在NAS上，NAS撑不住了用EMC的SAN存储，再然后Oracle的RAC撑不住了，数据的存储方面就不得不考虑使用小型机了。在2004年的夏天，DBA七公、测试工程师郭芙和架构师行癫，踏上了去北京测试小型机的道路。他们带着小型机回来的时候，我们像欢迎领袖一样的欢迎他们，因为那个是我们最值钱的设备了，价格表上的数字吓死人。小型机买回来之后我们争相合影，然后Oracle就跑在了小型机上，存储方面从EMC低端cx存储到Sun oem hds高端存储，再到EMC dmx高端存储，一级一级的往上跳。

到现在为止，我们已经用上了IBM的小型机、Oracle的数据库、EMC的存储，这些东西都是很贵的，那些年可以说是花钱如流水啊。有人说过“钱能解决的问题，就不是问题”，但随着淘宝网的发展，在不久以后，钱已经解决不了我们的问题了。花钱买豪华的配置，也许能支持1亿PV的网站，但淘宝网的发展实在是太快了，到了10亿怎么办？到了百亿怎么办？在N年以后，我们不得不创造技术，解决这些只有世界顶尖的网站才会遇到的问题。后来我们在开源软件的基础上进行自主研发，一步一步的把IOE（IBM小型机、Oracle、EMC存储）这几个“神器”都去掉了。这就如同在《西游记》里面，妖怪们拿到神仙的兵器会非常厉害，连猴子都能够打败，但最牛的神仙是不用这些神器的，他们挥一挥衣袖、翻一下手掌就威力无比。去IOE这一部分会在最后一个章节里面讲，这里先埋个千里伏笔。

欲知后事如何，且听下回分解。

已经有读者在迫不及待的问怎么去掉了IOE，别急，在去掉IOE之前还有很长的路要走。行癫他们买回来小型机之后，我们用上了Oracle，七公带着一帮DBA在优化SQL和存储，行癫带着几个架构师在研究数据库的扩展性。Oracle本身是一个封闭的系统，用Oracle怎么做扩展？用现在一个时髦的说法就是做“分库分表”。

我们知道一台Oracle的处理能力是有上限的，它的连接池有数量限制，查询速度跟容量成反比。简单的说，在数据量上亿、查询量上亿的时候，就到它的极限了。要突破这种极限，最简单的方式就是多用几个Oracle数据库。但一个封闭的系统做扩展，不像分布式系统那样轻松。我们把用户的信息按照ID来放到两个数据库里面（DB1/DB2），把商品的信息跟着卖家放在两个对应的数据库里面，把商品类目等通用信息放在第三个库里面(DBcommon)。这么做的目的除了增加了数据库的容量之外，还有一个就是做容灾，万一一个数据库挂了，整个网站上还有一半的数据能操作。

数据库这么分了之后，应用程序有麻烦了，如果我是一个买家，买的商品有DB1的也有DB2的，要查看“我已买到的宝贝”的时候，应用程序怎么办？必须到两个数据库里面分别查询出来对应的商品。要按时间排序怎么办？两个库里面“我已买到的宝贝”全部查出来在应用程序里面做合并。还有分页怎么处理？关键字查询怎么处理？这些东西交给程序员来做的话会很悲催，于是行癫在淘宝的第一个架构上的作品就来解决了这个问题，他写了一个数据库路由的框架DBRoute，这个框架在淘宝的Oracle时代一直在使用。后来随着业务的发展，这种分库的第二个目的——容灾的效果就没有达到。像评价、投诉、举报、收藏、我的淘宝等很多地方，都必须同时连接DB1和DB2，哪个库挂了都会导致整个网站挂掉。上一篇说过，采用EJB其实是和Sun的工程师妥协的结果，在他们走了之后，EJB也逐渐被冷落了下来。在05、06年的时候，spring大放异彩，正好利用spring的反射（IoC）模式替代了EJB的工厂模式，给整个系统精简了很多代码。

上一篇还说过，为了减少数据库的压力，提高搜索的效率，我们引入了搜索引擎。随着数据量的继续增长，到了2005年，商品数有1663万，PV有8931万，注册会员有1390万，这给数据和存储带来的压力依然山大，数据量大，性能就慢。亲，还有什么办法能提升系统的性能？一定还有招数可以用，这就是缓存和CDN（内容分发网络）。

你可以想象，九千万的访问量，有多少是在商品详情页面？访问这个页面的时候，数据全都是只读的（全部从数据库里面读出来，不写入数据库），如果把这些读操作从数据库里面移到内存里，数据库将会多么的感激涕零。在那个时候我们的架构师多隆大神，找到了一个基于 Berkeley DB 的开源的缓存系统，把很多不太变动的只读信息放了进去。其实最初这个缓存系统还比较弱，我们并没有把整个商品详情都放在里面，一开始把卖家的信息放里面，然后把商品属性放里面，商品详情这个字段太大，放进去受不了。说到商品详情，这个字段比较恐怖，有人统计过，淘宝商品详情打印出来平均有5米长，在系统里面其实放在哪里都不招人待见。笔者清楚的记得，我来淘宝之后担任项目经理做的第一个项目就是把商品详情从商品表里面给移出来。这个字段太大了，查询商品信息的时候很多都不需要查看详情，它跟商品的价格、运费这些放在一个表里面，拖慢了整个表的查询速度。在05年的时候，我把商品详情放在数据库的另外一张表里面，再往后这个大字段被从数据库里面请了出来，这也让数据库再一次感激涕零。

到现在为止，整个商品详情的页面都在缓存里面了，眼尖的读者可能会发现现在的商品详情不全是“只读”的信息了，这个页面上有个信息叫“浏览量”，这个数字每刷新一次页面就要“写入”数据库一次，这种高频度实时更新的数据能用缓存吗？如果不用缓存，一天几十亿的写入，数据库会怎么样？一定会挂掉。那怎么办？亲„„

CDN这个工作相对比较独立，跟别的系统一样，一开始我们也是采用的商用系统。后来随着流量的增加，商用的系统已经撑不住了，LVS的创始人章文嵩博士带人搭建了淘宝自己的CDN网络。在本文的引言中我说过淘宝的CDN系统支撑了800Gbps以上的流量，作为对比我们可以看一下国内专业做CDN的上市公司ChinaCache的介绍——“ChinaCache„„是中国第一的专业CDN服务提供商，向客户提供全方位网络内容快速分布解决方案。作为首家获信产部许可的CDN服务提供商，目前ChinaCache在全国50多个大中城市拥有近300个节点，全网处理能力超过500Gbps，其CDN网络覆盖中国电信、中国网通、中国移动、中国联通、中国铁通和中国教育科研网等各大运营商。”——这样你可以看得出淘宝在CDN上面的实力，这在全世界都是数一数二的。另外因为CDN需要大量的服务器，要消耗很多能源（消耗多少？在前两年我们算过一笔帐，淘宝上产生一个交易，消耗的电足以煮熟4个鸡蛋）。这两年章文嵩的团队又在研究低功耗的服务器，在绿色计算领域也做了很多开创性的工作。淘宝CDN的发展需要专门一个章节来讲，想先睹为快的可以看一下笔者对章文嵩的专访：http://qing.weibo.com/1866752224/6f4460e033000jme.html 回想起刚用缓存那段时间，笔者还是个小菜鸟，有一个经典的错误常常犯，就是数据库的内容更新的时候，忘记通知缓存系统，结果在测试的时候就发现我改过的数据怎么在页面上没变化呢。后来做了一些页面上的代码，修改CSS和JS的时候，用户本地缓存的信息没有更新，页面上也会乱掉，在论坛上被人说的时候，我告诉他用ctrl+F5刷新页面，然后赶紧修改脚本文件的名称，重新发布页面。学会用ctrl+F5的会员对我佩服的五体投地，我却惭愧的无地自容。

有些技术的发展是顺其自然的，有些却是突如其来的。到2007年的时候，我们已经有几百台应用服务器了，这上面的java应用服务器是weblogic，而weblogic是非常贵的，比这些服务器本身都贵。有一段时间多隆研究了一下jboss，说我们换掉weblogic吧，于是又省下了不少银两。那一年，老马举办了第一届的“网侠大会”，会上来的大侠中有一位是上文提到的章文嵩，还有一位曾经在jboss团队工作，我们也把这位大侠留下了，这样我们用起jboss更加有底气了。

这些杂七杂八的修改，我们对数据分库、放弃EJB、引入Spring、加入缓存、加入CDN、采用开源的Jboss，看起来没有章法可循，其实都是围绕着提高容量、提高性能、节约成本来做的，由于这些不算大的版本变迁，我们姑且叫它2.1版吧，这个版本从构图上来看有3只脚，是不是稳定了很多？

架构图如下：

下集预告：创造技术分布式文件系统TFS、分布式kv缓存tair、搜索引擎升级

第二篇：java技术架构

Java技术体系图

Java程序员

高级特性

反射、泛型、注释符、自动装箱和拆箱、枚举类、可变

参数、可变返回类型、增强循环、静态导入

核心编程

IO、多线程、实体类、集合类、正则表达式、XML和属性文件

图形编程

AWT（Java2D/JavaSound/JMF）、Swing、SWT、JFace

网路编程

Applet、Socket/TCP/UDP、NIO、RMI、CORBA

Java语法基础

类、抽象类、接口、最终类、静态类、匿名类、内部类、异常类、编码规范

Java开发环境

JDK、JVM、Eclipse、Linux

Java核心编程技术

Java，设计而又非常精巧的语言。学习Java，须从Java开发环境开始，到Java语法，再到Java的核心API。

1.Java开发入门：Java开发环境的安装与使用，包括JDK命令、EclipseIDE、Linux下Java程序的开发和部署等。

2.Java语法基础：基于JDK和Eclipse环境，进行Java核心功能开发，掌握Java面向对象的语法构成，包括类、抽象类、接口、最终类、静态类、匿名类、内部类、异常的编写。

3.Java核心API：基于JDK提供的类库，掌握三大核心功能：

A。Java核心编程:包括Java编程的两大核心功能——Java输入/输出流和多线程，以及常用的辅助类库——实体类、集合类、正则表达式、XML和属性文件。

B。Java图形编程：包括Sun的GUI库AWT（Java2D、JavaSound、JMF）和Swing，IBM和GUI库SWT和Jface;

C.Java网路编程：Applet组件编程，Socket编程，NIO非阻塞Socket编程、RMI和CORBA分布式开发。

4.Java高级特性：掌握JDK1.4、JDK5.0、JDK6.0中的Java高级特性，包括反射、泛型、注释，以及java高级特性——自动装箱和拆箱、枚举类、可变参数、可变返回类型、增强循环、静态导入等。

JavaEE初级软件工程师

JSF框架开发技术

配置文件（页面导航、后台Bean）、JSF组件库（JSF EL语言、HTML标签、事件处理、）、JSF核心库（格式转换、输入验证、国际化）

Javaweb核心开发技术

开发环境（Eclipse、Linux）

三大组件（JSP、JavaBean、Servlet）

扩展技术（EL、JSTL、Taglib）

网页开发技术

HTML、XML、CSS、JavaScript、AJAX

数据库设计技术

SQL、MySql、Oracle、SQLServer、JDBC

Web服务器（Tomcat/Jetty/Resin/JBossWeb）

JavaWeb核心技术：

JavaWeb项目开发的全过程可以分解为：

网页开发+数据库设计——>JavaWeb项目开发，其中，javaWeb由6项基本技术组成：JSP+JavaBean+Servlet+EL+JSTL+Taglib，而JSF正是将这6种技术进行有机结合的技术框架：

JavaEE中级软件工程师

四种经典架构SSH1、SSI1、SSH2、SSI2

Struts1表现层框架

入门配置、核心组件、标签库、国际化、数据检验、数据库开发、Sitemesh集成、集成Hibernate/iBATIS

Struts2表现层框架

入门配置、核心组件、标签库、国际化、数据校验、Sitemesh集成转换器、拦截器、集成Hibernate/iBATIS

Spring业务层框架

入门配置、IoC容器、MVC、标签库、国际化、数据校验、数据库开发

Hibernate持久层框架

MySQL、Oracle、SQLServer iBATIS持久层框架

MySQL、Oracle、SQLServer

Web服务器（Tomcat/Jetty/Resin/JBossWeb）

Java高级软件工程师

javaWeb开源技术与框架

工作流、规则引擎

搜索引擎、缓存引擎、任务调度、身份认证

报表服务、系统测试、集群、负载平衡、故障转移

JavaWeb分布式开发技术

JTA（Java事物管理）

JAAS（Java验证和授权服务）

JNDI（Java命名和目录服务）

JavaMail（Java邮件服务）

JMS（java信息服务）

WebService(web服务)

JCA（java连接体系）

JMS（java管理体系）

应用服务器（JBossAS/WebLogic/WebSphere）

JavaEE系统架构师

面向云架构（COA）

COA、SaaS、网格计算、集群计算、分布式计算、云计算

面向资源架构（ROA）

ROA、RESI

面向web服务架构（SOA）

WebService、SOA、SCA、ESB、OSGI、EAI

Java设计模式

创建式模式：抽象工厂/建造者/工厂方法/原型/单例

构造型模式：适配器/桥接/组合/装饰/外观/享元/代理

行为型模式：责任链/命令/解释器/迭代子/中介者/备忘录/观察者/状态/策略/模板方法/访问者

Java与UML建模

对象图、用例图、组件图、部署图、序列图、交互图、活动图、正向工程与逆向工程

CTO首席技术官

发展战略

技术总监

团队提升

团队建设

项目管理

产品管理

第三篇：大型网站架构设计及技术总结

大型网站架构设计及技术总结

随着中国大型IT企业信息化速度的加快，大部分应用的数据量和访问量都急剧增加，大型企业网站正面临性能和高数据访问量的压力，而且对存储、安全以及信息检索等等方面都提出了更高的要求„„

本文中，我想通过几个国外大型IT企业及网站的成功案例，从Web技术人员角度探讨如何积极地应对国内大型网站即将面临的扩展（主要是技术方面，而较少涉及管理及营销等方面）矛盾。

一、国外大型IT网站的成功之道

(一)MySpace

今天，MySpace已经成为全球众口皆碑的社区网站之王。尽管一流和营销和管理经验自然是每个IT企业取得成功的首要因素，但是本节中我们却抛弃这一点，而主要着眼于探讨在数次面临系统扩张的紧急关头MySpace是如何从技术方面采取应对策略的。

第一代架构—添置更多的Web服务器

MySpace最初的系统很小，只有两台Web服务器（分担处理用户请求的工作量）和一个数据库服务器（所有数据都存储在这一个地方）。那时使用的是Dell双CPU、4G内存的系统。在早期阶段，MySpace基本是通过添置更多Web服务器来对付用户暴增问题的。但到在2004年早期，在MySpace用户数增长到五十万后，其数据库服务器已经开始疲于奔命了。

第二代架构—增加数据库服务器

与增加Web服务器不同，增加数据库并没那么简单。如果一个站点由多个数据库支持，设计者必须考虑的是，如何在保证数据一致性的前提下让多个数据库分担压力。

MySpace运行在三个SQL Server数据库服务器上—一个为主，所有的新数据都向它提交，然后由它复制到其它两个；另两个数据库服务器全力向用户供给数据，用以在博客和个人资料栏显示。这种方式在一段时间内效果很好——只要增加数据库服务器，加大硬盘，就可以应对用户数和访问量的增加。

这一次的数据库架构按照垂直分割模式设计，不同的数据库服务于站点的不同功能，如登录、用户资料和博客。垂直分割策略利于多个数据库分担访问压力，当用户要求增加新功能时，MySpace只需要投入新的数据库加以支持。在账户到达二百万后，MySpace还从存储设备与数据库服务器直接交互的方式切换到SAN（存储区域网络）—用高带宽、专门设计的网络将大量磁盘存储设备连接在一起，而数据库连接到SAN。这项措施极大提升了系统性能、正常运行时间和可靠性。然而，当用户继续增加到三百万后，垂直分割策略也变得难以维持下去。

第三代架构—转到分布式计算架构

几经折腾，最终，MySpace将目光移到分布式计算架构——它在物理上分布的众多服务器，整体必须逻辑上等同于单台机器。拿数据库来说，就不能再像过去那样将应用拆分，再以不同数据库分别支持，而必须将整个站点看作一个应用。现在，数据库模型里只有一个用户表，支持博客、个人资料和其他核心功能的数

据都存储在相同数据库。

既然所有的核心数据逻辑上都组织到一个数据库，那么MySpace必须找到新的办法以分担负荷——显然，运行在普通硬件上的单个数据库服务器是无能为力的。这次，不再按站点功能和应用分割数据库，MySpace开始将它的用户按每百万一组分割，然后将各组的全部数据分别存入独立的SQL Server实例。目前，MySpace的每台数据库服务器实际运行两个SQL Server实例，也就是说每台服务器服务大约二百万用户。据MySpace的技术人员说，以后还可以按照这种模式以更小粒度划分架构，从而优化负荷分担。

第四代架构—求助于微软方案

2005年早期，账户达到九百万，MySpace开始用微软的C#编写ASP.NET程序。在收到一定成效后，MySpace开始大规模迁移到ASP.NET。

账户达到一千万时，MySpace再次遭遇存储瓶颈问题。SAN的引入解决了早期一些性能问题，但站点目前的要求已经开始周期性超越SAN的I/O容量——即它从磁盘存储系统读写数据的极限速度。

第五代架构—增加数据缓存层并转到支持64位处理器的SQL Server 20052005年春天，MySpace账户达到一千七百万，MySpace又启用了新的策略以减轻存储系统压力，即增加数据缓存层——位于Web服务器和数据库服务器之间，其唯一职能是在内存中建立被频繁请求数据对象的副本，如此一来，不访问数据库也可以向Web应用供给数据。

2005年中期，服务账户数达到两千六百万时，MySpace因为我们对内存的渴求而切换到了还处于beta测试的支持64位处理器的SQL Server 2005。升级到SQL Server 2005和64位Windows Server 2003后，MySpace每台服务器配备了32G内存，后于2006年再次将配置标准提升到64G。

事实上，MySpace的Web服务器和数据库仍然经常发生超负荷，其用户频繁遭遇“意外错误”和“站点离线维护”等告示，他们不得不在论坛抱怨不停„„

MySpace正是在这样不断重构站点软件、数据库和存储系统中，才一步步走到今天。事实上，MySpace已经成功解决了很多系统扩展性问题，其中存在相当的经验值得我们借鉴。MySpace系统架构到目前为止保持了相对稳定，但其技术人员仍然在为SQL Server支持的同时连接数等方面继续攻坚，尽可能把事情做到最好。

(二)Amazon

亚马逊书店无疑是电子商务发展的里程碑。2000年到现在，世界网络业腥风血雨。Amazon曾经成为网络泡沫的头号代表。如今，当这个“最大的泡沫”用几经易改的数字把自己变成了坚实的IT巨人。

历览Amazon发展过程，其成功经验在于，它创造性地进行了电子商务中每一环节的探索，包括系统平台的建设，程序编写、网站设立、配送系统等等方面。用Amazon当家人贝索斯的话说就是，“在现实世界的商店最有力的武器就是地

段，地段，地段，而对于我们来说最重要的三件事就是技术，技术，技术。”

(三)eBay

eBay是世界闻名的拍卖网站，eBay公司通信部主管凯文?帕斯格拉夫认为，“eBay成功的最重要原因在于公司管理和服务。”

其成功的奥秘可以列举为以下几点：

①敢为天下先—在网络尚不普及的时代，eBay率先进入网络拍卖领域；②依托虚拟商场所产生的特有的“零库存”是eBay公司取得成功的另一个重要原因。该公司的核心业务没有任何库存风险，所有的商品都是由客户提供，它只需要负责提供虚拟的拍卖平台—网络和软件。所以，eBay公司的财务报表上不会出现“库存费用”和“保管费用”等。

③自eBay公司成立开始，它就一直遵循两条“黄金原则”：建设虚拟社区，给网民以家的感觉；保证网站稳定安全地运行。

二、国内大型网站开发时的几点建议

从本节开始，我们将结合国内外大型IT网站在技术扩展方面的沉痛教训和成功经验，探讨在如今刚刚开始的Web 2.0时代如何应对国内网站即将面临的数据访问量增加（甚至是急剧膨胀）的问题，并提出一些供参考的策略和建议。

(四)搭建科学的系统架构

构建大型的商业网站绝对不可能像构建普通的小型网站一样一蹴而就，需要从严格的软件工程管理的角度进行认真规划，有步骤有逻辑地进行开发。对于大型网站来说，所采用的技术涉及面极其广泛，从硬件到软件、编程语言、数据库、Web服务器、防火墙等各个领域都有了很高的要求，已经不是原来简单的html静态网站所能比拟的。以著名的Yahoo!为例，他们的每一个大型网站工程都需要大量相应专业人员的参与。

(五)页面静态化

可不要小看纯静态化的HTML页面！其实在很多情况下，HTML往往意味着“效率最高、消耗最小”，所以我们尽可能使我们的网站上的页面采用静态页面来实现。但是，对于大量内容并且频繁更新的网站，我们无法全部手动实现，因此可以开发相应的自动化更新工具，例如我们常见的信息发布系统CMS。像我们经常访问的各个门户站点的新闻频道，甚至他们的其他频道，都是通过信息发布系统来管理和实现的。信息发布系统可以实现最简单的信息录入自动生成静态页面，还能具备频道管理、权限管理、自动抓取等功能，对于一个大型网站来说，拥有一套高效、可管理的CMS是必不可少的。

(六)存储问题

存储也是一个大问题，一种是小文件的存储，比如图片这类；另一种是大文件的存储，比如搜索引擎的索引。

大家知道，对于Web服务器来说，不管是Apache、IIS还是其他容器，图片是最消耗资源的，于是我们有必要将图片与页面进行分离，这是基本上大型网站都会采用的策略，他们都有独立的图片服务器，甚至很多台图片服务器。这样的架构可以降低提供页面访问请求的服务器系统压力，并且可以保证系统不会因为图片问题而崩溃，在应用服务器和图片服务器上，可以进行不同的配置优化以保证更

高的系统消耗和执行效率。

(七)数据库技术—集群和库表散列

对于大型网站而言，使用大型的数据库服务器是必须的事情。但是，在面对大量访问的时候，数据库的瓶颈仍然会显现出来，这时一台数据库将很快无法满足应用，于是我们需要借助于数据库集群或者库表散列技术。

在数据库集群方面，很多数据库厂商都有自己的解决方案，Oracle、Sybase、SQL Server等都有很好的方案，常用的MySQL提供的Master/Slave也是类似的方案。因此，你使用了什么样的数据库，就参考相应的解决方案来实施即可。

上面提到的数据库集群由于在架构、成本、扩张性方面都会受到所采用数据库类型的限制，于是我们需要从应用程序的角度来考虑改善系统架构，其中，库表散列是常用并且最有效的解决方案。我们在应用程序中安装业务和应用或者功能模块将数据库进行分离，不同的模块对应不同的数据库或者表，再按照一定的策略对某个页面或者功能进行更小的数据库散列，比如用户表，按照用户ID进行表散列，这样就能够低成本的提升系统的性能并且有很好的扩展性。在这一方面一个现成的例子就是搜狐。它的论坛就是采用了这样的架构，将论坛的用户、设置、帖子等信息进行数据库分离，然后对帖子、用户按照板块和ID进行散列数据库和表，最终可以在配置文件中进行简单的配置便能让系统随时增加一台低成本的数据库进来补充系统性能。

(八)缓存策略

这绝对不单指低级的缓存技术相关的编程，应从整个架构角度着眼，深入研究Web服务器、数据库服务器的各层级的缓冲策略，最后才是低级的缓冲技术的编程。不同的Web服务器、数据库服务器及Web编程语言都有自己不同的缓冲策略。例如数据库存储方面，SQL Serve 2005中的主动式缓存机制，Oracle数据的cache group技术，Hibernate的缓存包括Session的缓存和SessionFactory的缓存；Web服务器方面，Apache提供了自己的缓存模块，也可以使用外加的Squid模块进行缓存，这两种方式均可以有效的提高Apache的访问响应能力，IIS缓冲器技术；至于web开发语言，所用缓存技术更存在很大不同，例如ASP.NET 2.0中提出了两种缓存应用程序数据和缓存服务页输出的策略，这两种缓存技术相互独立但不相互排斥，PHP有Pear的Cache模块，等等。

(九)镜像

镜像是大型网站常采用的提高性能和数据安全性的方式，镜像的技术可以解决不同网络接入商和地域带来的用户访问速度差异。在镜像的细节技术方面，这里不阐述太深，有很多专业的现成的解决架构和产品可选。也有廉价的通过软件实现的思路，比如Linux上的rsync等工具。

(十)负载均衡

负载均衡将是大型网站解决高负荷访问和大量并发请求采用的终极解决办法。

负载均衡技术发展了多年，有很多专业的服务提供商和产品可以选择，基于LAMP

解决方案的Lighttped+Squid是相当不错的解决负载均衡和加速系统的有效方式。

(十一)硬件四层交换

第四层交换使用第三层和第四层信息包的报头信息，根据应用区间识别业务流，将整个区间段的业务流分配到合适的应用服务器进行处理。第四层交换功能就象是虚IP，指向物理服务器。它传输的业务服从的协议多种多样，有HTTP、FTP、NFS、Telnet或其他协议。这些业务在物理服务器基础上，需要复杂的载量平衡算法。在IP世界，业务类型由终端TCP或UDP端口地址来决定，在第四层交换中的应用区间则由源端和终端IP地址、TCP和UDP端口共同决定。

在硬件四层交换产品领域，有一些知名的产品可以选择，比如Alteon、F5等，这些产品很昂贵，但是物有所值，能够提供非常优秀的性能和很灵活的管理能力。Yahoo中国当初接近2000台服务器使用了三四台Alteon就搞定了。(十二)软件四层交换

大家知道了硬件四层交换机的原理后，基于OSI模型来实现的软件四层交换也就应运而生，这样的解决方案实现的原理一致，不过性能稍差。但是满足一定量的压力还是游刃有余的。

一个典型的使用负载均衡的策略就是，在软件或者硬件四层交换的基础上搭建squid集群，这种思路在很多大型网站包括搜索引擎上被采用，这样的架构低成本、高性能还有很强的扩张性，随时往架构里面增减节点都非常容易。

(十三)软件投资问题

据报导，目前国内除了一些上市企业和特别大知名大公司以外，很少有企业在成本中考虑正版软件的购置费用。这种思维极有可能给中国互联网带来噩梦。如果一些公司真正面临软件资金方面的困难，完全可以考虑使用开源世界的LAMP解决方案（Linux＋Apache＋MySQL＋Perl、PHP或者Python Web编程语言）；否则，随着我国加入WTO范围的不断扩大，盗版打击必然越来越严。因此，“苟且偷生”必将自食其果。

另外，随着网络带宽日渐提升，WEB 2.0技术必将影响到网络世界的几乎每一个角落。因此，如何积聚技术人员进行技术攻关并进一步加强安全防范也成为一个日益严峻的问题，宜尽早纳入到公司的议事日程。

四、总结

中国电子商务真正理性发展的一个标志，是大量的传统企业实实在在地开始用互联网来处理商务、做生意，而现在这样的浪潮已经开始。北京发行集团，联合SINA、6688.com等单位共同推出的网上虚拟书店—新新书店就是这样的一个标志。

随着网络带宽日渐提升，随着网络理念和WEB 2.0技术的断深入人心，各种B2B、B2C、C2C等电子商务模式很可能以立体交叉方式整合到各种大型商务网站中来。因此，作为公司的技术人员，作为临危救驾的“白衣骑士”，如何应对海量存储、海量访问问题，海量信息检索的问题，日益严峻的安全问题，等等，已经刻不容缓。

第四篇：基于java技术的软件开发架构总结

基于java技术的软件开发架构总结

在具体的实现中，表现层可为Struts/JSF等，业务层、访问层可为JavaBean或EJB等，资源层一般为数据库。

宏观上的层次就是这样，在具体现实中，有如下几种实现形式：

1，轻量级实现

表现层使用基于MVC的框架，比如Struts或JSF 业务层使用JavaBean（就是常说的Service）访问层使用JavaBean（就是常说的DAO）优点：

轻量级实现，简单明了 缺点：

难以无法实现分布式应用

以下功能必须通过编程实现

事务控制 资源管理（包括组件的创建）

线程安全问题

安全性

2，重量级J2EE实现

表现层依然是基于MVC的框架

访问层采用实体Bean实现，如果可能最好采用CMP，实现起来更简洁。此处的实体Bean可以考虑采用本地接口

业务层一分为二，服务控制器可以由会话Bean充当，用来封装业务流程（相当于轻量级实现中的Service），也可以考虑采用本地接口；门面也可以由会话Bean充当（一般来说无状态会话Bean足矣），作为业务层的入口，应该采用远程接口。优点：

以下功能可由EJB容器自动实现，或通过配置实现

事务控制

远程访问

线程安全

资源管理

安全性

可以进行分布式应用

因为采用了EJB，故部分特征可以由装配人员来配置（比如事务，安全性等），不需要在软件中硬编码 EJB组件有更好的重用性

可利用容器提供的其他企业级的功能（比如集群，容错，灾难恢复等）

可以加入MDB（实现异步通讯）等技术 缺点：

开发难度较高

如果不恰当的使用实体Bean，会造成效率低下。如果采用CMP，则很多数据访问的操作不能直接实现。

缺少良好的开发环境

软件可能依赖于具体的EJB容器 EJB容器可能很贵，开发软件也可能很贵

3，轻量级和重量级J2EE的切换

如果项目有需求，并有充分的时间，还可以通过在表现层和业务层的交界处加入“业务代表”（JavaBean + 服务定位器实现）来对表现层隐藏对业务层访问的细节(JavaBean和EJB的访问方式显然不同)，只需替换“业务代表”就可以切换轻量级和重量级两种实现。举例说明，一般电话上都有一个P/T开关（脉冲/音频开关），随着开关状态的不同，拨号时电话机会判断是使用脉冲拨号还是音频拨号。

这种架构唯一的缺点就是必须写两套实现代码„„

4，轻量级J2EE实现

访问层通过JavaBean调用ORM框架实现（Hibernate，iBatis等），代码简洁，功能完备（相对于EJB 2.x而言），如果用的是Hibernate，可以忽略底层数据库的差异，如果用的是iBatis，则方便对SQL进行优化。

业务层和访问层依靠AOP框架（如Spring）可以在切面中实现事务，安全性等功能，同时不影响业务代码。如果采用Spring，其中已经内置了事物切面，并可以轻易的与主流ORM框架进行整合，实现声明式的事物管理。当然，更可以使用IoC模式降低组件间的耦合性。优点：

可以通过AOP框架实现事物、安全性等功能，同时不影响业务代码

ORM框架比CMP更灵活，比BMP更简洁（相对于EJB 2.x而言），运行效率也比较高

如果使用Spring，可以用更简单的方式实现J2EE中比较复杂的功能

无需额外的容器

ORM和AOP框架可以找到免费的开源实现，降低项目成本（不过也有人认为采用开源项目可能综合成本更高） 缺点：

非官方框架，缺少文档、技术支持和业界经验

采用技术太多，学习曲线较高，难以招到合适的程序员（咱们学员可以考虑在这方面下点功夫，呵呵）

某些企业级的功能轻量级框架还不能实现（或独立实现）

测试、调试均比较复杂

另类之处：

使用BMP + Hibernate（具体做法为BMP中的持久化方法，比如ejbLoad, ejbStore等都委托给Hibernate实现）优点：

借助于Hibernate强大的ORM功能弥补CMP的不足（特别是EJB-QL）缺点：

事物不好控制

不伦不类，容易发生未知的错误（比如Hibernate自身的缓存可能会于容易提供的缓存冲突）另类之处：

将业务层（也可能包含访问层）包装成Web Services，支持远程调用优点：

借助于Web Services可以实现松散耦合分布式应用，说的大一点，就是传说中的SOA，呵呵缺点：

Web Services自身效率不高，无状态，安全性差

当然，即使不分层，也能做出软件来，但我们应该思考怎么做才能最好？如果说分层不好，那么不分层的优势又在哪里呢？？如果说分层有性能的损耗，那么性能损耗在哪里呢？？如果不分层，软件工程思想中的“分而治之”的原则启不受到了质疑？

有人说，分层是为了减少代码量，如果分层是为了减少代码量，那怎么能减少，代码的重用也许会减少一些，但是程序更多的是业务，我们关心的也只是业务，试问分层的意义就是为了减少代码量？

总之我的观点就是：软件分层是必须做的。至于框架，不应该问用不用，而应该问用什么？要选用实践检验过的框架，毕竟实践是检验真理的唯一标准。

二年的J2EE开发之后，我们应该掌握了一些主流的架构模式，总结一下：

宏观上讲，我们采用了分层的架构，将软件分为如下的层次：

第五篇：Struts2+Hibernate架构技术教程课后参考答案

第1章

Struts2框架技术入门

1.5 习题 1.5.1 选择题

1.D 2.A 3.C 4.B 5.B 1.5.2 填空题

1.MVC

2.Struts1和WebWork 3.IBM 4.FilterDispatcher 5.JSP、Struts2标签

1.5.3 简答题

1.简述MVC设计模式的工作流程。答：MVC设计模式工作流程是：

（1）用户的请求（V）提交给控制器（C）；

（2）控制器接受到用户请求后根据用户的具体需求，调用相应的JavaBean或者EJB（M部分）来进行处理用户的请求；

（3）控制器调用M处理完数据后，根据处理结果进行下一步的调转，如跳转到另外一个页面或者其他Servlet。

2.简述Struts2的工作原理。

答：Struts2中使用拦截器来处理用户请求，从而允许用户的业务控制器Action与Servlet分离。用户请求提交后经过多个拦截器拦截后交给核心控制器FilterDispatcher处理，核心控制器读取配置文件struts.xml，根据配置文件的信息指定某一个业务控制器Action（POJO类）来处理用户数据，业务控制器调用某个业务组件进行处理，在处理的过程中可以调用其他模型组件共同完成数据的处理。Action处理完后会返回给核心控制器FilterDispatcher一个处理结果，核心控制器根据返回的处理结果读取配置文件struts.xml，根据配置文件中的配置，决定下一步跳转到哪一个页面。

一个客户请求在Struts2框架中处理的过程大概有以下几个步骤：（1）客户提交请求到服务器；

（2）请求被提交到一系列的过滤器过滤后最后到FilterDispatcher；FilterDispatcher是核心控制器，是基于Struts2中MVC模式的控制器部分；

（3）FilterDispatcher读取配置文件struts.xml，根据配置信息调用某个Action来处理客户请求；

（4）Action执行完毕，返回执行结果，根据struts.xml的配置找到对应的返回结果。1.5.4 实训题

略

第2章

Struts2核心组件详解 2.7 习题

2.7.1 选择题

1.B 2.C 3.B 4.D 5.B 6.D 2.7.2 填空题

1.struts.xml和struts.properties 2.struts.xml、struts.properties和web.xml 3.Action和拦截器 4.非耦合性

5.IoC方式和非IoC方式

6.不指定method属性和指定method属性 7.表达式、根对象和上下文环境 8.UI标签、非UI标签 9.表单标签和非表单标签 10.数据标签和控制标签

2.7.3 简答题

1.简述struts.xml配置文件的作用。

答：Struts2的核心配置文件是struts.xml，struts.xml具有重要的作用，所有用户请求被Struts2核心控制器FilterDispatcher拦截，然后业务控制器代理通过配置管理类查询配置文件struts.xml中由哪个也Action处理。

2.简述Struts2的核心控制器FilterDispatcher的作用。

答：FilterDispatcher是Struts2框架的核心控制器，该控制器作为一个Filter运行在Web应用中，它负责拦截所有的用户请求，当用户请求到达时，该Filter会过滤用户请求。如果用户请求以action结尾，该请求将被转入Struts2框架处理。Struts2框架获得了*.action请求后，将根据*.action请求的前面部分决定调用哪个业务控制器组件，例如，对于login.action请求，Struts2调用名为login的Action来处理该请求。Struts2应用中的Action都被定义在struts.xml文件中，在该文件中定义Action时，定义了该Action的name属性和class属性，其中name属性决定了该Action处理哪个用户请求，而class属性决定了该Action的实现类。

3.简述Struts2的业务控制器Action的作用。答：Action类中包含了对用户请求的处理逻辑，因此也把Action称为Action业务控制器。Action是应用的核心，业务控制器是Struts2中实现业务控制的中心，除了保存用户的数据外，它也负责调用其他模型组件在execute()方法中进行数据处理。

2.7.4 实训题

略

第3章

Struts2的高级组件

3.6 习题 3.6.1 选择题

1.A 2.A 3.B 4.C 5.C 3.6.2 填空题

1.properties 2.native2ascii 3.AOP 4.服务器端校验

3.6.3 简答题

1.什么是国际化，为什么使用国际化？答：“国际化”是指一个应用程序在运行时能够根据客户端请求所来自的国家/地区、语言的不同而显示不同的用户界面。例如，请求来自于一台中文操作系统的客户端计算机，则应用程序响应界面中的各种标签、错误提示和帮助信息均使用中文文字；如果客户端计算机采用英文操作系统，则应用程序也应能识别并自动以英文界面做出响应。

引入国际化机制的目的在于提供自适应的、更友好的用户界面，而并未改变程序的其他功能/业务逻辑。人们常用I18N 这个词作为“国际化”的简称，其来源是英文单词Internationalization 的首末字母I 和N 及它们之间的字符数18。

2.简述Struts2中实现国际化流程的过程。答：（1）不同地区使用操作系统环境不同，如中文操作系统、英文操作系统、韩文操作系统等，在获得客户端地区的语言环境后，struts.xml文件会找国际化资源文件，当时中文语言环境，就加载中文国际化资源文件。所示国际化需要编写支持多个语言的国际化资源文件，并且配置struts.xml文件。

（2）根据选择的语言加载相应的国际化资源文件，视图通过Struts2标签读取国际化资源文件把数据输出到页面上，完成页面的显示。

3.什么是拦截器，拦截器的作用是什么？

答：拦截器（Interceptor）体系是Struts2的一个重要组成部分，正是大量的内置拦截器才提供了Struts2的大部分操作。当FilterDispatcher拦截到用户请求后，大量的拦截器将会对用户请求进行处理，然后才调用用户自定义的Action类中的方法来处理请求，比如params拦截器将HTTP请求中的参数解析出来，将这些解析出来参数设置为Action的属性；servlet-config拦截器直接将HTTP请求中的HttpServletRequest实例和HttpServletResponse实例传给Action；国际化拦截器i18n将国际化资源进行操作；文件上传拦截器fileUpload将文件信息传给Action。另外还有数据校验拦截器对数据校验信息进行拦截。对于Struts2的拦截器体系而言，当需要使用某个拦截器时，只需在配置文件struts.xml中配置就可以使用；如果不需要使用该拦截器，也是只需在struts.xml配置文件中取消配置即可。Struts2的拦截器可以理解为一种可插拔式的设计思想，所以Struts2框架具有非常好的可扩展性。

4.简述在Java Web应用开发Struts2的输入校验的作用。

答：在互联网上，Web站点是对外提供服务的，由于站点的开放性，Web站点保存的数据主要都是从客户端接受过来。输入数据的用户来自不同的行业，有着不同的教育背景和生活习惯，从而不能保证输入内容的正确性。例如，用户操作计算机不熟悉、输入出错、网络问题或者恶意输入等，这些都可能导致数据异常。如果对数据不加校验，有可能导致系统阻塞或者系统崩溃。

3.6.4 实训题

略

第5章

Hibernate框架技术入门

5.5 习题

5.5.1 选择题

1.A 2.B 3.A 5.5.2 填空题

1.JDBC和ORM 2.hibernate.cfg.xml和hibernate.properties 3.xxx.hbm.xml或者.hbm.xml 4.临时状态（transient）、持久化状态（persistent）和脱管状态（detached）

5.5.3 简答题

1.简述Hibernate的特点。答：（1）Hibernate是一个开放源代码的对象关系映射框架，它对JDBC 进行了非常轻量级的对象封装，使得Java 程序员可以随心所欲地使用面向对象编程思维来操纵数据库。Hibernate可以应用在任何使用JDBC的场合，既可以在Java的客户端程序使用，也可以在Servlet/JSP的Web应用中使用，最具革命意义的是，Hibernate可以在JavaEE框架中取代CMP，完成数据持久化的重任。（2）Hibernate的目标是成为Java中管理数据持久性问题的一种完整解决方案。它协调应用与关系数据库的交互，让开发者解放出来专注于手中的业务问题。

（3）Hibernate是一种非强迫性的解决方案。开发者在写业务逻辑与持久化类时，不会被要求遵循许多Hibernate特定的规则和设计模式。这样，Hibernate就可以与大多数新的和现有的应用平顺地集成，而不需要对应用的其余部分做破坏性的改动。

2.简述Hibernate的工作原理。

答：首先，Configuration读取Hibernate的配置文件及映射文件中的信息，即加载配置文件和映射文件，并通过Hibernate配置文件生成一个多线程的SessionFactory对象，然后，多线程SessionFactory对象生成一个线程Session 对象，Session对象生成Query对象或者Transaction对象；可通过Session对象的get()，load()，save()，update()，delete()和saveOrUpdate()等方法对PO进行加载、保存、更新、删除等操作；在查询的情况下，可通过Session 对象生成一个Query对象，然后利用Query对象执行查询操作；如果没有异常，Transaction对象将提交这些操作结果到数据库中。

5.5.4 实训题

略

第6章

Hibernate核心组件详解

6.11 习题 6.11.1 选择题

1.A 2.A 3.B 6.11.2 填空题

1.hibernate.cfg.xml和hibernate.properties 2.hbm.xml 3.get()和load()6.11.3简答题

1.简述Hibernate配置文件的作用。

答：Hibernate框架的配置文件用来为程序配置连接数据库的参数，例如，数据库的驱动程序名，URL，用户名和密码等。Hibernate的基本配置文件有两种：hibernate.cfg.xml和hibernate.properties。前者包含了Hibernate与数据库的基本连接信息，在Hibernate工作的初始阶段，这些信息被先后加载到Configuration和SessionFactory实例；前者还包含了Hibernate的基本映射信息，即系统中每一个类与其对应的数据库表之间的关联信息，在Hibernate工作的初始阶段，这些信息通过hibernate.cfg.xml的mapping节点被加载到Configuration和SessionFactory实例中。这两种文件信息包含了Hibernate的所有运行期参数。两者的配置内容基本相同，但前者的使用稍微方便一些，例如，在 hibernate.cfg.xml 中可以定义要用到的xxx.hbm.xml 映射文件列表，而使用hibernate.properties 则需要在程序中以硬编码方式指明。hibernate.cfg.xml是Hibernate的默认配置文件。

2.简述Hibernate的Configuration类的作用。答：Configuration类的主要作用是解析Hibernate的配置文件和持久化映射文件中的信息，即负责管理Hibernate的配置信息。Hibernate运行时需要获取一些底层实现的基本信息，如数据库驱动程序类、数据库的URL等。这些信息定义在Hibernate的配置文件（hibernate.cfg.xml或hibernate.properties）中。然后通过Configuration对象的buildSessionFactory()方法创建SessionFactory对象，所以Configuration对象一般只有在获取SessionFactory对象时需要使用。当获取了SessionFactory对象之后，由于配置信息已经由Hibernate维护并绑定在返回的SessionFactory中，因此该Configuration已无使用价值。

3.简述Hibernate的Session的作用。

答：Session对象是Hibernate技术的核心，持久化化对象的生命周期、事务的管理和持久化对象的查询、更新和删除都是通过Session对象来完成的。Hibernate在操作数据库之前必须先取得Session对象，相当于JDBC在操作数据库之前必须先取得Connection对象一样。Session对象不是线程安全的（Thread Safe），一个Session对象最好只由一个单一线程来使用。同时该对象的生命周期要比SessionFactory要短，一个应用系统中可以自始至终只使用一个SessionFactory对象，其生命通常在完成数据库的一个短暂的系列操作之后结束。

6.11.4实训题

略

第7章

Hibernate的高级组件

7.6 习题 7.6.1 选择题

1.B 2.A 3.C 7.6.2 填空题

1.一对一、一对多和多对多 2.HQL、CQ、NSQL 3.一级Cache和二级Cache 7.6.3简答题

1.简述一对一关联关系两种方式的区别

答：一对一关联关系分为主键关联和外键关联，主键关联共享一个主键，外键关联各自都有自己的主键，通过一个表的外键关联起来。

2.简述事务的特性。

答：事务具备原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持久性（Durability）4 个属性，简称ACID。下面对这4 个特性分别进行说明：

 原子性：将事务中所做的操作捆绑成一个原子单元，即对于事务所进行的数据修改等操作，要么全部执行，要么全部不执行。

 一致性：事务在完成时，必须使所有的数据都保持一致状态，而且在相关数据中，所有规则都必须应用于事务的修改，以保持所有数据的完整性。事务结束时，所有的内部数据结构都应该是正确的。

 隔离性：由并发事务所做的修改必须与任何其他事务所做的修改相隔离。事务查看数据时数据所处的状态，要么是被另一并发事务修改之前的状态，要么是被另一并发事务修改之后的状态，即事务不会查看由另一个并发事务正在修改的数据。这种隔离方式也叫可串行性。

 持久性：事务完成之后，它对系统的影响是永久的，即使出现系统故障也是如此。

7.6.4实训题

略

第9章 Spring3框架技术入门

9.5习题 9.5.1 选择题 1.B 2.A 3.C 9.5.2 填空题

1.配置文件

2.BeanFactory接口及其相关类，ApplicationContext接口及其相关类 3.设置注入，构造注入

9.5.3 简答题 9.5.4 实训题

第10章 Spring3的AOP框架

10.7习题 10.7.1 选择题 1.B 2.D 3.C

10.7.2 填空题

1.静态AOP，动态AOP 2.通知

3.静态代理，动态代理

4.前置通知（Before Advice），后置通知（After Advice）

10.7.3 简答题 10.7.4 实训题

淘宝技术架构发展总结（写写帮推荐）

第一篇：淘宝技术架构发展总结（写写帮推荐）

第二篇：java技术架构

第三篇：大型网站架构设计及技术总结

第四篇：基于java技术的软件开发架构总结

第五篇：Struts2+Hibernate架构技术教程课后参考答案

相关范文推荐

ssh架构个人总结

OA办公系统的主要技术架构

淘宝个人总结

校园淘宝总结

淘宝店铺总结

淘宝装修总结

淘宝规则总结

淘宝开店总结