PC快捷导航 | 免费赠品 | 联系我们 | Sitemap
友软科技联系电话:0311-82065950
营销型网站更赚钱
当前位置:友软科技 > 新闻资讯 > 建站资讯

百度技术总监邵辉谈12306高性能海量并发网站架构方案

发表日期:2012/10/4   内容来源:

列车在线订票系统的业务逻辑比较简单,不用多说。可能的瓶颈有两个,一个是车次和剩余票量的查询,一个是下单。在设计软件架构之前,需要先研究产品需求、软硬件条件、网络环境以及关联系统的接口,但这些资料无从获得,所以只能做几点分析和假设,做为设计的前提条件。

1、2012年铁路春运是2.35亿人次,去程售票的那几天应该是订票的最高峰点,假设是3天内订出1.2亿张票,那么每天是4000万张。由于还有车站窗口、电话、代售点等渠道,所以每天通过网站售出的票应该小于4000万张,这里假设2000万张是由网站售出的。

2、如果2000万张票是在一天内均匀地订出,那么每秒钟大约是230张。中国排名前100位的网站应该都会超过这个事务量,不会有什么难题。问题是,订票网站是在一个固定时刻(早上6:00)开始放票,考虑一个极端的情况:早已守候在电脑前的2000万用户在准点开始按下按钮下单,并且都在1分钟时间内订到了票,那么系统需要每秒33万的事务处理能力,这至少需要上千台服务器的集群才能按时处理完。(按照网上有关12306建设资金的报道来看,服务器投入肯定远远不到这个数。)实际情况当然不会这么极端,但必须保证整个系统有非常好的横向扩展能力,以便在必要的时候添加设备扩展服务能力。车站窗口、代售点和电话售票之所以不会产生这样的峰值,原因是这些渠道都是有人工受理,效率足够低,低到用户需要排几个小时的队来等候,自然就把峰值给抹平了。

3、前面还不是最大的问题。铁道部应该还有个核心数据库,保存最权威的票务数据,网络订票系统、电话订票系统和代售点必须与这个数据库对接以提交订单记录和获得准确的车票余量信息。至于这个接口有多少条连接,每秒允许多少次事务,那就不得而知了。这里我们假定接口要么足够宽,宽到不会成为瓶颈,要么在事先已有固定数量的车票分配给了网络订票系统,这样网络订票系统就可以根据这个固定数量自主地接受订单,然后在后台慢慢地把订单数据传给核心数据库。否则,就好像8车道的马路一下变成了2车道,无论如何也不可能让用户畅通无阻地订到票。

有了上面的分析和假设,可以考虑以下设计方案。

1、车次和剩余票量的查询。考虑到车次查询量可能是订单数量的数倍至数十倍,不能让用户提交查询请求时直接去主数据库检索数据,而应该采用前端+缓存+检索+数据库的多层逻辑结构。数据库存放持久化的权威数据并保证数据的一致性;缓存层负责把车次、余量等数据放到内存中以保证最好的查询性能,并有比较好的横向扩展性;检索机负责定时(例如每5秒一次)去数据库检索所有车次信息并主动更新缓存机上的数据;前端负责响应来自用户的web请求。这个架构无法保证用户看到的车票余量是实时准确的(比如有数秒的滞后),但由于用户从看到车票余量到完成订单之间肯定是有时间间隔的,在订票高峰期和票量较少时本来就无法保证“在看到有票的情况下一定能订到票”(技术上能够实现这一点,但代价非常大),所以这个缺陷并不明显,是个很划得来的折中。注意是检索机负责将车票数据抓出来并更新到缓存机上,这是保护数据库并使缓存层能够线性扩展的关键方法。另外查询页面需要采取防频繁刷新的措施,这个在前端机上设置web server策略即可。

2、下单部分由于要更新车票余量,必须保证数据的一致性,扩展性不可能很好,因此是整个系统中最为脆弱的一环。实现的方法分同步处理和异步处理两种。同步处理就是用户选择完车次正式下单订票后,立即锁住车票记录并检查车票真实余量,如果大于1,那么余量减1,解除锁定并回复用户订票成功进入支付流程,否则解除锁定回复订票失败请用户选择其它车次。这是订票系统的标准流程,无论用户量大还是小,处理流程都是一样的。为了支撑春运这种极端情况下的高访问量,需要提高订单处理的并发吞吐量和单个事务的处理速度。提高吞吐量可以将不同车次的车票数据分拆到不同的物理服务器上,提高订单处理速度可以考虑取消关系数据库,将车次数据放到内存中并用原生语言实现订单处理逻辑。有一个比较值得考虑的措施是在用户下单前用图片或者短信的方式要求用户二次验证,这既可以防止刷页面,也可以使峰值变得更平缓。异步处理就是在用户提交订单时并不立即告诉用户订票成功或者失败,只是将订票请求放入队列里排队,订单成功处理后再通知用户。处理优先级上采用时间排序或者抽签都可以,不过抽签适合在非常时期采用,并不适合作为一个标准策略,这多少增加了系统开发的复杂度。采用异步的方式将会在最大程度上避免用户下单高峰造成的冲击,缺点是用户不知道什么时候能有结果,是否应该尝试其它车次,这对用户体验有一定程度的损伤。

硬件架构方面,负载均衡设备是必须采用的,除了扩展负载能力,也需要扛住DoS攻击。服务器用普通PC服务器就可以了。网络架构方面,内网应该设计成无阻塞的,外网引入三大运营商的BGP带宽,不要用静态带宽。

最后说一句,几千万用户同时下订单,即使是三大互联网巨头的系统,也不一定撑得住,12306网站崩溃并不算太丢人,但需要好好考虑架构优化方案,明年春运不能再倒了

本文链接:http://www.urkeji.com/content/1077.html (转摘请注明出处)
若无特别注明,本站内容均为原创;网站优化业务请咨询本站在线客服!

网站建设费用明细一览表

很多朋友做网站总是搞不清楚费用都包含什么,于是很多人都会以为做一个网站本来用不了多少钱,为什么网络公司或者网站制作团队的报价都那么高?甚至有一些人还会绝对网站建设行业是不是很赚钱,算得上是暴利行业,其实并不是这样的,只是大部分的人都不明白网站建设的具体费用,今天小编就和大家详细说一下网站建设费用的细分,希望这个网站建设费用明细一览表能够帮助企业在制作网站之前更好的做好预算。 1、服务器和域名的费用 这个是网站建设费用中最为基础的一部分费用,任何一个在互联网上发布的网站,也就是公开访问的网站都必须是存储在一个可以连接到互联网上的设备中,这个设备我们就将他称之为服务器,或者也可以是服务器上某一...展开阅读▽

利用百度知道开放平台搭建自己的问答系统

最近在站长人气论坛上看到一个不错的问答平台www.101026.com,跟百度知道非常相似,所以这里也跟大家说一下百度知道的开放平台,有兴趣搭建自己的问答平台的朋友可以借鉴一下,使用百度知道开放平台建设的问答系统其搜索引擎友好型肯定是不用怀疑的,绝对非常与利于搜索引擎蜘蛛抓取,所以这个还是比较有诱惑力的。 百度知道开放平台是一个基于百度网页搜索和百度知道的开放性知识分享平台,旨在搭建知识需求者(即提问用户和浏览用户)和知识提供者(即回答用户)之间的桥梁。合作伙伴可以根据网站自身情况,自由选择合作模式,为用户带来及时、便捷、准确的问答体验,同时通过平台将本地用户产生的有价值的问答内容进行传播,...展开阅读▽

营销型网站有没有价格便宜的

现在的营销型网站已经成为企业网站制作的首选,尤其是现在移动端的流量价值越来越高,营销型网站的优势就更加明显,PC端的流量质量大不如前,所以一个企业网站要想带来大量的潜在客户就必须能够在界面设计及网站的营销能力上多下功夫,尽可能的促进访客下单成交,这也是营销型网站区别于普通企业网站的主要功能。 而且一般的营销型网站都会包含手机网站建设,所以也能够从手机端为企业带来大量的潜在客户,尤其是最近一年来。百度移动端和360移动端的搜索结果排名都是优先给移动网站排名,同样的结果在移动端网页没有相关内容的时候才会给PC端网页排名,所以移动端网页做好以后能够很容易的从移动端获取不小的潜在客户准流量。 不过...展开阅读▽