2019年1月,百度中标成为央视晚会独家网络互动平台,此时距离春晚仅剩1个月时间,准备时间相比往年缩短2/3,但百度仍将面对春晚红包互动带来的每分钟高达10亿次的流量峰值冲击,为此百度需要搭建一个10万台服务器的超大规模集群来支撑。
在春节前的一个月,如何在没有提前下单、物料没有提前拿入、工人临近放假的情况下,实现快速且高质量的交付?这个问题摆在了百度系统部的面前,也摆在了和百度并肩战斗多年的盟友——浪潮的面前。面对可能存在的巨大供应风险,大部分的供应商都退却不前,为什么浪潮能够承接这样一个看似不可能完成的任务?
5万台服务器紧急交付,百度-浪潮联手承接了一个“不可能任务”
在除夕当晚,全球的春晚观众将通过百度APP以人工智能互动的方式共同瓜分9亿现金红包大奖,由此产生的交互需求,将给百度APP的下载、注册、登录、互动等一系列环节带来数倍于往日的流量峰值压力,而一旦超出IT基础设施承载极限,不仅会造成用户参与活动体验不畅,更有可能造成百度APP的长时间无法正常使用,让最终的活动效果事倍功半。
面对春晚期间短时间内数以亿计的流量冲击,百度必须在一个月的时间内构建起性能强大、弹性扩容、稳定可靠的IT基础架构。据百度预估,本次春晚红包活动将需要至少十万台服务器资源,其中五万台可以调用内部其他系统服务资源,而另外五万台服务器需要在一个月的时间内完成外部采购、部署调试和顺利上线的交付。
在如此短时间内完成如此庞大的服务器交付上线需求,对任何一家服务器厂商而言都是一次从未有过的任务。从原料的准备,供应链的协调,生产能力的迅速拓展,到后期的物流和交付保障,生产过程中每一个环节的缺失,都将影响最终的交付速度和质量。同时,春节前期诸多供应商将面临着人力和原材料资源的短缺,也将影响到自身的弹性生产能力。
这对于众多服务器供应商而言,是一次无法完成的交付任务,但对互联网行业排名第一的浪潮而言,则是一次证明自身实力的绝佳机遇。依靠强大和可靠的供应保障能力,浪潮成为了本次百度大规模服务器采集项目的主力军——在完成2个月内交付四万台服务器的原定订单之外,又承接了百度2周内生产交付1万台服务器的紧急突发任务。
生产周期缩短2/3,交付效率提升20倍,浪潮速度保障百度春晚
对于浪潮而言,敢于在不足2个月的时间内保障五万台服务器的供应,源于其在服务器设计、制造、流通与交付中的四个核心能力:首先,浪潮能实现短时间内生产能力的极速弹性扩容;其次,与供应链合作伙伴建立深入合作,保障了原材料的供应;第三,针对互联网行业特点拥有大规模定制化生产能力;最后,建立了完善的交付团队和机制,让服务器实现自身的真正价值。
在生产能力上,浪潮通过一系列的改造和升级,在短短15天内完成了原本至少需要25天的3万节点的生产交付。通过新增32个机柜测试位、9个检验位,并修改和完善制造流程,浪潮提升了老化测试和检验下线能力,让设备效率提升30%;依托制造工艺变革、模块化技术以及24小时全天生产,让产能最高提升32%。同时,浪潮推进生产管理体系变革,将目标层层传递分解,工程师现场分析,老化室测试维修保障,将三天测试完毕达成率从最初的80%提升到98%。此外,浪潮的专项沟通交流机制实现了不同部门,以及与客户之间的有效沟通和相互协调,加速解决问题,提升生产效率。
在弹性供应链资源协调方面,浪潮凭借与英特尔、思科、IBM、希捷等主流供应商的全球级战略合作,打造了技术、供应可靠的生态链。同时,浪潮与百度等大客户建立了供应链平台的对接以及服务器滚动预测、锁量机制,通过优化与客户供应链合作模式提高了预测能力,才使得百度原计划的大部分订单能够顺利完成。另外,当突发需求的物料供应无法满足时候,浪潮也能够与客户一起争取更多上游的物料资源。在百度春晚项目中,浪潮供应链团队在物料、产能紧张,需求大幅波动的情况下,将保障供应作为第一要务,对于难以管控的外部资源,由浪潮高层亲自带队,核心员工的长期驻场以保证风险无虞,为后续的生产和交付奠定了坚实的基础。