logo

企业动态 行业动态

如何让服务器实现扛住三倍流量压力,成本降低40%?

 2020-11-13 10:44:26  来源:  192次

“这是一个全球数据大爆发的时代”

据IDC数据显示,从2020年到2022年这短短的两年时间里,每年新增数据将超过42%。我们人类也就很快的会迎来一个新的Z字节时代。

回顾过去20年,大部分数据都来自于企业内部数据中心。但未来两年,这些数据比例将有大的变化,来自企业内部的数据将减少至30%以内,与此同时云端及第三方管理的企业数据中心数据将占比超过50%,边缘数据中心的数据会占近20%。数据大爆发的时代,数据的存储位置也在不断变化中。

2020年,受到全球新冠疫情和数据中心变化的双重影响,全球经济与ICT市场都面临着巨大压力。与此同时,在此逆境之下,依然蕴藏着巨大的商机!

微信图片_20201113100022

*信息来源于IDC

IDC预计,2020年与疫情相关10个领域的ICT市场商机,总金额会超过1.5万亿人民币。其中就包括数字平台与大数据、新型的城市智慧城市与园区、医疗远程办公、工业互联网、5G、数据中心与服务、人工智能、供应链管理、制造与服务机器人。

对于企业而言,最大需求只有一个,就是:需要有足够的算力来应对这些挑战!

代号为“Rome”的EPYC(霄龙)

助用户迎接来自算力的挑战

那么,我们需要一个什么样的思路去解决企业级用户所面临的计算力挑战呢?

在2020年腾讯全球数字生态大会上,AMD与会并围绕“实力Zen2架构,赋能企业新基建”,与行业用户共同探讨了AMD数据中心战略、第二代EPYC的解决方案与案例以及如何协助企业级用户解决来自计算力的挑战等话题。

AMD中国区企业与商用事业部销售总监周俊杰表示:首先,我们需要有一个可持续发展的CPU跟GPU的架构;第二是需要一套全新、高效率的芯片与系统集成方案;第三是必须有一个开放的生态环境,获得更多的解决方案供应商支持。只有这样,才能帮助用户去迎接新挑战。

微信图片_20201113101105

2019年,AMD推出了代号为罗马(Rome)的第二代EPYC处理器,相比上代产品,无论是性能、核心数量、新技术支持还是安全性等方面都有了长足的进步,在云计算、虚拟化、高性能计算以及诸多行业应用方面,为用户带来了全新的选择。并解决了很多之前难以实现的性能挑战,开辟了一个64核的EPYC时代!

AMD EPYC(霄龙)采用了先进的7nm制程工艺,配备8到64颗物理核心,包括128个PCIe Gen 4通道和8个支持DDR4-3200的高速内存通道,并可访问高达4TB的高速内存。EPYC处理器的均衡资源集意味着可以更自由地根据工作负载调整服务器配置的大小。

以EPYC 7742为例,可以看到其每个处理器具有64个核心,基频为2.25GHz,加速频率高达3.4GHz。新一代“Rome”基于全新的Zen 2架构,并采用了模块化设计。在拥有计算核心Die的同时,还有专门的I/O Die,负责输入输出控制。

微信图片_20201113102958

第二代EPYC的CPU架构在IPC(每时脉周期执行指令)效能表现上,相比前代产品提高了15%。另外在执行AVX2指令集的浮点运算效能也有翻倍的提升。此次还加大处理器使用的L3快取,将总容量提高至256MB,进而缩短CPU资料存取时间。

通过采用混合多芯片架构,能够让第二代EPYC的处理效能提高两倍,并具备更强的平行运算处理能力,最大可以提供多达4倍的运算吞吐量(FLOPS)。

微信图片_20201113103310

现如今第二代EPYC已经打破了上百项世界记录的性能,其中包括:HPC、浮点计算、整体计算性能、Java性能、DB/ERP业务、能耗指标、大数据分析、云应用和虚拟化等等,为数据中心服务器定格了新的标杆。64核心是当前服务器处理器中的最多数量,远远地将竞争对手甩在了身后。

安全方面,在AMD EPYC中内嵌了一个ARM架构小核心,它可以支持512位的密钥。也就是说,这一颗CPU可以支持500以上的虚拟机,每一个虚拟机机会有独立的密钥。当数据从CPU写进内存的时候进行加密。因此,如果有人通过各种方式拿到内存中的数据,也是在短时间内难以破解的。为客户的资产及数据安全提供了完美保障。

新一代AMD EPYC处理器在整个产品线中提供了一致的特性,允许用户在不牺牲特性、内存通道数量、内存容量或I/O通道数量的情况下优化工作负载所需的核心数量。无论每路的物理核心数量如何,都可以在所有EPYC处理器上访问8个内存通道。

2020年的4月,AMD又推出了三套7Fx2系列处理器,将主频进一步提升,使其更加适合超融合、高性能计算、裸金属等应用。

微信图片_20201113103459

其中7F32为8核心处理器,功耗仅为180W,最高主频3.9GHz,相比现款7262/7252产品主频更高,性价比进一步提升;7F52更高端一些,拥有16颗物理核心,比现款7302的3.0GHz和7282的2.8GHz主频要高很多,最高可以达到3.9GHz。

7F72是最高端产品,拥有24颗核心,比现款的7402/2.8GHz和7352/2.3GHz处理器主频高出一个级别,最高达到了3.7GHz。值得一提的是,在保持高主频的同时,它能够将每核心成本进一步降低,这一点相信会深得超融合、数据库和HPC等应用的青睐。

今年推出的7Fx2系列则是更有针对性地对产品进行了细分,这些领域就包括超融合、裸金属、高性能计算、数据库应用和刀片服务器。

AMD发力超融合市场,有着自己的核心优势。计算力方面,超多的核心数量以及性能本身就表现出色,7Fx2系列更是将主频提升一个档次,进一步符合超融合的需求。据资料显示,行业用户曾经做过测试,每秒1100万Java运算,将处理器换成EPYC之后,只需要33台128核心的服务器,就可以替换掉原来的60台服务器。单CPU的能力提高了83%,节省了45%的服务器,整个TCO节省了44%。足见EPYC强大的计算性能。

“万能”的SA2实例,

AMD与腾讯云深度合作的结晶

微信图片_20201113103633

既然是在2020年腾讯全球数字生态大会上,那么肯定会有更精彩的内容发布。9月11日下午,AMD与腾讯云签署了战略合作协议,共同建立“技术创新联合实验室”。

微信图片_20201113103639

SA2是基于腾讯全新自研的星星海服务器,软硬件完全属于腾讯自主知识产权,并进行了高度的适配,提高了性能与稳定性,是AMD与腾讯深度合作的结晶。

SA2服务器提供了一个非常弹性灵活的算力,可以灵活的选配从1核到180核的云服务器规格,全面释放技术红利。比上一代的产品提升了35%以上的性能,极大降低了用户上云成本。几乎可以覆盖到腾讯99%的业务场景,同时可以支持腾讯云容器产品。这款深度定制的星星海服务器,从它的内部设计、管理、安全可靠性等方面都非常适配腾讯整个运维体系,构建了一套专业、可信、扎实可靠的基础架构。

在后疫情时代,星星海SA2实例非常好的支持了整个腾讯业务部署,包括腾讯会议、QQ等应用,实现了8天扩容100万核,扩容能力在业界处于领先地位。

特别是在2020年春节期间,QQ红包使用了星星海的实例,扛住了三倍于以往的瞬间流量,也使综合能力提升35%以上。腾讯广告也同时在使用该实例来做他的广告检索模块,业务比上一代产品降低了25%的延迟,成本降低了40%。

将性能发挥极致,

高性能计算继续保持优势

微信图片_20201113103955

对于企业级用户而言,代号为“Rome”的EPYC处理器最直观印象就是:业界独有的64核心128线程!对于HPC应用而言,它所带来的改变将是翻天覆地。

在工程仿真、结构分析、有限元分析、生产建模以及流体动力方面,相比上一代产品,Rome核心EPYC能够分别带来58%、72%、79%、95%和95%的性能提升,可称得上质的飞跃!

此外,AMD与美国能源部、橡树岭国家实验室和Cray公司联合宣布了预期世界上最快的百亿亿级超级计算机,并定于2021年交付给橡树岭国家实验室。为实现预期超过 1.5 百亿亿次的预期处理性能,Frontier 系统设计使用未来新一代为高性能计算(HPC)和人工智能(AI)优化的AMD霄龙处理器和AMD Radeon Instinct 计算卡。

据了解,ORNL研究人员将使用Frontier系统及下一代AI技术,进行模拟和建模,以进一步探究天气、亚原子机构、基因组学、物理和其他重要科学领域的深层次相互作用。

软硬结合,GPU为数据中心锦上添花

在此次大会上,AMD还带来了最新的GPU和CDNA架构。

微信图片_20201113104104

据AMD数据中心GPU事业部资深市场开发经理秦骅介绍,CDNA架构会专注于计算性能,从而加速机器学习、高性能计算,而且可以通过Infinity Fabric互连总线提升多卡性能,并支持增强的企业级RAS特性、安全、虚拟化技术。

AMD Radeon Instinct MI50加速卡基于全球首款7nm GPU。具有灵活的混合精度能力,搭载高性能计算单元,能够处理多种类型的工作负载,包括一系列的HPC和深度学习应用程序。AMD Radeon Instinct MI50加速卡可以高效地处理工作流,比如快速训练复杂的神经网络,为数据中心和部门部署提供更高级别的浮点性能,全面的功能和更优的系统高效性。此外Radeon Instinct MI50支持PCIe Gen4 总线接口,从而可以和Zen架构的霄龙高效协同。

微信图片_20201113104118

此外,AMD还发布了用于加速计算的全新ROCm开放式软件平台,该平台支持新加速器的架构特性,包括具有优化性的深度学习操作(DLOPS)和AMD Infinity Fabric Link GPU互联技术。ROCm为规模化而设计,允许客户在开放式的环境中部署高性能、高能效的异构计算系统。

怎么样,AMD此次带来的干货确实够硬吧,自“Rome”问世以来,AMD一路披荆斩棘地将企业级市场份额提升至两位数,并且屡屡斩获行业用的大单,生态建设方面硬件合作伙伴也从2017年的22个极速拓展至140个,并且与腾讯云这样的龙头企业签约了深度合作。

总体来看AMD近两年的发展已经步入了一个新的阶段,行业深耕与生态建设将成为新的重点。同时,面对未来更加苛刻的计算需求,我们是不是也该期待下一代EPYC“Milan”的到来呢!