【DKV】如何突破数据激增带来的数据中心互联的新瓶颈



英文原文作者:David Zambrano, Viavi Solution欧洲数据中心部门全球客户经理

中文翻译:高昆,DKV计划创始成员

原文发布于DCD英文官网,网址: https://www.datacenterdynamics.com/opinions/massive-increase-data-driving-dci-breaking-point/

维持数据中心互联(DCI)在整个生命周期内的健壮性(鲁棒性)测试,对实现性能优化、降低时延、确保可靠性和最大限度实现容量利用率非常重要。

随着对内容和虚拟化服务需求的激增,企业在全球各地的网络面临越来越大的压力并与日俱增。在传统IT网络流量之外,预计2020年将有近200亿设备通过物联网接入。随着网络流量持续攀高,数据中心和企业将设法把基础设施和人员发挥到极致。

数据激增、日益复杂性和成本压力等各方面都对维持网络性能和可靠性提出了新挑战。因此,网络管理员和CIO需要更充分和高效的流程对现有数据中心互联(DCI)网络,进行从物理层到应用侧的测试,确保最终用户体验和安全性满足服务水平协议(SLA)的条款。

数字化洪峰

对内容的海量需求和连接设备激增都给企业网络带来空前的压力,特别是数据中心有效管理、数据分布和交换所必需的数据将受到影响。与此同时,数字化转型和流程自动化更快推动的数据中心互联DCI的发展。当前主要挑战是在IT预算和资源压缩的情况下如何支撑继续前进,提供更快速、可靠的访问速度和令人满意的性能。

企业致力于为业务运营和消费者提供稳定的连接,网络随着应用系统、系统架构和运营需要的多样性日益复杂。不仅如此,DCI速率已实现或超过100G,400G已经成为明确需求。更不必说600G和800G也已在测试中。随着传输速率快速增长,网络管理员必须在预算和电力受限的情况下直面解决难题。

无主机(Serverless)和边缘计算技术缓解了部分压力,把数据中心外部的处理过程推到网络边缘或云端;这同时也带来了额外的挑战。必须对平衡网络端对端的带宽给予重视,同样要确保数据传输和存储。

DCI的极限测试

在当前数据中心内,有成千上万的连接器、线缆、传输设备、转发器和网络连接。这同样也意味着潜在故障点,这些连接设备通常比外部接入数据中心的连接更引发重视。令人意外的是很多DCI网络并未进行例行测试,即便这可以实现快速故障定位,更重要的是具备了预防的能力。定期网络测试和监控是满足SLA要求和内部性能目标的关键手段。

在尝试满足带宽持续需求方面,有些数据中心管理者正在搭建采用DP-16QAM 模块的200G波长的网络,在同样的光纤上实现倍增的DCI传输容量。该技术可以帮助消除瓶颈,在把这一传输技术扩充到现有系统支撑更多流量前对200G新网络连接进行测试非常重要,因为有些特定波长可能存在极限,成为实现200Gbps传输率的障碍。在正式投入使用前,不先对波长进行压力测试无法确认和识别这些限制。

在200G之后,我们已经开始了向400G的演进,这代表着网络生态系统中规范的升级,以一种新型和独特的方式提供灵活性和可扩展性。不过,400G技术因为物理层的额外复杂性,在测试上的挑战在所难免。PAM4调制方式的利用率造成了连接错误率攀升,简单地量化错误或基于“零”误差测试远远不够。对误差分布和统计数据有完整的理解非常必要。

为消除这些挑战,前向纠正机制(FEC)应用在400G技术中,可以实现数据包级有效的无差错链接。也要求有新型更有效的测试方法在编码和PAM4调制中验证极限和诊断问题。网络测试方法再也不能仅限于网络协议(七层)其中的一层,必须覆盖从物理层到以太网各层链接。

DCI网络向更高速度升级,进行模拟测试相关工作非常重要,通过开放应用编程接口(API)和包括NETCONF/YANG协议实现100G, 200G和400G压测,对结果和性能进行对比和评估。这有助于在问题出现前精确定位和解决基础层次的问题,更重要的是,利用网络自动化机制可以在有些应用场景降中低人为干预。

未雨绸缪

归根到底,在整个DCI的生命周期中保持健壮性测试非常重要,可以优化性能,降低时延,确保可靠性和实现最大容量利用率。为了评估DCI连接,压力测试应该在一致的基础上完成,目的是在故障发生前识别出潜在隐患。通过常规测试和测量手段,工程师团队可以预测网络容量极限,实现快速解决问题和减少麻烦。

不仅如此,在今天日益增长的虚拟化和基于云的网络中,DCI网络监控需要实现自动化和虚拟化以提供监控和诊断功能并解决全部网络设施的异常情况。不过,所依赖的光纤网络也需要进行端到端的保持峰值性能的健壮性测试。

结论

企业竭尽所能解决数据、设备和连接物的指数级增长带来的问题,200G和400G技术出现后,可赋能DCI网络实现对高速、无缝性能日益增长的预期。为了让这一演进尽可能平顺,对DCI网络实施细致严格的测试和测量至关重要,确保DCI网络可以实现当前和未来SLA(服务水平协议)所需的效率、灵活性和性能。