技术博客

    技术博客  >  刷新纪录🤙!华锐AMQ在深信服信创超融合上的极限表现→
    刷新纪录🤙!华锐AMQ在深信服信创超融合上的极限表现→
    背景图 2024-08-03 11:35:25

    领跑AI品牌banner

    金融行业的信创升级正逐步深化,已从最初的周边系统替换,发展至对关键及核心业务系统的全面替代。在这一过程中,分布式架构成为构建关键核心业务系统的首选。而消息队列(MQ)中间件作为这一架构中的基础平台,对于实现业务系统的解耦和模块化拆分,发挥着至关重要的作用。

    用户将X86平台下的MQ移植到信创平台下,性能表现如何?近期,深信服携手华锐技术完成了采用深信服信创超融合承载华锐AMQ分布式低时延消息中间件兼容、可靠性验证,本文将分享相关的测试结果与调优思路,为金融用户在选型中提供参考。

    华锐技术是分布式基础软件公司和证券资管行业核心业务平台提供商,自主研发的分布式架构下低时延消息队列产品AMQ,功能对标IBM MQ、Active MQ、Rocket MQ和Kafka等队列产品,并在可用性、可靠性、性能和灵活性方面都有明显提升,广泛的应用在银行证券基金等关键行业的核心场景。

    业务系统介绍

    消息队列MQ(Message Queue)正成为企业IT系统通信的核心,以其低耦合性、可靠的消息传递、广播能力、流量控制和确保最终数据一致性的特点,支持异步RPC通信。它由生产者创建消息,消息服务端负责存储和分发,消费者则接收并根据消息执行业务逻辑,共同构成了消息队列的基本运作流程。

    业务系统介绍

    除以上三个核心组件外,华锐AMQ产品提供控制管理中心(Domainserver)。该中心统一管理多套消息服务器集群,负责系统的配置、监控和系统运维。

    MQ的典型应用场景主要有三个:

    1. 流量削峰:在高峰期将流量限制在系统可承受的范围内,避免因为突发的大量请求导致系统崩溃。

    2. 应用解耦:将系统中的不同模块解耦,使得可以独立地进行开发、部署和升级

    3. 异步处理:主要应用于实时性要求不严格的场景,发送方将消息发送到队列后即可继续执行其他任务,而不需要等待接收方的即时响应。这种异步通信方式提高了系统的响应速度和吞吐量,使得系统能够更好地处理大量并发请求。

    测试环境介绍

    AMQ应用集群部署环境

    本次测试采用Master - Slave 主从同步部署,生产者将消息写入到 Master 节点,Master 会同步数据到 Slave 形成副本,如果有多个消费者就可以去不同的节点进行消费。

    AMQ应用集群部署环境

    AMQ虚拟机资源配置

    虚拟机MQ_1部署Producer和Consumer以及压测软件,虚拟机MQ_2和MQ_3部署AMQ Master和Slave集群软件。

    AMQ虚拟机资源配置

    AMQ虚拟机资源配置

    超融合服务器资源配置

    超融合服务器采用标准部署架构,架构图及软硬件配置如下:

    超融合服务器资源配置超融合服务器资源配置

    X86裸金属资源配置

    采用2台物理服务器,主从架构部署AMQ 集群,配置为CPU Intel Xeon Gold 6132@2.60GHz + Intel Xeon Gold 6246@3.40GHz,以及1台压测机进行压测。

    X86裸金属资源配置

    测试方法介绍

    部署三台鲲鹏服务器。

    在鲲鹏服务器01上,开通一台虚拟化服务器,启动生产者(Producer)和消费者(Consumer)进程,并运行AMQ_Perf工具,构建压测机

    在鲲鹏服务器02和03上,各开通一台虚拟化服务器,部署AMQ集群,并且在AMQ集群开启持久化。通过AMQ_Perf工具可以实现生产者(Producer)不同速率下消息发送,以及统计消费者(Consumer)接收不同消息发送速率下的时延结果、吞吐量。

    主要测试不同TPS压力下的响应时间&时延。响应时间即完成一次事务所需要的时间。一般从AVG、PCT90、PCT95、PCT99(PCT99可以简称P99)等多个维度去看。我们主要关注AVG和PCT99两个指标,其中AVG指标为P50\P90\P95\P99平均值。

    • AVG指标:

    表示平均时延(Latency),通常用于衡量消息处理的平均时间,包括消息从生产者发送到消费者接收并处理的整个过程。消息处理的平均时间是衡量MQ性能的重要指标,因为它直接影响到消息的延迟和系统的响应时间。一个较低的平均处理时间,意味着系统能够更快地处理消息,从而提高整体的吞吐率和效率。

    • PCT指标:

    在MQ中间件中,PCT通常用于衡量消息处理时间的分布情况,可以反映消息队列在保证消息可靠传递方面的表现。例如,P95、P99等表示95%或99%的消息处理时间低于某个值。这种指标有助于识别系统中的异常情况和性能瓶颈。通过分析PCT,可以了解大多数消息的处理时间以及少数消息的延迟情况,从而优化系统配置和资源分配,确保系统的高可用性和稳定性

    值得一提的是,全链路时延统计的方法是将生产者(Producer)和消费者(Consumer)部署在同一虚拟机中,通过生产者(Producer)产生消息信息,发送到AMQ集群,消费者(Consumer)获取消息信息,即记录一次时延,从而获取批量发送不同数据包场景下的时延情况。时延=消费者(Consumer)获取到时间 - 生产者(Producer)产生消息时间。

    通过AVG和P99指标数据,以便更客观评价华锐AMQ在深信服信创超融合平台上的性能表现

    测试内容介绍

    本次测试的内容主要通过以下场景进行测试和对比,获取不同TPS下,AVG和PCT99:

    场景一:测试在X86裸金属运行RedHat系统下,AMQ的AVG和PCT99数据表现。

    场景二:测试在未对超融合平台进行优化情况下,采用深信服信创超融合平台,创建麒麟虚拟机运行AMQ的AVG和PCT99数据表现。

    场景三:测试在对超融合平台进行调优情况下,采用深信服信创超融合平台,创建麒麟虚拟机运行AMQ的AVG和PCT99数据表现。

    通过以上三个场景的对比,可直观地查看在采用深信服信创超融合平台与X86裸金属架构下,承载AMQ产品在小规模TPS,中等规模TPS,以及极限45W TPS规模下的性能表现。

    测试结果介绍

    从测试场景一的X86裸金属架构测试结果中可以看出,45W消息速率下,已经达到了极限速率,此时p99的波动变大,出现X86服务器由于波动造成时延更高的情况。

    测试场景一

    从测试场景二的采用深信服信创超融合(未调优)的测试结果中可以看出,在未调优的情况下,高压力超过15W TPS的P99响应时间波动大,时延达到秒级,不满足使用要求,在超过15W TPS情况下未记录数据。

    测试场景二

    从测试场景三的采用深信服信创超融合平台(调优)的测试结果中可以看出,调优之后,高压力超过15W TPS的P99响应时间波动小。

    测试场景三

    效果对比

    将X86裸金属架构下的avg(us)和深信服信创超融合对比:

    TPS在小于20W小压力场景下,深信服信创超融合性能略低于X86裸金属架构。

    TPS在20W到35W之间,深信服信创超融合比X86裸金属架构性能提升10%

    TPS在45W高压力的场景下,深信服信创超融合比X86裸金属架构性能提升37%

    avg(us)延时对比

    通过将X86裸金属架构下的P99(us)和深信服信创超融合对比:

    TPS在性能极限45W以下,低于X86裸金属架构性能30%

    TPS在45W,深信服信创超融合比X86裸金属性能提升20%

    P99(us)延时对比

    出现上述结果原因是,AMQ使用单核轮询的方式去处理消息,依赖于CPU的单核性能,而ARM的单核性能通常比X86服务器要差所以avg时延会略微高于X86

    p99统计的是消息中时延最高的那一部分,这一部分通常是由于消息得不到CPU的及时处理导致了时延增加,对于单核性能的差距更加敏感。

    从avg和P99指标来看,当TPS的压力越大,如avg的指标在大于35W时,P99的指标在极限45W时深信服信创超融合平台性能会优于X86裸金属架构。在高压力场景下,深信服对超融合平台和虚拟机进行调优设置,保障资源能够得到有效的处理,调优手段如下:

    1. 鲲鹏服务器的硬件设置调整:

    对于鲲鹏服务器的调整修改BIOS设置(参考鲲鹏最佳实践文档)、电源策略修改为性能模式、内存刷新速率改为自动以提升服务器的处理能力。

    2. 对于超融合平台调整:

    由于AMQ性能参考为延时,主要主要聚焦在网络的调整,包括aNet网络的转发核心调整到四核提升网络吞吐、网络转发核位置调整到numa0,与网卡所在的numa一致(降低内存时延,消除网卡跨numa的开销);开启物理网卡切分,虚拟机使用直通的VF网卡。

    3. 超融合虚拟机设置调整:

    聚焦在CPU的调度、CPU预留、将AMQ标记为重要虚拟机保证性能,开启虚拟机网络亲和;其中CPU预留和标记重要虚拟机,保证在性能抢占情况下资源分配,以提升性能。

    联合测试结论

    对比华锐AMQ行业内的最佳实践“30W TPS情况下的平均时延小于100us”,华锐AMQ与深信服信创超融合的性能联合调优测试表现,高于华锐AMQ的参考值水平

    在深信服信创超融合和X86性能对比中,深信服信创超融合得益于对平台调优,压力越大性能表现越好,尤其在极限45W TPS场景下avg性能为29usP99性能表现为85us,能够满足生产的场景的需求。

    云朋友 实干派是深信服打造的一档生态伙伴技术内容专栏,将定期为大家推送合作伙伴性能调优相关的技术解析、场景实践等内容,为大家深度解析深信服在云计算领域的创新能力、技术动态、场景应用及前瞻分析。

    联系我们