本文主要介绍了不同场景下的CPU性能优化方案。

场景 方案选择 性能
ACK节点运行在开启NUMA的弹性裸金属服务器
  • 计算密集性负载
  • 在线业务负载
  • 数据库类型
  • 稳定的平均响应时RT(Response Time)。
  • 最小化CPU限流。
  • CPU使用率提升。
ACK节点运行在弹性裸金属服务器/大规格ECS实例(32核以上)
  • 大数据负载, 例如SparkJob
  • 机器学习负载, 例如TFJob, MPI
最大化利用碎片化CPU,提升CPU使用率。

ACK节点运行在开启NUMA的弹性裸金属服务器/大规格ECS实例(32核以上)

允许核绑定的延迟敏感负载和BestEffort负载的混合部署。

最大化保持延迟敏感负载的RT,CPU时间片和内存回收策略。

ACK节点运行在弹性裸金属服务器/大规格ECS实例(32核以上)

使用CPUShare模式的多种负载的混合部署。

最大化保持延迟敏感负载的RT,压缩BE负载对LS的影响在5%范围以内。
ACK节点运行在AMD弹性裸金属服务器
  • 计算密集性负载
  • 在线业务负载
  • Redis等内存数据库
  • 对8核CPU以下在线应用大幅降低RT 30%以上,提升吞吐45%。
  • 稳定的RT。
  • 最小化CPU限流。
  • CPU使用率提升。
ACK节点运行在ARM弹性裸金属服务器
  • 计算密集性负载
  • 在线业务负载
CPU拓扑感知调度
  • 对8核CPU以下在线应用大幅降低RT 20%以上,提升吞吐20%。
  • 稳定的RT。
  • 最小化CPU限流。
注册集群管理线下物理节点调度
  • 计算密集性负载
  • 自建数据库
CPU拓扑感知调度 具体性能与CPU类型有关。

CPU性能优化后,L3感知/缓存和内存带宽动态隔离、CCX/CCD亲和性调度、CPU拓扑感知优化效能提升幅度如下图所示。

1