功能优化

人工智能平台 PAI - KV Store全局上下文缓存发布

EAS部署LLM服务的过程中支持配置KV Store的全局上线文缓存,提升LLM推理吞吐性能。
国际站产品文档

https://alibabacloud.com/help/doc-detail/110985.htm

优化内容

EAS部署LLM服务的过程中支持配置KV Store的全局上线文缓存,通过GPU→内存→Redis kv metadata的多级存储查询来提升kvcache命中率,提升LLM推理吞吐性能。

阿里云第七代ECS正式发售

整体算力提升40%,芯片级安全防护。
搭载第三代英特尔®至强®可扩展处理器(代号"IceLake")。

  • 销售支持

    1对1售前咨询

  • 售后支持计划

    24/7 技术支持 每季度 6 个免费工单 更快的服务响应时间

  • 阿里云为客户提供专业、灵活的支持服务,以满足您多样化的业务需求。