- 随着容器化以及容器编排技术的普及,越来越多的上层业务正开始拥抱K8s生态,Kubernetes并且能够在任何基础设施上提供一致的云上体验。然而,面对边缘计算、人工智能和大数据等作业场景,现有的业务迁移到K8s平台将会面对诸多问题。华为云给出了两个专业的云原生产品KubeEdge和Volcano。或许你会问到,他们的核心优势有哪些?目前有哪些应用实践?本专题为大家一一呈现。 随着容器化以及容器编排技术的普及,越来越多的上层业务正开始拥抱K8s生态,Kubernetes并且能够在任何基础设施上提供一致的云上体验。然而,面对边缘计算、人工智能和大数据等作业场景,现有的业务迁移到K8s平台将会面对诸多问题。华为云给出了两个专业的云原生产品KubeEdge和Volcano。或许你会问到,他们的核心优势有哪些?目前有哪些应用实践?本专题为大家一一呈现。
- Volcano是基于Kubernetes构建的一个通用批量计算系统,它弥补了Kubernetes在“高性能应用”方面的不足,支持TensorFlow、Spark、MindSpore等多个领域框架,帮助用户通过Kubernetes构建统一的容器平台。 Volcano是基于Kubernetes构建的一个通用批量计算系统,它弥补了Kubernetes在“高性能应用”方面的不足,支持TensorFlow、Spark、MindSpore等多个领域框架,帮助用户通过Kubernetes构建统一的容器平台。
- 8月21日-23日,Linux基金会旗下云原生与开源顶级盛会KubeCon + CloudNativeCon + Open Source Summit + Al_dev China 2024 在中国香港盛大召开,华为重磅参会,与世界共探云原生 × AI发展。华为云带来Keynote与技术议题分享20+场,覆盖云原生 AI、智能边缘、多云容器、混部调度、容器沙箱、数据库、流量治理等前沿领域... 8月21日-23日,Linux基金会旗下云原生与开源顶级盛会KubeCon + CloudNativeCon + Open Source Summit + Al_dev China 2024 在中国香港盛大召开,华为重磅参会,与世界共探云原生 × AI发展。华为云带来Keynote与技术议题分享20+场,覆盖云原生 AI、智能边缘、多云容器、混部调度、容器沙箱、数据库、流量治理等前沿领域...
- 随着云原生技术的蓬勃发展,云原生已成为企业数字化转型共识,当前超过80%的华为云客户已采用云原生技术,以华为终端云为例,通过全面践行云原生,将资源利用优化到了40%,将资源分配率提高到了87%。 随着云原生技术的蓬勃发展,云原生已成为企业数字化转型共识,当前超过80%的华为云客户已采用云原生技术,以华为终端云为例,通过全面践行云原生,将资源利用优化到了40%,将资源分配率提高到了87%。
- 北京时间2023年8月17日,Volcano 社区v1.8.0版本正式发布,此次版本增加了新特性。 北京时间2023年8月17日,Volcano 社区v1.8.0版本正式发布,此次版本增加了新特性。
- 企业进行与AI相关的业务时常因为构建AI不利而导致业务收益下降或者业务无法完成。启智章鱼项目(OPENI-OCTOPUS)是一个集群管理和资源调度系统,支持在GPU集群中运行AI任务作业(比如深度学习任务作业)。平台提供了一系列接口,能够支持主流的深度学习框架。基于Kubernetes开发资源调度平台,以镜像方式管理任务运行环境,一次配置随处可用。 企业进行与AI相关的业务时常因为构建AI不利而导致业务收益下降或者业务无法完成。启智章鱼项目(OPENI-OCTOPUS)是一个集群管理和资源调度系统,支持在GPU集群中运行AI任务作业(比如深度学习任务作业)。平台提供了一系列接口,能够支持主流的深度学习框架。基于Kubernetes开发资源调度平台,以镜像方式管理任务运行环境,一次配置随处可用。
- 由Linux Foundation组织的LFX Mentorship计划,从19年开始为CNCF各个开源社区中的开发人员持续提供带薪实习和指导。往年已获16w+申请,发起1200+课题,毕业近1000实习生,发放超过300万美金报酬。2025年春季申请时间为 2月5日-2月18日,远程实习将从3月3日开始为期三个月。 由Linux Foundation组织的LFX Mentorship计划,从19年开始为CNCF各个开源社区中的开发人员持续提供带薪实习和指导。往年已获16w+申请,发起1200+课题,毕业近1000实习生,发放超过300万美金报酬。2025年春季申请时间为 2月5日-2月18日,远程实习将从3月3日开始为期三个月。
- 作者简介:李乾坤,喜马拉雅AI云开发工程师,专注于k8s、机器学习平台等领域。缘起我的职业经历蛮单调的,从毕业至今一直在一家公司。但岗位经历还蛮丰富的,一开始在公司做业务,后来做容器化,21年8月份转入公司的AI云平台团队负责机器学习任务训练,由此开始接触volcano。到目前为止,为volcao提过多个pr,包括根据label筛选volcano可以调度的node、 支持queue资源配额、... 作者简介:李乾坤,喜马拉雅AI云开发工程师,专注于k8s、机器学习平台等领域。缘起我的职业经历蛮单调的,从毕业至今一直在一家公司。但岗位经历还蛮丰富的,一开始在公司做业务,后来做容器化,21年8月份转入公司的AI云平台团队负责机器学习任务训练,由此开始接触volcano。到目前为止,为volcao提过多个pr,包括根据label筛选volcano可以调度的node、 支持queue资源配额、...
- 在刚刚闭幕的 KubeCon + CloudNativeCon Europe 2026 上,全球开源精英与产业力量齐聚阿姆斯特丹,共同见证了云原生领域的又一次浪潮。本届大会以“Keep Cloud Native Moving”为主题,传递出一个清晰的信号:云原生已远超资源编排的范畴,正加速进化为AI——尤其是LLM与Agentic AI——的核心运行底座。 在刚刚闭幕的 KubeCon + CloudNativeCon Europe 2026 上,全球开源精英与产业力量齐聚阿姆斯特丹,共同见证了云原生领域的又一次浪潮。本届大会以“Keep Cloud Native Moving”为主题,传递出一个清晰的信号:云原生已远超资源编排的范畴,正加速进化为AI——尤其是LLM与Agentic AI——的核心运行底座。
- 本实战案例完整演示了基于华为云Volcano调度器构建企业级AI训练与推理一体化平台的全流程,涵盖K8s集群部署、Volcano安装配置、GPU资源池管理、分布式训练Job定义、模型服务化部署等核心环节,通过“昼推夜训”调度策略将GPU资源利用率从30%提升至70%,并提供可验证的YAML配置和监控方案确保实战可操作性。 本实战案例完整演示了基于华为云Volcano调度器构建企业级AI训练与推理一体化平台的全流程,涵盖K8s集群部署、Volcano安装配置、GPU资源池管理、分布式训练Job定义、模型服务化部署等核心环节,通过“昼推夜训”调度策略将GPU资源利用率从30%提升至70%,并提供可验证的YAML配置和监控方案确保实战可操作性。
- 深度解析华为云Volcano v1.14 AI统一调度平台,剖析动态节点分片多调度器架构、Gang调度原子性保障、DRF主导资源公平分配及GPU/NPU异构资源优化。测试显示Volcano实现950 Pod/s调度吞吐、45ms P99延迟,GPU利用率从35%提升至72%,任务调度成功率从42%提升至98%,为企业AI平台提供高效、公平、可靠的统一调度方案。 深度解析华为云Volcano v1.14 AI统一调度平台,剖析动态节点分片多调度器架构、Gang调度原子性保障、DRF主导资源公平分配及GPU/NPU异构资源优化。测试显示Volcano实现950 Pod/s调度吞吐、45ms P99延迟,GPU利用率从35%提升至72%,任务调度成功率从42%提升至98%,为企业AI平台提供高效、公平、可靠的统一调度方案。
- 随着大语言模型(LLM)日益成为现代应用的核心,支持它们的基础设施必须不断演进,以满足苛刻的性能、可扩展性和成本要求。在生产环境中部署 LLM 面临着独特的挑战:模型需要大量资源,推理工作负载变化显著,用户期望低延迟和高吞吐量。Kthena Router 正面应对这些挑战。本文带领你深入解析 Kthena Router! 随着大语言模型(LLM)日益成为现代应用的核心,支持它们的基础设施必须不断演进,以满足苛刻的性能、可扩展性和成本要求。在生产环境中部署 LLM 面临着独特的挑战:模型需要大量资源,推理工作负载变化显著,用户期望低延迟和高吞吐量。Kthena Router 正面应对这些挑战。本文带领你深入解析 Kthena Router!
- Volcano社区 v1.14 现已正式发布。随着 AI 业务形态从单一的离线训练向在线推理、Agent 智能体等多元化场景延伸,调度系统面临着前所未有的挑战。v1.14通过架构级的创新,在保持大规模批量计算优势的同时,补齐了对延迟敏感型业务的调度短板,向着 “AI训推、RL、Agent全场景统一调度平台” 的目标迈出了坚实一步。 Volcano社区 v1.14 现已正式发布。随着 AI 业务形态从单一的离线训练向在线推理、Agent 智能体等多元化场景延伸,调度系统面临着前所未有的挑战。v1.14通过架构级的创新,在保持大规模批量计算优势的同时,补齐了对延迟敏感型业务的调度短板,向着 “AI训推、RL、Agent全场景统一调度平台” 的目标迈出了坚实一步。
- Kthena 是一个专为 Kubernetes 设计的云原生、高性能 LLM 推理路由和编排、调度系统。Kthena v0.3.0现已正式发布,标志着 Kthena 已经成为一个更加健壮且具有可扩展性的 AI 推理平台。此版本在 ModelServing、Router 和 ModelBooster 方面引入了重大增强。 Kthena 是一个专为 Kubernetes 设计的云原生、高性能 LLM 推理路由和编排、调度系统。Kthena v0.3.0现已正式发布,标志着 Kthena 已经成为一个更加健壮且具有可扩展性的 AI 推理平台。此版本在 ModelServing、Router 和 ModelBooster 方面引入了重大增强。
- 2026年1月10日,TinyPro 正式发布 v1.4.0 版本;Volcano发布AgentCube,构建AI Agent时代的云原生基础设施... 2026年1月10日,TinyPro 正式发布 v1.4.0 版本;Volcano发布AgentCube,构建AI Agent时代的云原生基础设施...
上滑加载中
推荐直播
-
华为云码道-玩转OpenClaw,在线养虾2026/03/11 周三 19:00-21:00
刘昱,华为云高级工程师/谈心,华为云技术专家/李海仑,上海圭卓智能科技有限公司CEO
OpenClaw 火爆开发者圈,华为云码道最新推出 Skill ——开发者只需输入一句口令,即可部署一个功能完整的「小龙虾」智能体。直播带你玩转华为云码道,玩转OpenClaw
回顾中 -
华为云码道-AI时代应用开发利器2026/03/18 周三 19:00-20:00
童得力,华为云开发者生态运营总监/姚圣伟,华为云HCDE开发者专家
本次直播由华为专家带你实战应用开发,看华为云码道(CodeArts)代码智能体如何在AI时代让你的创意应用快速落地。更有华为云HCDE开发者专家带你用码道玩转JiuwenClaw,让小艺成为你的AI助理。
回顾中 -
Skill 构建 × 智能创作:基于华为云码道的 AI 内容生产提效方案2026/03/25 周三 19:00-20:00
余伟,华为云软件研发工程师/万邵业(万少),华为云HCDE开发者专家
本次直播带来两大实战:华为云码道 Skill-Creator 手把手搭建专属知识库 Skill;如何用码道提效 OpenClaw 小说文本,打造从大纲到成稿的 AI 原创小说全链路。技术干货 + OPC创作思路,一次讲透!
回顾中
热门标签