Kubernetes GPU 虚拟化实战:HAMi DRA 模式完整指南
从安装到验证的完整实践——在 K8s 1.34+ 上部署 HAMi DRA 模式,通过原生 ResourceClaim 和 DevicePlugin 兼容两种方式实现 GPU 显存与算力的细粒度切分。
3 分钟阅读
从安装到验证的完整实践——在 K8s 1.34+ 上部署 HAMi DRA 模式,通过原生 ResourceClaim 和 DevicePlugin 兼容两种方式实现 GPU 显存与算力的细粒度切分。
3 分钟阅读
华为云 Agent Harness 在云原生托管架构中的落地实践,从冷启动延迟、状态持久化、安全隔离三大挑战出发,详解 microVM 级轻量沙箱、容量预测调度与 Serverless 架构的设计思路。
2 分钟阅读
从基础设施演进脉络看,Kubernetes 更像是虚拟化到 AI Native 之间的过渡层。AI Infra 正在打破 K8s Everything 的格局,未来的增长点在 AI Gateway、GPU Scheduler、Inference Fabric 之上。
阅读时间少于 1 分钟