Category: 云原生

Kubernetes GPU 虚拟化实战：HAMi DRA 模式完整指南

从安装到验证的完整实践——在 K8s 1.34+ 上部署 HAMi DRA 模式，通过原生 ResourceClaim 和 DevicePlugin 兼容两种方式实现 GPU 显存与算力的细粒度切分。

Tags:

Categories:

3 分钟阅读

云原生 Agent 托管的高效范式：Agent Harness Infra 体系化设计

华为云 Agent Harness 在云原生托管架构中的落地实践，从冷启动延迟、状态持久化、安全隔离三大挑战出发，详解 microVM 级轻量沙箱、容量预测调度与 Serverless 架构的设计思路。

Tags:

Categories:

2 分钟阅读

Web Infra vs AI Infra：K8s 擅长的事正在被重新定义

从基础设施演进脉络看，Kubernetes 更像是虚拟化到 AI Native 之间的过渡层。AI Infra 正在打破 K8s Everything 的格局，未来的增长点在 AI Gateway、GPU Scheduler、Inference Fabric 之上。

Tags:

Categories:

阅读时间少于 1 分钟

[i18n] ui all Categories