📝 技术分享
最近更新于 2026年05月27日
22
文章73
标签52
分钟阅读发布于 2025
国产GPU技术现状与应用市场调研
2025年12月09日 收录于 技术分享
2 分钟阅读
阅读更多2025年中国AI芯片市场形成GPU与ASIC两大技术路线并驾齐驱格局。GPU阵营主打通用性与生态兼容,ASIC阵营追求专用优化与极致性能。两大阵营各具优势,在通用性与专用性间博弈,共同驱动国产算力产业快速发展...
Kubernetes上部署vLLM
2025年12月01日 收录于 技术分享
6 分钟阅读
阅读更多vLLM是一个专为大语言模型推理设计的高性能服务框架,其核心优势在于创新的PagedAttention技术,能够显著提升GPU内存利用率和推理吞吐量。通过Docker容器化封装,vLLM实现了环境标准化和依赖隔离,而Kubernetes部署则进一步带来了...