博客
这里是我分享技术文章的地方。
发布于 2025
AI 赋能:如何用 Claude 瞬间生成专业级系统架构图
2025年12月05日 收录于 实用工具
阅读时间少于 1 分钟
阅读更多告别繁琐的绘图工具,利用 Claude/Gemini 与特定提示词,一键生成美观、专业的系统架构 SVG/HTML 图表,让技术汇报与架构设计事半功倍。
Kubernetes上部署vLLM
2025年12月01日 收录于 技术分享
6 分钟阅读
阅读更多vLLM是一个专为大语言模型推理设计的高性能服务框架,其核心优势在于创新的PagedAttention技术,能够显著提升GPU内存利用率和推理吞吐量。通过Docker容器化封装,vLLM实现了环境标准化和依赖隔离,而Kubernetes部署则进一步带来了...
