技术分享
Posts in 2025
Kubernetes上部署vLLM
Dec 01, 2025 in 技术分享
2 minute read
Read morevLLM是一个专为大语言模型推理设计的高性能服务框架,其核心优势在于创新的PagedAttention技术,能够显著提升GPU内存利用率和推理吞吐量。通过Docker容器化封装,vLLM实现了环境标准化和依赖隔离,而Kubernetes部署则进一步带来了...
Ghelper 使用流程指导
Dec 01, 2025 in 技术分享
less than a minute
Read moreGhelper 是一个专门为科研、外贸、开发人员服务的上网加速工具,本文介绍其安装和使用流程。