技术分享

发布于 2026

2026 AI 自由意志开启？
2026年01月29日收录于技术分享
阅读时间少于 1 分钟
2026年初，一个名为Clawdbot的开源项目在GitHub上悄然掀起风暴。它没有发布会，没有融资新闻，却以一种近乎叛逆的姿态，撕裂了我们与机器交互的固有范式。
阅读更多

发布于 2025

国产GPU技术现状与应用市场调研
2025年12月09日收录于技术分享
2 分钟阅读
2025年中国AI芯片市场形成GPU与ASIC两大技术路线并驾齐驱格局。GPU阵营主打通用性与生态兼容，ASIC阵营追求专用优化与极致性能。两大阵营各具优势，在通用性与专用性间博弈，共同驱动国产算力产业快速发展...
阅读更多

Kubernetes上部署vLLM
2025年12月01日收录于技术分享
6 分钟阅读
vLLM是一个专为大语言模型推理设计的高性能服务框架，其核心优势在于创新的PagedAttention技术，能够显著提升GPU内存利用率和推理吞吐量。通过Docker容器化封装，vLLM实现了环境标准化和依赖隔离，而Kubernetes部署则进一步带来了...
阅读更多