2025-04-08 · 12 min
vLLM SSM架构性能调优:Mamba + Transformer混合推理实录
深入分析 Qwen3.5-27B 在 llama.cpp 下的性能瓶颈——kv_unified=false 导致的 CPU↔GPU 传输问题,切换至 vLLM 后的完整性能对比...
vLLMQwenInference
2025-03-22 · 8 min
OpenClaw + CosyVoice3:构建低延迟全双工语音对话系统
从 Telegram Bot 到 X-Talk 方案的完整调研,claw-voice-chat 在 Tailscale HTTPS 下部署实践...
Voice AIOpenClawTTS
2025-03-05 · 6 min
反应扩散系统与 AI Agent 竞争模块架构的数学类比
Hopfield 网络、Langevin 动力学到 Kuramoto 同步——四个开放数学问题:收敛保证、非线性点火相变...
Neural DynamicsMath