找到 1 篇关于此标签的文章
阿里巴巴 Qwen 3.6 35B-A3B 在双消费级 GPU 上以 Q8 量化运行,实现 170 tokens/秒与完整 260K 上下文,社 区称其首次真正替代云端编程助手。