返回首页
Qwen3-Coder
找到 2 篇关于此标签的文章
llama.cppGLM-4.7
单张 RTX 4090 上最佳本地代理编码 LLM
一位 RTX 4090 用户通过 llama.cpp 及 Google turbo 量化方法,对 GLM-4.7、Nemotron-30B 和 Qwen3-Coder 进行本地代理编码基准测试。
Apr 61 分钟
Qwen3-Coderllama.cpp
Run Qwen3-Coder 80B Locally at 54GB With Apex Quantization
A community GGUF quantization shrinks Qwen3-Coder 80B to 54.1GB, making fast local coding inference practical.
Apr 52 分钟