NVIDIA
找到 12 篇关于此标签的文章
Hugging Face 披露百大热门硬件配置 — 本地 AI 跑起来,还是靠消费级显卡
Hugging Face 首次公开平台最热门的 100 个硬件配置,揭示本地 AI 部署的真实硬件偏好。消费级显卡仍是主流,这比厂商参数表更能说明 AI 落地的真实门槛在哪里。
NVIDIA 提出 Agent 系统极限协同设计 — 基础设施层要重新来过
NVIDIA 本周发文提出「极限协同设计」,核心判断是 Agent 系统复杂性已超出传统架构的承载能力,从芯片到软件必须从头协同优化。这不只是技术主张,更是基础设施话语权的提前卡位。
NVIDIA 把 AI Agent 装进汽车 — 智能座舱从听指令走向会思考
NVIDIA 发布车载 AI Agent 全栈方案,用"云到车"架构把大模型能力装进汽车。车企智能座舱竞赛从比语音识别准确率,升级为比谁能让孩子主动思考和规划——但成本和安全认证仍是落地障碍。
RTX 5000 48G 显卡让 Qwen3.6 满血跑——本地高精度 AI 有了甜点配置
一张 48G 显存的 RTX 5000 显卡,让 Qwen3.6 27B 模型在不严重压缩下实现 20 万 token 长文本与 80 TPS 生成速度。这意味着花约 5 万人民币即可本地部署不降智的 AI 助手,避开云端隐私风险与低配压缩导致的错误累积。
APEX量化新增25款模型:百亿参数AI塞进家用显卡,算力门槛正被抹平
开源项目APEX推出针对MoE模型的新量化方案,一个月新增25款以上压缩模型,并推出极低体积的I-Nano层级。这让原本需企业级算力的百亿参数AI,现在单张家用显卡即可运行,大幅降低本地部署成本。
GPU 跑 Agent 利用率仅三四成 — 专用推理芯片的窗口正在打开
YC 指出当前 GPU 跑 Agent 工作流利用率仅 30-40%,根因是芯片架构与 Agent 循环分支模式错配。专用推理芯片的创业机会由此而生,但生态锁定与需求演化仍是硬风险。
英伟达用 AI Agent 优化供应链 — 大模型开始抢运筹学专家的饭碗
英伟达推出 cuOpt Agent 技能,用大模型解决传统运筹学建模慢、难调整的痛点。这标志着 AI Agent 正式切入供应链决策核心,从聊天走向干苦活,值得传统管理者关注。
NVIDIA 48GB 显存专业卡 A5000 Pro 上架 — 本地跑大模型不用再切双卡了
NVIDIA RTX A5000 Pro Blackwell 48GB 显卡售价约 4500 美元,单卡即可运行 Qwen 27B 量化模型。对想本地部署 AI 的中小企业,这比双卡方案更简洁,但性价比仍需仔细算账。
英伟达新模型将单张照片变无限3D世界—生成式AI开始接管虚拟场景基建
英伟达发布 Lyra2 模型,能从单张照片生成连续且不崩坏的无缝 3D 世界。这标志着生成式 AI 从“画一张图”进化到“造一个空间”,游戏和影视行业的资产制作流程正面临重写。
RTX 5080 跑本地编程模型引热议 — 消费级显卡开始抢云端 AI 的活
r/LocalLLaMA 社区热议 RTX 5080+64GB RAM 跑量化编程模型的最佳方案。开发者认真考虑把 AI 编程助手从云端搬回家,消费级硬件正成为 AI 编程的新基础设施,值得非技术背景的管理者关注。
NVIDIA 自研 4 位量化把 26B 模型塞进消费显卡 — 精度损失不到 1%
NVIDIA 发布 NVFP4 量化版 Gemma-4-26B,压缩至 18.8GB 可在消费显卡运行,6 项基准测试精度损失均不超过 0.7%。4 位量化正从妥协变成优选,但这也是 NVIDIA 生态锁定的一步棋。
NVIDIA 开源 AITune:自动为 PyTorch 模型选择最快推理后端
NVIDIA 开源推理优化工具 AITune,可自动对多个推理后端进行基准测试,并为 PyTorch 模型选出最优配置,显著降低工程团队的手动调优成本。