Gemini

找到 5 篇关于此标签的文章

Todoist 让 AI 听你碎碎念就建任务 — 语音终于不用先转文字了

Doist 的 Todoist 上线 Ramble 功能，用户对着手机说话，AI 实时拆解成任务列表，跳过转文字环节。值得关心的是：AI 从等你提问变成边听边干，语音优先的生产力工具可能真要来了。

Google 发布 Gemini Agent 治理指南 — 大厂竞争焦点从写 Demo 转向管基建

Google Cloud 发布 Gemini 企业级 Agent 平台及五份生产部署指南，涵盖长时任务、治理与多智能体协同。这标志着行业焦点正从跑通 Demo 转向严管基建，企业用 AI 不再只是聊天，而是要建一套带权限和审计的数字员工体系。

May 51 分钟

Qwen-ImageFlux

Mac 本地实测 10 个 AI 画图模型：文化偏见比画质更值得担心

有人在 M1 Max 上跑了 10 个本地图像生成模型，发现 Flux 写实最强但英语偏见严重，Qwen-Image 蒸馏版反而更快更好。最关键的发现是：训练数据来源比模型大小更能决定非英语内容准不准。

May 31 分钟

GeminiDiscord

一个开发者想让 AI 实时看着你画画给建议——这个想法离真正可用还有多远

Reddit 上一位独立开发者公开了一个构想：把多模态大模型（能同时理解图像和语音的 AI）接入 Discord，让它实时看用户在 Blender 或 Photoshop 里的操作画面，并用语音给出反馈。这个方向值得关注，因为它触碰了 AI 辅助创作工具的一个真实痛点——创作者需要「不打断手感」的即

Apr 191 分钟

GoogleGemini

Reddit 社区呼吁谷歌开源 Imagen（2022）、Gemini 1.0 Nano 与 Gemini 1.0 Pro

r /LocalLLaMA 社区发帖敦促谷歌开源多款已废弃的旧世代模型，包括 Imagen、Gemini 1.0 及 PaLM 2，谷歌方面尚无任何回应。

Apr 161 分钟