返回首页

Gemini

找到 5 篇关于此标签的文章

DoistTodoist

Todoist 让 AI 听你碎碎念就建任务 — 语音终于不用先转文字了

Doist 的 Todoist 上线 Ramble 功能,用户对着手机说话,AI 实时拆解成任务列表,跳过转文字环节。值得关心的是:AI 从等你提问变成边听边干,语音优先的生产力工具可能真要来了。

May 61 分钟
Google CloudGemini

Google 发布 Gemini Agent 治理指南 — 大厂竞争焦点从写 Demo 转向管基建

Google Cloud 发布 Gemini 企业级 Agent 平台及五份生产部署指南,涵盖长时任务、治理与多智能体协同。这标志着行业焦点正从跑通 Demo 转向严管基建,企业用 AI 不再只是聊天,而是要建一套带权限和审计的数字员工体系。

May 51 分钟
Qwen-ImageFlux

Mac 本地实测 10 个 AI 画图模型:文化偏见比画质更值得担心

有人在 M1 Max 上跑了 10 个本地图像生成模型,发现 Flux 写实最强但英语偏见严重,Qwen-Image 蒸馏版反而更快更好。最关键的发现是:训练数据来源比模型大小更能决定非英语内容准不准。

May 31 分钟
GeminiDiscord

一个开发者想让 AI 实时看着你画画给建议——这个想法离真正可用还有多远

Reddit 上一位独立开发者公开了一个构想:把多模态大模型(能同时理解图像和语音的 AI)接入 Discord,让它实时看用户在 Blender 或 Photoshop 里的操作画面,并用语音给出反馈。这个方向值得关注,因为它触碰了 AI 辅助创作工具的一个真实痛点——创作者需要「不打断手感」的即

Apr 191 分钟
GoogleGemini

Reddit 社区呼吁谷歌开源 Imagen(2022)、Gemini 1.0 Nano 与 Gemini 1.0 Pro

r /LocalLLaMA 社区发帖敦促谷歌开源多款已 废弃的旧世代模型,包括 Imagen、Gemini 1.0 及 PaLM 2,谷歌方面尚无任何回应。

Apr 161 分钟