找到 1 篇关于此标签的文章
Reddit 上一位独立开发者公开了一个构想:把多模态大模型(能同时理解图像和语音的 AI)接入 Discord,让它实时看用户在 Blender 或 Photoshop 里的操作画面,并用语音给出反馈。这个方向值得关注,因为它触碰了 AI 辅助创作工具的一个真实痛点——创作者需要「不打断手感」的即