多模态大模型

找到 2 篇关于此标签的文章

一个开发者想让 AI 实时看着你画画给建议——这个想法离真正可用还有多远

Reddit 上一位独立开发者公开了一个构想：把多模态大模型（能同时理解图像和语音的 AI）接入 Discord，让它实时看用户在 Blender 或 Photoshop 里的操作画面，并用语音给出反馈。这个方向值得关注，因为它触碰了 AI 辅助创作工具的一个真实痛点——创作者需要「不打断手感」的即

Apr 191 分钟

多模态大模型文生视频

阿里系HappyHorse夺魁：视频生成赛道的格局重写时刻

匿名模型HappyHorse以1332分空降文生视频第一，阿里系再下一城——广告、电商、影视制作公司的内容生产成本逻辑正在被强制重写。

Apr 101 分钟