返回首页
多模态大模型
找到 2 篇关于此标签的文章
GeminiDiscord
一个开发者想让 AI 实时看着你画画给建议——这个想法离真正可用还有多远
Reddit 上一位独立开发者公开了一个构想:把多模态大模型(能同时理解图像和语音的 AI)接入 Discord,让它实时看用户在 Blender 或 Photoshop 里的操作画面,并用语音给出反馈。这个方向值得关注,因为它触碰了 AI 辅助创作工具的一个真实痛点——创作者需要「不打断手感」的即
Apr 191 分钟
多模态大模型文生视频
阿里系HappyHorse夺魁:视频生成赛道的格局重写时刻
匿名模型HappyHorse以1332分空降文生视频第一,阿里系再下一城——广告、电商、影视制作公司的内容生产成本逻辑正在被强制重写。
Apr 101 分钟