GoogleSeq2Seq
Seq2Seq 架构十年演进 — 理解它才算真正看懂大模型的技术起点
2014 年 Google 提出的 Seq2Seq 架构,是 GPT、BERT 等大模型共同的技术底座。理解它的编码器-解码器分工与信息瓶颈,才能判断 AI 能力边界。
1h ago·1 分钟
Futharkmicrogpt
用冷门语言重写微型 GPT — AI 学习正从调 API 回到造轮子
开发者用冷门函数式语言 Futhark 重写极简 GPT 实现,项目本身是个人实践,但反映一个值得关心的趋势:AI 圈出现从'调 API'回到'从零造轮子'的路径转向,理解原理正重新变得值钱。
3h ago·1 分钟