从 2026 年开始
我在一月中旬做了一期播客,聊了聊我对 2026 年及以后 Agent 和 AI 发展的预判。这篇 blog 基本上是那期播客的文字版,涵盖了我当时讨论的内容,外加一些没来得及提到的补充。如果你已经听过,可以把这篇当作总结和延伸;没听过的话,推荐去听听看~...
涂津豪 著我在一月中旬做了一期播客,聊了聊我对 2026 年及以后 Agent 和 AI 发展的预判。这篇 blog 基本上是那期播客的文字版,涵盖了我当时讨论的内容,外加一些没来得及提到的补充。如果你已经听过,可以把这篇当作总结和延伸;没听过的话,推荐去听听看~...
涂津豪 著2025 年 11 月 20 日更新: Google DeepMind 最新发布的 Nano Banana Pro(基于 Gemini-3 Pro)实际上已经具备了在图像中进行思考的能力,在图像质量等方面带来了巨大飞跃。虽然我稍微怀疑底层其实是个双模型架构——比如 Gemini-3 Pro 在推理过...
涂津豪 著虽然已经二月了,但我觉得把 2024 年做个收尾,再结合 2025 年初的动态一起展望新一年,还是挺值得的。...
涂津豪 著> 灵感来自 Dario 的 "Machines of Loving Grace"...
涂津豪 著会思考的模型才是好模型...
涂津豪 著最近 X 上关于这个话题吵得热火朝天。一边的人觉得 LLM 当然能推理——你看它确实能帮我们做数学、写代码;另一边坚持认为 LLM 根本不会推理,它压根就不是干这个的,它做的不过是把训练数据里的东西"背"出来。...
涂津豪 著这绝对是近期最热的话题之一了 lol。不过我个人觉得,除了 Agent 本身,模型的自主行为同样很有意思——两者都跟基座模型的能力上限以及模型可能带来的风险紧密相关。...
涂津豪 著To scale, or not to scale? 挺有意思的话题。Scaling Laws 是 AI 和机器学习领域一条很有名的定律,业界对此看法各异。所以我想聊聊自己对算力扩展的一些想法,这也是 Scaling Laws 中很核心的一部分。...
涂津豪 著我们现在毫无疑问是在 AI 发展的快车道上。正如我之前写过的,AI 安全正成为越来越多人的重大关切。但我觉得,AI 伦理同样值得我们投入更多的注意力。摆在眼前的现实是:前沿 AI 系统的发展速度,已经远远甩开了人类社会的适应速度。于是一个根本性的问题就来了:到底是应该让人类社会去适应 AI 的发展,...
涂津豪 著我觉得安全问题对未来 AI 的发展至关重要。之前跟一个人就这个话题争了很久。他觉得现在的 AI 系统还不够强,构不成什么威胁;但我的看法是,我们应该防患于未然,为未来可能出现的任何情况做好准备。说实话,以前看《终结者》的时候,我也不信那种"灾难性后果"的剧情。但到了今天,看着 AI 发展得这么猛,我...
涂津豪 著