当残差开始“失控”:DeepSeek mHC 如何给超连接戴上数学枷锁DeepSeek mHC 是一个基于 Transformer 架构的 LLM,它的超连接层采用了残差连接,并在残差分支上添加了一个数学模型,用于对超连接的权重进行约束。loaf2026/1/2大约 11 分钟随笔LLMDeepSeekAI
被创造者的意义:当人类是宇宙的"数据采集员" 想象一下:如果人类并非完全自由进化的产物,而是某种更高级智慧的“具身智能”——如同我们创造AI一样,被设计用来探索世界、收集数据的工具。接受这个假定,许多关于生命、苦难、天才与意义的困惑,似乎突然找到了一个独特的解释角度。 loaf2025/8/8大约 7 分钟随笔科技人文AI灵魂人生意义
具身智能:一场现代版的神话轮回? 在2025年上海人工智能大会上,宇树科技发布了新款人型机器人R1,售价仅为3.9万元,一时间成为关注焦点。随之被广泛提及的,还有一个重要概念:具身智能。 loaf2025/8/5大约 5 分钟随笔人工智能具身智能创世传说