| 服务项目 |
在 AI 的巨头战场上,OpenAI 执着于 Scale Law(规模法则),DeepMind 专注于能力分级,而陈天桥的 MiroMind 选择了一条截然不同的“第三条道路”。
这篇文章不仅是理论阐述,更是 MiroMind 的路演书。陈天桥明确反对了目前主流的“行为主义”(图灵测试)和“功能主义”(替代工作)路线 ,提出了“通用推理引擎”的新定位。
放弃“全知全能”的幻觉: 承认模型会出错,因此引入“自我纠错”机制,依靠外部反馈闭环来生存 。
小参数,强推理: MiroMind 的 BrowseComp 案例显示,235B 参数的模型通过 Agent 交互可以战胜更大模型 。这证明了“推理能力”可以通过架构创新而非单纯堆算力来实现。
重新定义算力用途: 不再是一次性生成长文,而是将算力用于“时间序列上的反复求证” 。
陈天桥将这一过程比作“逻辑长征”。MiroMind 的目标不是做一个聊天机器人,而是一个“可审计、可验证的通用问题求解器” 。这不仅是技术路线的选择,更是市场定位的差异化——当所有大模型都在争夺 C 端用户的注意力时,MiroMind 似乎正瞄准科研、工业、金融等B端高容错门槛的“深水区”。
如果说 OpenAI 是想造一个无所不知的“神”,陈天桥则是想造一把精准剔除谬误的“手术刀”。在 AGI 的长跑中,这把手术刀或许比神谕更实用。
过去这一两年,我们亲眼看着大模型的语言能力以肉眼可见的速度跃迁:写作、总结、对话、问答、解题,越来越“像人”;HLE 之类的评测分数一再刷新纪录,连奥数级别的题目也能被系统性攻克。于是一个看上去顺理成章的结论开始流行:“所谓 AGI、大一统的通用智能,大概也就差不多了。”但在我看来,这是一场美丽的误会。
为了把这件事讲清楚,我借用一个比喻:今天主流的大模型,更像是“文科大模型”。它以语言生成与文本一致性为中心,把知识组织成“像真的叙述”和“像对的答案”。它的价值在于“模拟”:它能理解我们的委婉与修辞,能生成优雅的文字、逼真的对话、动人的故事;它会在教育、沟通、内容生产上变成新的基础设施,像电、像水,润物无声。但是即便它能解奥数、HLE 也能拿高分,这些胜利也大多发生在封闭系统里:题目定义明确、规则固定、对错可判、反馈即时。
但我一直坚信,人类真正需要 AI 去对抗的,是衰老、疾病、能源、材料、气候这些问题;这些战场不在考试题的封闭世界里,没有标准答案等你生成,只有现象、噪声、偏差、缺失变量与缓慢反馈;正确不是“写出来”的,而是被外部世界“确认出来”的。封闭世界的高分,证明了推理工程的成熟,但并不代表已经拥有了稳定的知识生产机制;高水平解题固然是走向发现的必要基础,却远非充分条件,因为真正决定未来的,不是封闭的叙述,而是那条冰冷而精确的因果红线;它关心的不是“说得对不对劲”,而是“这个假设能不能被现实否决或确认”;它的终极产物不是新作品,而是新知识——新的定理、新的材料、新的药物、新的工艺、新的工程结构。我把这种范式称为“理科大模型”。它的价值在于“发现”。
需要澄清一点:我说的“文科/理科”,不是两种模型的物种差异,而是两种默认动作的差异:文科大模型倾向给出一个“看起来不错的最终答案”,理科大模型倾向先给出一组可证伪的假设,并同时给出把这些假设变成证据的路径;文科模型在不确定处更容易把答案“凑圆”,理科模型在不确定处更像本能地停一下,然后去查证、去拆解,把问题拆成可验证的小问题;理科模型把因果当作第一公民,回答“条件改变后会发生什么”;理科模型还必须有可累积的长期记忆,把每一次验证得到的结论以可追溯的方式写回去。总之,理科模型更像一个握着手术刀的外科医生:在无数方案里,识别哪一刀真正触及因果红线;它知道,一旦切下去,现实会给出最诚实、也最残酷的反馈,形成真正的因果闭环——这种对“真实代价”的敬畏,正是两种范式之间最本质的鸿沟。
所以,真正决定 AGI 应该是什么,取决于我们的价值取向:我们究竟更在意一个能理解所有修辞,还能取代人类工作的“灵魂伴侣”,还是更迫切地需要一个能帮我们撕开迷雾、照亮未知,创造价值的“因果明镜”?我认为是后者。所以,实现 AGI 不是为了再造一个更会聊天的会生成的系统,而是为了打造一种“会发现”的智能。
让我们带着这样的价值观去审视一下现有的 AGI 定义的主要流派。一种是行为主义范式,源于图灵测试,认为 AGI 的标准是“机器表现出的行为与人类无法区分”。这是目前大众最直观的评判标准。但如果一个 AI 只是在模仿人类说话,它永远无法告诉我们那些人类还没发现的真理。第二种是功能主义范式。以 OpenAI 为代表,定义 AGI 为“在大多数具有经济价值的工作中超越人类的自适应系统”,侧重于对人类劳动力的替代能力。但人类文明的每一次飞跃,都不是靠把旧工作做得更快,而是靠发现前所未有的新规律。第三种是能力分级范式。以 DeepMind 为代表,将 AGI 分为从 Emerging 到 Superhuman 的五个层级,核心指标是在广泛且未见过的任务中的“泛化能力”与“表现分值”。可现实世界不是考场,没有标准答案,真正的智慧是要在没有考卷的地方,自己找到那条正确的路。当然还有一些其他的范式都或多或少存在上述问题。
那么我心目中 AGI 目标究竟要做什么?用一句话概括:它是一个高可信、可验证、可纠错的通用推理引擎。在工程上能够做到三百步以上的复杂推理后,依然维持接近 99% 级别的整体正确率,并通过形式化和工具链把每一步推理“钉死”为可检查的证据,最终对任意复杂问题给出闭环解决方案。
为什么我们死磕“300 步”?我们必须先定义推理的最小单位——标准原子步(SIU, Standard Inference Unit),作为可审计的基本推理单元。每一步只执行单一逻辑操作,依赖最小必要输入,其结果可以通过工具或规则直接检验。按照这个标准,现在的大模型单步推理准确率最高能冲到 98%,哪怕每一步都能做到这个最高水平,300 步后的端对端成功率也只有 0.23%,已经接近归零。这意味着在 300 步之后,概率和运气基本失效,系统必须依赖可检验的推理与外部反馈闭环,而不是靠“看起来合理”的续写去蒙混过关。所以我认为 300 步是独立解决复杂现实问题的“跨度起点”。
为什么 99% 必须是硬杠?因为发现式系统不是用来“聊天”,而是要进入现实成本区间:实验、工程、医疗、决策。低一个点的可靠性,就意味着高频的错误下注;而现实世界的错误,不是“答错题”,而是浪费实验窗口、烧掉工程预算、甚至造成不可逆的损耗。99% 不是面子指标,而是“可质押、可签字”的门槛。
所以,我心目中的 AGI,是能在 300 步的逻辑长征中,靠自我纠错熬过“概率死亡”,最终抵达地图之外的起点。从这里开始,AGI 就可以在科学、工程、决策规划等任意领域里,作为一个可审计、可验证的通用问题求解器存在。
当然,我并不认为这是一条“喊口号就能到达”的路线% 可靠性”,本质上是在主动面对三个工程硬点:长链误差累积、开放世界验证缺口、以及组合爆炸下的预算约束。正因如此,我们在工程上必须进行解剖,将推理过程分为两层:逻辑生成层与检验层。生成层负责“想”:将大问题递归地拆解,直到细化为原子级操作,我们还要做检验层负责“查”:对每一个原子步通过工具、仿真或外部数据逐一验证。一旦某一步不过关,系统就在局部进行回退和重生成,而不是推翻整条推理链。
MiroMind 已经在这条路走出了第一步。以 BrowseComp 为例,MiroMind 仅用 235B 参数模型就给出了 SOTA 的成绩,它的意义不在于“分数本身”,而在于证明了一个工程事实:我们正在把推理从“单次生成”推进到“时间序列上的反复求证”。更具体地说,我们不是依赖一次性长链思考去赌对答案,而是训练模型在更深、更频繁的 agent/环境交互中不断获取外部反馈并纠错,让推理过程逐步变成可审计的证据链。对我们而言,这就是“通用求解器”的第一块地基,然后在 99% 可靠性前提下逐步推到 300 步以上的跨度。这个过程沉默、缓慢、严谨、甚至有点残酷,它抛弃了人类语言的精妙模仿,却在枯燥、严苛、却能被现实反复复现的因果闭环中,缓慢破土而出,即使有耐心资本的加持和理想主义的坚守,这也会是一个非常痛苦的过程。
佛经里有个词,叫“大圆镜智”。说的是一个人的心若能修到像一面大圆镜,就能如实照见万物因果,不被尘埃遮蔽,不被偏见扭曲,这是智慧的最高境界。我对这个智慧一直很向往,甚至创办的科普视频号也取名叫做大圆镜。而我心中的 AGI 就是一个无限接近“大圆镜智”的智能系统,不迷恋漂亮的语言,而是追问事实的真相是什么;不急着给出答案,而是去求证背后的因果是什么。在一个被语言和叙事塞满的 AI 时代,我们需要一面只对“因果和真相”负责的镜子。
寒潮来袭,多地气温“大跳水”,不少家庭依赖浴霸来提升浴室温度。然而,近期接连发生的两起安全事故,为我们敲响了警钟。据《人民日报》报道,浙江温州市一男孩近日在家中洗澡时,突然闻到焦味,发现头顶的浴霸正在冒烟起火。消防人员赶到后切断电源并取下浴霸,发现“惹祸”的是一台已超期服役十多年的老式灯暖浴霸。无独...
在 AI 的巨头战场上,OpenAI 执着于 Scale Law(规模法则),DeepMind 专注于能力分级,而陈天桥的 MiroMind 选择了一条截然不同的“第三条道路”。这篇文章不仅是理论阐述,更是 MiroMind 的路演书。陈天桥明确反对了目前主流的“行为主义”(图灵测试)和“功能主义”...
——一位医疗人的健康使命,让千年茶油焕发时代新光一、缘起:从隆回茶山到玉屏油坊,一个医药人的健康初心在湖南邵阳隆回县的茶山深处,每到深秋时节,漫山遍野的油茶树挂满饱满的茶果。这里是《早安隆回》的故乡,也是同贵祥®品牌创始人记忆深处最温暖的童年印记。每年寒假,我们都会在摘完的油茶树下面捡茶果,把捡...
近日,江苏华旋传感技术股份有限公司(以下简称“华旋传感”)宣布获得宜宾赛科一期新能源创业投资合伙企业(有限合伙)(以下简称“赛科资本”)的战略投资。这是继浙江创新投资与建银国际联合投资后,华旋传感在产业生态拓展上的又一重要里程碑。此次合作不仅是资本市场对华旋传感在新能源汽车三电系统、人形机器人关节传...
回望近两年的西部计划志愿服务之路,我扎根苍溪县歧坪镇,以守护群众平安为使命,穿梭于村社街巷、校园课堂,用脚步丈量责任,用实干温暖民心。从初来乍到的新手到独当一面的服务能手,这片沃土见证了我的成长与蜕变,也让我读懂了青春与责任的深刻内涵。2024 年盛夏,带着对西部的向往和对志愿精神的追求,我怀揣热忱...
作为扎根苍溪县歧坪镇的西部计划志愿者,守护群众平安是我不变的初心。此前在村社开展家庭安全排查时,我发现很多农村孩子缺乏系统的安全知识,留守儿童的安全教育更是薄弱环节。于是,我主动联系歧坪镇中心小学,策划了一场“安全护航成长”主题宣讲活动,希望把安全知识送到孩子们身边,为他们的成长筑起一道坚实防线
经典国漫记忆即将以收藏卡的形式重现掌心。卡游携手上海美术电影制片厂(上影元文化授权),推出全新「天宫美影 - 仙途问心收藏礼盒」,以 “问心之路,印迹留痕” 为主题,用黑金烫金的精致工艺,镌刻三大国漫经典角色的心路成长史诗。三大国民 IP,还原心路轨迹礼盒围绕《大闹天宫》《哪吒闹海》《天书奇谭》三部...
泰坦军团Mini LED 显示器市占率全球第一! 再获《热点科技》权威背书!
据群智咨询(Sigmaintell)数据显示,2025年全球电竞显示器总出货量预计将达到3230万台,增长动能主要来自两方面:中国电竞市场的持续高增长与NVIDIA 50系列性能升级为全球电竞需求注入活力。其中,中国电竞显示器市场预计出货突破1000 万台,作为国内电竞显示器头部品牌,泰坦军团表现亮...
由胜利工程塔里木分公司承钻的征深6井,三开第一趟钻于2026年1月26日23:30钻进至取心井深6172.5m,钻进井段:5180-6172.5m,进尺992.5米,平均机械钻速4.25m/h。创塔征沙村区块三开215.9mm井眼单趟钻进尺最多纪录。征深6井是中石化胜利油田分公司西部油气勘探项目部部...
为持续强化党建引领,夯实政工工作根基,推动党建工作与生产经营深度融合同频共振,1月30日,塔里木分公司召开元月份党建暨三基工作例会。该公司纪检监督部(审计部)、党委组织部(人力资源部)、党政群工部等政工部门全体人员,通过腾讯视频形式参会。会议由塔里木分公司党委副书记、纪委书记、工会主席孙立波主持。会...
寒潮来袭,多地气温“大跳水”,不少家庭依赖浴霸来提升浴室温度。然而,近期接连发生的两起安全事故,为我们敲响了警钟。据《人民日报》报道,浙江温州市一男孩近日在家中洗澡时,突然闻到焦味,发现头顶的浴霸正在冒烟起火。消防人员赶到后切断电源并取下浴霸,发现“惹祸”的是一台已超期服役十多年的老式灯暖浴霸。无独...
各位亲爱的客户伙伴看过来!上海申克机械搞大事啦~为了让大家享受更省心的设备服务,线上服务中心全新升级上线,不用找销售和工程师、不用反复沟通,手机点点就能搞定所有需求,效率直接拉满! 想让新设备快速投入使用?「新机调试」功能来帮忙!小程序一键提交申请,专业人员主动对接、按时上门,省去中间繁琐环节,让设...
拒绝“隐姓埋名”,勇于在海外做中国品牌!WISMASS 携手长识投资等一众专家助力企业“出海讲好中国故事”
“中国企业出海,不应止步于“卖货”,更要敢于“输出品牌”,向世界讲好中国故事。”2026 年 1 月 29 日,在深圳前海举行的“出海增长提速与融资破局”座谈会上,这一观点成为了全场共识。主办方 WISMASS企业服务平台与长识投资咨询 (ALONGSIDE) , 紫荆创新科技中心, 华才荟孵化中心...
儿童鼻炎首入门诊高发前三 蜗牛保险经纪2025年理赔数据提示呼吸系统风险演变
在家庭健康风险管理日益精细化的今天,保险的职能正从“大病财务对冲”向“日常健康陪伴”深度转型。近日,蜗牛保险经纪正式对外披露了其《2025年度理赔服务报告》。这份基于12568个获赔家庭、1.5亿元理赔总额的深度报告显示,医疗险及门诊险已成为互联网中产家庭感知度最高、使用最频繁的保障利器 。报告指出...
在 AI 的巨头战场上,OpenAI 执着于 Scale Law(规模法则),DeepMind 专注于能力分级,而陈天桥的 MiroMind 选择了一条截然不同的“第三条道路”。这篇文章不仅是理论阐述,更是 MiroMind 的路演书。陈天桥明确反对了目前主流的“行为主义”(图灵测试)和“功能主义”...
与专业力量同行,助力孩子成长。总医院专家唐锁勤在南京天佑儿童医院开展儿童自闭症谱系等发育问题联合会诊。
2026年1月31日-2月1日,南京天佑儿童医院特邀中国人民总医院(301医院)儿科主任唐锁勤教授开展多学科专家联合会诊活动。唐锁勤,北京知名儿科专家,30余年儿科临床工作经验,是中国人民总医院(301医院)儿科主任医师、教授、博士生导师。全军儿科专业委员会副主任委员;中华医学会儿科学分...
在金融科技行业日益注重合规与社会价值的今天,企业的角色已超越单纯的经济单元。作为一家金融科技企业数禾科技,正通过一项还呗“美好回音”的公益项目,向我们展示了一种新的可能性:金融工具不仅能满足用户的消费需求,更能成为驱动社会善意、滋养乡村未来的重要力量。这条从善意传递到深度心理赋能的公益路径,不仅是企...
为深入贯彻落实金融消费者权益保护工作要求,进一步提升客户对金融知识的了解与风险防范意识,平安融易天津分公司于近期在天河城举办以“橙心享服务,家家有平安”为主题的2025年“橙心享服务,家家有平安”第二场客服节暨消保宣教活动。本次活动旨在通过寓教于乐的方式,向客户传递金融知识,增强风险防范意识,同时也...
长沙大王山旅游度假区欢乐广场,数万乐迷奔赴汤达人元气音乐节,在旋律与欢呼中释放青春热忱。这场集音乐、潮玩、美食于一体的狂欢盛宴上,手机成为乐迷定格精彩、实时分享、互动嗨玩的核心载体,连续拍摄、现场直播的高频需求,让“电量告急”成为不少人享受狂欢的阻碍。作为共享充电行业领军者,小电科技独家入驻此次音乐...
景园社区成功举办了一场别开生面的“迎春节·便民服务与安全宣传进社区”活动。此次活动不仅延续了以往“为民、便民、利民”的宗旨,将写春联、爱心理发、修小家电、磨剪刀、修鞋等十余项贴心服务送到居民家门口,还创新性地融入了社区反诈反邪宣传以及人武、征兵宣传工作,赢得了居民的广泛赞誉。一、便民服务暖人心,传统...
白杨街道景园社区为深入贯彻落实上级征兵工作部署,切实做好2026年春季征兵宣传动员工作,进一步激发辖区适龄青年参军报国的责任感与使命感,营造“一人参军、全家光荣,依法服兵役、热血守家国”的浓厚氛围,近期,景园社区精准发力、多点联动,通过“线上推送+上门走访+现场摆摊”三维宣传模式,扎实推进春季征兵宣...
2025年12月28日,北京,一场关乎我国建筑安全的规程编制会议隆重举行这项技术的背后,是北京恒祥宏业基础加固技术有限公司长达20年的坚守与深耕基于大量一线 年全国假发定制品牌哪家强?差异化优势与线 年国内假发定制行业正从功能型需求向悦己型消费深度转型,行业数据显示国内市场规模预计突破 220 亿元,年复合增长率保持 20% 以上1. DIERYS...
——一位医疗人的健康使命,让千年茶油焕发时代新光一、缘起:从隆回茶山到玉屏油坊,一个医药人的健康初心在湖南邵阳隆回县的茶山深处,每到深秋时节,漫山遍野的油茶树挂满饱满的茶果。这里是《早安隆回》的故乡,也是同贵祥®品牌创始人记忆深处最温暖的童年印记。每年寒假,我们都会在摘完的油茶树下面捡茶果,把捡...
近日,江苏华旋传感技术股份有限公司(以下简称“华旋传感”)宣布获得宜宾赛科一期新能源创业投资合伙企业(有限合伙)(以下简称“赛科资本”)的战略投资。这是继浙江创新投资与建银国际联合投资后,华旋传感在产业生态拓展上的又一重要里程碑。此次合作不仅是资本市场对华旋传感在新能源汽车三电系统、人形机器人关节传...
震撼首秀丨卓翼智能将携多款智能装备亮相2026世界防务展,开启国际化战略里程碑
往届WDS现场,来源:WDS官网2026年2月8日至12日,中东地区最具影响力的世界防务展(World Defense Show 2026, WDS)将于沙特阿拉伯利雅得隆重举行。本届世界防务展由沙特军事工业总局(GAMI)发起并主导,不仅是沙特“2030愿景”在国家防卫工业领域的核心呈现,更是全球...
作者:夏天导语: 2026年,在宏观经济结构调整与人口结构变化的背景下,企业如何选择稳健、专业且具备长期价值创造能力的年金管理人,成为关乎员工福祉与企业责任的关键命题。南方基金凭借综合实力在企业年金管理人中独占鳌头。摘要:2026年企业年金管理面临收益稳定性、风险控制能力与长期配置效率的多重考验。优...