腾讯 AI · 五问丨混元的三年战争

2026-04-15 17:58:00
aiadmin
原创
19

一边是急于正在AI范围大展拳脚的京东,其斟酌院正招兵买马,加倍从阿里、商汤、百度等企业罗致英才;另一边是腾讯的AI Lab团队,俞栋团队也正正在寻找一位值得信任的语音范围顶尖人才。

当时,早就居心亲身经管京东斟酌院的刘强东爱才如命,乃至直接与鄢志杰见面,希冀将这位通义测验室语音团队的前认真人招入麾下,最终却被鄢志杰婉拒。

鄢志杰婉拒老刘的原故,并非腾讯AI Lab给出的待遇优越——正在他心中,俞栋是自身正在微软功夫的同事,这份友爱重逾千钧。

天有意外风云,鄢志杰到岗时,俞栋麾下语音团队仍然开头跟混元团队互助,合伙开垦对标豆包语音的项目——“混元-O”,此时混元团队研发职责急急,语音+视觉了解的团队已成修制,项目仍然正在跑起来了。

职员调动,刚入职腾讯的鄢志杰也受到了影响。一说鄢志杰自己被调到混元,无法和俞栋“双剑合璧”;一说鄢志杰的团队被调走了一批人,而把鄢和一个三五个别的小团队留正在了 AI Lab。

然而,“混元-O”项宗旨开垦却并不顺手。因为缺乏语音数据,团队巧妇难为无米之炊,最终的锻练结果自然不足预期。

再之后,俞栋也正在各式结构更动之下辞职。俞栋走后,AI Lab 的三剑客正式齐备摆脱了腾讯,这也为自后AI Lab的裁撤埋下了伏笔。

当 Transformer 架构一统讲话、视觉、声响等才能,当豪爽算力不得不向尖端部分鸠集,当技巧的迭代开头以周为单元谋划……

(腾讯的 AI Lab 旧事,雷峰网仍正在一连跟进中,迎接增加作家微信:william_dong,相易爆料。)

大概是此前赐与张潼的生长空间过于有限,使其难以充斥施展能力,这才促使他采选摆脱,重返自身更为熟识的学术界。

于是,接下了张潼 AI Lab 主任之位的张正友,也就被总办付与了更大的自正在和话语权。乃至有音讯称,张正友出席腾讯时,总办真切不为他和团队设备硬性的 KPI,好让科学家们能更自正在地斟酌、生长。

而向外看去,2019 年前后,恰是 AI 商场的又一个低潮期,本钱遁出 AI 深水区、深度研习遇上瓶颈、落地场景受限要紧等身分,导致商场对 AI 技巧的评判开头南北极反转,而大厂们也转而合心若何把 AI 工程落地,实打实地赚到真金白银。

尔后数年,AI Lab 下设了产研中央,多量“工程部分”应运而生。Lab 的职员编制(HC)开头从斟酌中央向产研中央倾斜,经管层乃至会直接通过产研中央,调配 NLP 团队的成员,这激发了团队内部不少人的不满。

而正在张正友的经管下,主旨技巧骨干苛重便是前文提及的 AI Lab 副主任俞栋,以及 AI Lab 原 NLP 中央认真人史树明、视觉中央刘威等人。

俞栋 2017 年便出席腾讯 AI Lab,和张正友底本是正在微软的老同事,他身处美邦西雅图,正在这座美邦阴雨天最众的都邑之一组修了 AI 测验室。曾师从俞栋的齐筠云云评判他:他是一位“古板”的科学家,才能绝伦,行事浸稳,少有权利欲,也鲜少干预其他部分的工作。

而职掌 NLP 中央的史树明,也是一位特性昭着的技巧党魁。正在前员工戴棕的眼中,史性格上和俞栋相同温和,同时有着斟酌者特有的“刚”劲,潜心于“把事做成”。哪怕凌晨只身编写法规,衔接管事 12 小时不息测试,他也非要把效率硬生生“拱”出来,不会一味探求技巧层面是否完好。

俞栋、史树明云云的邦家栋梁,不光学术影响力不小,接触的项目也够众,扛起了腾讯编制内 AI Lab 的这杆大旗。

年华来到 2023 年,ChatGPT 横空诞生。要做大讲话模子,站正在学术前沿的 AI Lab 与张正友,正在当时肯定要一马领先。

混元最早正在 2022 年末-2023 年头立项,制造虚拟结构,当时的认真人是张正友,由他调动公司其他团队合伙研发,苛重的分工席卷:呆板研习平台部认真预锻练、AI Lab 认真加强研习和后锻练,数据平台部认真评测。当时TEG 的其他团队也纷纷被调动起来,席卷数据标注、安然等等。

呆板研习平台部的王迪,过去最早正在 AI 平台部做过探索,自姚星辞职后就报告给蒋杰,一段年华此后,主攻目标是广告场景中的搜广推,正在NLP范围有众年的体验和积蓄。

大模子的研发合乎 TEG 的全部运气。于是,实践分属张正友与蒋杰的团队左右开弓,向着大模子的合伙主意,开启了一场影响深远的“团队互助”。

张正友是当时混元的项目组组长,属下是俞栋的西雅图测验室,史树明的深圳 NLP 中央,和制衡着 NLP 中央的产研中央三拨力气。

而正在 TEG,王迪带领的呆板研习平台部(机平)、刘煜宏和刘威领衔的数据平台部(数平),固然依旧虚线报告给张正友,但实践依旧是实线报告给蒋杰。

“看待机幽静数平两个部分,正友干预的频率相对 AI Lab 低极少,沿途开会的次数也少许众。”一位 AI Lab 的前员工蒲佗如是说道。

数据平台部的刘威是 AI Lab 创始 “三剑客” 之一,与张潼、俞栋同期出席团队。他最早向张潼报告,是早期 AI Lab CV 范围的技巧大牛。

正在 AI Lab 早期,张潼曾发全员邮件,请求 AI Lab 不要打无盘算之仗,除非有操纵能获得前三的成就,不然不要参加外部的竞争。而刘威则直接正在全员邮件中恢复“昨天咱们说好,只消能进前五,就可能参赛”,直直地把抵触映现正在通盘人眼前。

张潼走后,仍正在 AI Lab 的刘威本是向张正友报告,但如何两人相干一度急急,便活水到了数平,实践向蒋杰一系报告,通过 CV 技巧助助腾讯的广告生意。

纵然对其他人,刘威显得有些太甚直白,但正在团队内,受到刘威看护的人不少,他的技巧气力也广受承认,大众都密切地喊他一声“威哥”。

据悉,刘煜宏懂得正在大厂内部管束相干,才能以疏通睹长。他的办公室里常备着一副茶具,进入他办公室的同砚,他都邑泡上一杯热茶,总令他的属下联思到“潮汕老板的态度”。

王迪的呆板研习平台部认真预锻练、俞栋旗下的 AI Lab 认真后锻练,刘煜宏的数平则认真为模子做评测。

鄂梅纪念,当时的 AI Lab,简直全军用命,头领们也带动冲锋,团队每天加班到凌晨两三点,周末无歇,每天除了五个小时摆布的睡眠,简直都正在管事,云云的日子一连了三四个月之久。

正在这个历程中,笼络项目组相联交付了几个版本的模子,简直是每个月都有迭代,可是后果却不行让人惬心,加被骗时邦内百度、阿里巴巴都相联揭晓了自研的模子,大众都感触压力很大,此时项目组也到了不起不交功课的时期。

这场环绕混元的竞赛,大抵正在 2023 年的五六月份就初睹蜕变——上峰顿然默示,AI Lab 不再认真后锻练,只潜心加强研习。而这十足的导火索,则是数平部拿出了一个“号称比 AI Lab 更好的模子”。

此前,数平不绝正在广告场景对模子实行后锻练,于是积蓄了不少实战技巧和体验。很速,数平便拿出来了一个新版本的模子,测试后察觉后果还不错,这便是当年 9 月面向公家推出的混元 1.0 版本。

借使说,数平的评分可能做到平正公道,那么正在算力和数据上的远大悬殊,也是 AI Lab 团队绕不开的一道坎。

算力上,AI Lab 的团队要实行云云大概量的管事,手里的 GPU 仅有小几千张,范围乃至比不上一个始创公司,反观机平的算力家底,乃至能到达 AI Lab 的数倍之众。

正在数据上,鄂梅对雷峰网说,AI Lab 的数据获取屡屡受阻——拿到 PCG、WXG 的数据自是天方夜谭,只可通过买数据、爬公域数据的方法来增援加强研习。同时,AI Lab 和机平、数公允在蒸馏的战略上也有所分别,最终也影响了他们的确的锻练效率。

这之后,AI Lab 的败势便难以逆转,自后纵使正在加强研习的范围做的不错,AI Lab 也仍是把混元 RLHF 的生意交了出去。

“AI Lab 仍然裁夺退出了,纵使连接做下去,某一天仍是要交出去。”鄂梅对雷峰网如是说道。一段年华后,后锻练又从数平迁往了机平,杀青了生意的又一次交棒。

有音讯称,正在 AI Lab 正在混元竞赛中发外败北确当天,刘威曾独自来到 AI Lab 所正在的楼层,挨个向工位上的同砚嘘寒问暖,自傲与喜悦之情溢于言外。

腾讯内部揭穿,混元的节律起色徐徐,算力和数据上的限制也是一个很大的原故,早期不管是AI Lab 仍是机平,总的卡数目亏损几千张,跟外界的数万张比起来,差异极度悬殊。

自此,张正友 AI Lab 一系正在混元全线畏缩,但纵使云云,这也并非他摆脱 AI Lab 最主旨的原故。

(混元的实践开垦细节,因为篇幅局限,有不少讯息没有录入文中,腾讯的 AI 故事还远没讲完,迎接增加作家微信:william_dong,获取更众八卦。)

2023 年到 2024 年,AI Lab 发作了一场大范围的中层辞职潮,技巧、工程两大板块都有人摆脱。从分担视觉中央的 T15 技巧专家王珏,到医疗中央认真人黄俊洲、分担虚拟人的暴林超,再到语音技巧中央的苏丹与翁超,一众主旨骨干接踵摆脱了腾讯。

而自知正在腾讯难认为继的史树明,则是相持到了终末一刻,等候团队里大局部思走的同事尘土落定,才最终采选与腾讯仳离。

摆脱了腾讯的史树明,乃至自嘲“太好了,毕竟可能好好地学一下大模子了”,并自身独力写完了一个 VLLM 的推理架构——3.5 比特量化的推理框架 inferflow,还杀青了一篇颇具前瞻性的技巧申诉,之后也觅到了一个好去向,过得自正在。

于是,正在 2024 年 8 月,腾讯召开了一场内部大会,张正友随后摆脱 AI Lab,也自然不再认真混元合联工作。

张正友摆脱 AI Lab 后,把棒交给了蒋杰。此时蒋杰也恰是混元的苛重认真人,当时结构调解的一大思虑,便是希冀团队之间的拉通和统一特别深刻。

比拟张正友,蒋杰更像姚星——经管军事化、高压化,言语并不避讳,刚猛的气派和他正在公司内部的英文名 Zeus(宙斯)相当契合。而他属下的骨干们,身上也有他从阿里带来的“领地认识”,纵使面临并不擅长、从未接触过的管事,也勇于接活,填塞着“有战用我,用我必胜”的乐观。

起首,是史树明辞职后的 NLP 中央,与俞栋团队兼并,成为 AGI 中央,依旧分属 AI Lab 旗下。

然而,AI Lab 究竟不是蒋杰的“主沙场”,只是他攻伐下的又一个领地——最大的蜕变,却起首爆发正在刘威身上。

然而,出乎外界通盘人意思,大厂出息一片明后的刘威,却正在升职不久后急速辞职,外出创业 Video Rebirth,专研视频天生算法。(刘威为何正在工作巅峰期功成身退?内部人士揭穿了哪些要害讯息?他的创业项目又藏着若何的野心?迎接增加作家微信:william_dong 深度相易。)

2024 年,恰是 OpenAI 通过 Sora 引爆视频天生技巧的风口期,但技巧途径彰彰还并不成睹。刘威受命开垦视频模子,起色却不如人意,正在总办也承压不少。

正在华为,钟钊的苛重管事是神经架构探索(NAS),但行为科研的常态,这条技巧途径不久就被声明是一条的“弯途”。到了腾讯,钟钊正在内部对过去的管事简直扫数否认,请求把视频模子的研发从新来过,技巧理念差别,刘威也正在同年辞职创业。

正在腾讯站稳脚跟,钟钊便开头罗致华为的同袍。而另一方面,面临技巧途径,有听说称,钟钊不怕“跟进”,让团队的应届生、试验生纷纷找到自身母校测验室的师哥师姐取经,要来他们的达成计划、数据泉源和洗濯举措,以此加强混元的众模才能。

然而,客岁玄月,团队内部就有人提出,可能将音频和视频同步锻练,不光能加添“音画同出”的才能,更能让模子的智能和鲁棒性进一步提拔。而这个此日被可灵 3.0 和 Seedance 2.0 验证了的技巧途径,彼时却被钟钊马上否掉,直到本年三月才开头亡羊补牢。

刘威辞职 8 个月之后,从阿里辞职的薄列峰(也便是网优势传的“Linus”)出席了腾讯混元,分担混元的众模态模子部,一揽文生图、文生视频、文生 3D 和数字人四大部分。

正在腾讯,罗福对薄列峰的评判不错,说他对技巧细节相当合心,乃至会干预自身 -2 的的确管事,把经管抓得很细。

与此同时,AI Lab 的结构调解却还正在连接,R1-R4 四个部分兴盛,而且以合股人制的方法,冲破了原有的编制设备。

个中,R1 的合股人仍是 AI Lab 的副主任俞栋;R2 的合股人则是 2025 年一月入职,MSRA 视觉谋划组前首席斟酌员胡瀚;R3 的合股人是正在字节曾任Seed大模子视觉本原斟酌团队认真人的冯佳时;R4 的合股人则是也曾开垦了王者“绝悟”的技巧认真人,也是公司最年青的 leader 总监,最年青的首席专家——叶德珩。

鄢志杰事变之后,俞栋从新梳理了一个 20 人的团队,盘算从新启航。然而一年还没过去,俞栋又接管到了要把团队并进众模态模子部的信号。

平正地说,语音管事与混元正在众模态范围的结构,正在某种水平上确切密不成分。新的技巧途径之下,语音管事必需依托于大模子底座,本领获得更好的后果。

“俞师长原来便是一个技巧才能极强的人,”原先正在俞栋团队的常白评判道,“让他带一个小团队冲破,他能做出很好的效率——而借使把俞师长推到经管岗承压,终末结果就不会太好。”

于是,就如先前正在中说道的相同,俞栋简直正在缄默中寂静辞职,不久后,他的语音团队被正式划入薄列峰治下,成为了众模态模子部的第五个板块。

而俞栋的摆脱,不免让腾讯的总办思起短短两年前的史树明等人——与其放任 AI Lab 成为一具空壳,不如先破后立,从新策画混元的结构架构。

和不少 AI Lab 做斟酌的科学家相易,他们往往会提到一个情景:正在实践的斟酌管事中,他们永远碰不到基模。

一方面原故,是过去根深蒂固的部分墙,阻隔了 AI Lab 和基模团队之间的通途;而另一方面,基模是与自身无合的管事,AI Lab 也不肯涉入太深,恐怕踩了别人领地。

本相上,采选姚顺雨,必定是腾讯总办的深图远虑——小马哥和总办高层正在硅谷聊人众数,但终末采选了这个博士结业仅两年的 95 后,肯定有他们的意思。

正在此日的 AI Lab 裁撤后,姚顺雨的混元大讲话模子部和 AI Infra 部,与 TEG 薄列峰的混元众模态模子部平行,正在差别的目标睁开管事。

正在姚顺雨旗下,有众方信源确认,当下有五大板块,折柳是预锻练、后锻练、Baseline Infra、模子评估和 Frontier(前沿)。个中,前沿组则招纳了不少历来 AI Lab 的人。

除了王迪以外,胡瀚也正在被薄列峰辞去了正在众模态模子部的管事后,出席了姚顺雨的旗下,潜心众模态了解的斟酌。原先 R3 测验室的冯佳时依旧还正在,斟酌 GUI Agent 的相应管事。

而其他的十余个小组中,不乏来自 Seed、DeepSeek、Qwen、Kimi 的大牛以及豪爽从顶尖院校结业的应届生。混元的团队也正变得越来越年青,越来越急迅。卢山曾正在内部言语中提及,大模子时间,要让AI Native的带来新思法和新思绪。

但纵使云云,腾讯混元的改良仍正在连接。姚顺雨也正正在面对一场大考,思法再大,终末也要用模子措辞。

(姚顺雨时间的腾讯混元,会变得更好吗?他的第一场“大考”成就本相若何?雷峰网正正在一连合心中,迎接增加作家微信:william_dong,获取更众一手讯息。)

他们群众自驱,不须要人正在后面拿着鞭子赶。给他们一片花圃,告诉他们畛域正在哪里,他们会自身翻土、播种、浇水、施肥,日复一日,静待花开。科学斟酌有自身的法则,急不得,也速不了。

过去的科研可能“花大钱办小事”——投一个测验室,养一拨人,三五年出一篇顶会论文,企业照样感触值。

AI正正在从“众个独立目标的平行斟酌”收敛为“一个同一架构的工程化落地”。独立AI Lab是第一个时间的最优结构式子,但正在此刻范式下,它的存正在反而成立了摩擦——斟酌和产物之间隔了一层,资源正在众个目标上阔别,计划链条被拉长。

(腾讯 AI Lab 旧事系列作品仍正在连接推出,雷峰网将一连合心写作,迎接增加作家微信:william_dong,相易认知,分享八卦。)

腾讯Lab裁撤预料之中,我看到的是腾讯内部为混元200B模子设定的主意是正在2026年6月进入邦内第一梯队,压力不成谓不大。混元3.0据报道会正在本月揭晓,这是姚顺雨交出的第一份答卷。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号