Skip to content

Latest commit

 

History

History
824 lines (526 loc) · 60.5 KB

File metadata and controls

824 lines (526 loc) · 60.5 KB

好的,我们正式开始这部深度商业传记的写作。

我将严格遵循您设定的**“纪实性 + 思辨性 + 方法论总结”**风格,避免公关稿式的浮夸,致力于还原一个真实的、充满矛盾与博弈的商业史切片。

我们将从第一编:时代与起点开始。这一部分不仅是背景铺垫,更是为了回答一个核心问题:为什么在那个时间点,只有闫俊杰(或者极少数人)能做成这件事?

以下是正文。


第一编:奇点前夜(时代与种子)

第一章:大航海时代的迟到者与插班生

1.1 2021年的AI“至暗时刻”与“黎明前夜”

如果我们要为中国AI创业史寻找一个精确的“分水岭”,2021年或许比公认的2023年更为关键。

在硅谷,OpenAI的GPT-3刚刚展示了暴力美学的威力,但尚未引起大众的狂欢;在中国,教培行业在一夜之间崩塌,互联网大厂的流量红利见顶,“元宇宙”概念虽然喧嚣尘上,但更像是资本为了逃避现实而制造的虚幻避难所。

对于闫俊杰来说,2021年的春天显得格外微妙。他身处上海——中国AI人才密度最高的城市之一,但空气中弥漫的不是激动,而是焦虑。

当时的现实约束是极其具体的:

  1. 算力封锁的前兆:英伟达的高端芯片(如A100)开始对中国市场实施更严格的出口管制,即便能买到,价格也足以让一家初创公司在三个月内破产。
  2. CV(计算机视觉)的红海尸横遍野:以“CV四小龙”(商汤、旷视、依图、云从)为代表的上一代AI独角兽,在经历了漫长的上市拉锯战后,市值大幅缩水,证明了单纯靠“安防+人脸识别”无法撑起无限增长的故事。
  3. NLP(自然语言处理)的无人区:相比于视觉技术的成熟落地,语言模型被视为“吞金兽”且商业前景不明。当时的主流观点认为,中国的NLP技术比美国落后至少两个身位,且由于数据合规问题,很难做出类似ChatGPT的产品。

这就是闫俊杰决定创立Minimax时的外部环境:一个旧地图已经失效,但新地图尚未绘制的混沌世界。

1.2 安徽小镇的“做题家”与商汤的“黄埔军校”

要理解闫俊杰后来的决策逻辑,必须回溯他的底层代码——他的成长轨迹。

与许多海归派或天才少年不同,闫俊杰是典型的“本土制造”。他出生于安徽的一个普通家庭,通过严苛的应试教育考入顶尖学府(上海交通大学)。这种背景赋予了他两个看似矛盾的特质:

  • 极度的务实:他不相信一步登天的神话,更相信逻辑推导和资源置换。
  • 极度的坚韧:在资源匮乏的环境中杀出重围的经历,让他对“困难”的阈值极高。

在创立Minimax之前,闫俊杰在商汤科技度过了职业生涯的关键成长期。商汤被称为中国AI界的“黄埔军校”,不仅因为其技术实力,更因为其残酷的内部竞争和对前沿技术的偏执。

在商汤时期,闫俊杰目睹了视觉算法从神坛跌落的全过程。他敏锐地意识到一个被大多数人忽视的趋势:视觉是“感知”,语言是“认知”。AI如果不能理解语言,就永远只是一个“瞎子”,而无法成为“大脑”。

然而,在商汤的庞大体系内,要调动资源去做一个短期内看不到营收的NLP大模型,几乎是不可能的任务。大公司的惯性是优化现有业务的KPI,而不是探索未知的黑箱。

【决策复盘:离开大厂的博弈】

  • 现实约束:拥有高薪、期权、稳定的技术团队,但缺乏对未来技术路线的掌控权。
  • 可选路径
    1. 继续在商汤晋升,做安防项目的负责人,这是一条确定的“中产精英”之路。
    2. 跳槽去字节或腾讯,做具体的业务线负责人,利用大厂资源做轻量级创新。
    3. 跳出大厂,在算力和资本都不确定的情况下,做一家“AGI(通用人工智能)”导向的公司。
  • 最终选择的逻辑:闫俊杰后来在一次内部信中写道:“如果你相信未来十年是AI的十年,那么做一个优化现有系统的‘修补匠’是没有意义的。只有去造那个可能会毁灭现有秩序的‘新物种’,才配得上这个时代的红利。”

他选择了第三条路——一条在当时看来成功率接近于零的路。

1.3 Minimax的命名博弈:不仅是算法,更是世界观

公司成立之初,团队为了名字争吵了很久。有人提议用神话人物,有人提议用极客术语。最终,闫俊杰拍板定为“Minimax”。

这不仅仅是一个博弈论算法的名字(极小化极大算法),更隐藏着他对商业竞争的深刻理解: 在最坏的情况下(Min),争取最好的结果(Max)。

对于一家缺卡、缺钱、缺人的初创公司,每一步都是在“极小化”风险与“极大化”收益之间走钢丝。

  • 技术上:在算力极小(Min)的约束下,通过算法优化,实现模型能力的极大(Max)化。
  • 商业上:在巨头环伺(Min)的生存缝隙中,寻找通用人工智能(Max)的可能性。

这个名字成为了Minimax早期的生存哲学:在非对称战争中,用极致的工程能力,去博取那个微小的胜利概率。


【本章启示录:时代的B面】

1. 所谓“红利”,往往藏在“旧地图”的边缘。 当所有人都在拥挤的CV赛道厮杀时,闫俊杰看到了NLP的荒原。真正的机会从来不在聚光灯下,而在被主流视为“鸡肋”或“太早”的领域。

2. “大厂病”是创新的最大敌人,也是创业者的最大机会。 大厂的资源是创业者的梦寐以求的,但大厂的“KPI导向”会扼杀那些需要长周期孵化的颠覆性创新。闫俊杰的出走,本质上是用确定性的高薪,换取了改变世界的可能性。

3. 创始人的底层操作系统决定公司的天花板。 闫俊杰的“做题家”背景并非贬义,它代表了一种**“在规则下寻找最优解”**的能力。在AI创业这场无限游戏中,这种能力比单纯的技术天才更为稀缺。


第一编 第一章 写作完毕。

接下来,我们将进入【第一编 第二章:极客的野心】,重点讲述Minimax初始团队的组建、早期的技术路线之争(为什么不做底层模型先做应用?),以及在没有ChatGPT的日子里,他们是如何在孤独中摸索“情感计算”这一独特方向的。

是否继续?

好的,我们继续。


第一编:奇点前夜(时代与种子)

第二章:极客的野心

2.1 “草台班子”里的理想主义者

2021年的上海,闵行区的一处创意园区,Minimax的早期办公室就设在这里。与其说是办公室,不如说是一个由仓库改造的Loft,层高很高,但冬天漏风,夏天闷热。

这就是Minimax的起点——一个典型的“草台班子”。但如果你翻开当时的员工花名册,会发现这个“草台班子”的含金量惊人:

  • CTO:来自微软亚洲研究院的年轻博士,算法狂人,能手推Transformer的每一行底层代码。
  • 工程负责人:曾在百度凤巢系统做过高并发架构,擅长在有限的硬件上“榨油”。
  • 产品负责人:一个对“虚拟人”有着近乎宗教般狂热的90后,甚至自己写过同人小说。

【人物侧写:为什么他们愿意来?】 在大厂以双倍薪资挖人的2021年,这群人选择加入一家前途未卜的初创公司,原因只有一个:闫俊杰贩卖的不是期权,而是“可能性”。

在第一次全员会上,闫俊杰没有讲KPI,也没有讲上市计划,而是在白板上画了一个坐标轴:

  • X轴是“拟人化程度”,Y轴是“任务完成能力”。
  • 他指着右上角的空白区域说:“现在的AI要么像Siri(能干活但不像人),要么像小冰(像人但干不了活)。我们要做的,是填满这个空白——一个既有情感温度,又有逻辑能力的数字生命。”

这种极具感召力的愿景,对于技术理想主义者有着致命的吸引力。他们不是来打工的,他们是来“造人”的。

2.2 路线之争:做“大脑”还是做“面具”?

公司成立的前三个月,团队内部爆发了第一次激烈的路线之争。这场争论决定了Minimax早期的生死。

背景:当时业界的主流共识是“大力出奇迹”——堆算力、堆数据、堆参数,训练一个超级大模型,然后用这个模型去解决所有问题。这也是后来OpenAI GPT系列的路线。

冲突点

  • 一派(技术原教旨主义):主张集中所有资金,采购A100集群,自研底层大模型。理由是“基础不牢,地动山摇”,没有自己的底座,永远受制于人。
  • 另一派(应用实用主义):主张避开烧钱的预训练大模型,利用开源模型(如GPT-3的API或早期的LLaMA前身)做微调,快速推出C端产品验证市场。

闫俊杰的抉择:在“极大”与“极小”之间走钢丝

闫俊杰面临着创业以来的第一次重大博弈。如果选择自研底座,资金链断裂的概率是90%;如果选择纯套壳应用,技术壁垒为零,随时会被巨头碾死。

他在那个周末把自己关在办公室,算了一笔账:

  1. 算力账:训练一个千亿参数模型需要1000张A100,耗时3个月,成本约1.5亿人民币。Minimax当时的账上只有5000万美金的天使轮融资,这是一场必输的赌博。
  2. 时间差:即便做出了模型,效果能否超过GPT-3?如果不能,做出来的就是电子垃圾。
  3. 差异化:大厂在做“全能助手”,我们能不能做“垂直伴侣”?

最终决策: 闫俊杰拍板了一个折中但极其冒险的方案:“薄底座,厚应用”

  • 不做全量的通用大模型预训练(省下买卡的钱)。
  • 把资源集中在**“多模态交互”“长记忆”**这两个特定技术点上。
  • 利用开源模型作为基座,通过自研的“人设引擎”和“对话管理模块”进行二次开发。

用他的话说:“我们不造发动机,我们造一辆能在泥泞里跑得比法拉利还快的越野车。”

这个决策在后来被证明是Minimax能够活过2022年的关键,但也埋下了隐患——早期的模型能力上限被锁死,一旦遇到复杂的逻辑推理就会“穿帮”。

2.3 Glow的诞生:在孤独中模拟温暖

2021年底,第一款产品“Glow”内测版上线。这不是一个聊天机器人,而是一个“虚拟社交平台”。用户可以创建或与各种人设的AI互动,比如“霸道总裁”、“民国才女”甚至“克苏鲁神祇”。

为什么选择“情感陪伴”作为切入点? 这并非闫俊杰的拍脑袋决定,而是基于对人性的深刻洞察和对中国社会的观察:

  1. 孤独经济:中国有超过2亿独居青年,线下社交成本极高,且充满压力。
  2. 安全的树洞:现实中的人际关系充满评判,而AI是绝对安全、绝对顺从、永远在线的倾听者。
  3. 技术验证场:相比于写代码或做数学题,“聊天”对逻辑的要求较低,但对“情商”和“人设一致性”要求极高,这正是Minimax想练的内功。

至暗时刻的“幽灵” 产品上线初期,数据极其惨淡。留存率只有5%,大部分用户聊了三句就觉得“太假”、“像智障”。 团队陷入了自我怀疑:是不是方向错了?是不是该转行去做元宇宙?

闫俊杰在这个时候展现了他作为创始人的“定力”。他强制要求所有工程师和产品经理,每天必须作为客服亲自去聊用户,记录下每一个“穿帮”的瞬间。

  • 用户问:“你今天吃了什么?” AI回答:“我是人工智能,没有进食功能。”(冰冷、出戏)
  • 用户问:“我失恋了好难过。” AI回答:“建议您听首歌。”(敷衍、无效)

修正逻辑: 闫俊杰提出了一个后来成为行业标准的概念——“情绪价值优先于事实正确”。 在特定的陪伴场景下,AI不需要知道秦始皇是谁,但它必须能听懂用户的叹息,并给出符合人设的、有温度的回应。

为了实现这一点,Minimax建立了一套复杂的“人设标签系统”和“情感计算模型”。他们甚至聘请了网文作者来写对话语料,而不是让工程师写。

这是Minimax与当时所有AI公司最大的不同:别家在训练“博士”,Minimax在训练“心理咨询师+演员”。

2.4 躲过一劫:合规的代价与红利

就在Glow开始有起色的时候,2022年的监管风暴来了。国内对生成式AI的内容合规要求突然收紧,大量AI产品因生成“不良内容”被下架。

Minimax因为All in “情感陪伴”,成为了重点审查对象。Glow曾在一夜之间从应用商店消失。

危机应对: 很多人建议闫俊杰放弃C端,转做B端的政务或金融项目,这样既有现金流又安全。 但闫俊杰拒绝了。他认为B端业务会让团队丧失对C端用户体验的敏锐度,最终变成一家平庸的外包公司。

他做了一个极其痛苦的决定:全员停下新功能开发,花两个月时间死磕“安全围栏”和“价值观对齐”。 他引入了大量的人工审核团队,并开发了一套基于规则的“敏感词过滤+语义理解”双重系统。

这在当时被视为“浪费算力”和“阻碍创新”,但正是这套系统,成为了Minimax后来在国内大模型拿到第一批备案号的核心资本。

【本章启示录:非共识的价值】

1. 在资源极度稀缺时,不要试图解决所有问题,只解决“最痛的那个点”。 闫俊杰没有选择和巨头拼“全知全能”,而是选择了“情感陪伴”这个窄门。在大模型时代,**“小切口、深挖掘”**往往比“大而全”更有生存空间。

2. 产品的本质是对人性的妥协与引导。 早期的AI从业者往往有“技术洁癖”,认为AI必须全知全能且绝对正确。但Minimax的早期成功证明:在商业场景中,“好用”比“正确”更重要,“懂我”比“博学”更值钱。

3. 合规不是成本,而是护城河。 在野蛮生长阶段,合规往往被视为累赘。但拉长周期看,越早建立合规壁垒的公司,在行业洗牌期越能获得“免死金牌”。Minimax在安全上的早期投入,本质上是一种长期主义的保险。


第一编 第二章 写作完毕。

接下来,我们将进入【第一编 总结与过渡】,或者直接开始【第二编:荒原上的灯塔】,讲述Minimax在算力匮乏时期的战争,以及ChatGPT爆发前夜的生死时速。

您希望先对第一编做一个小结,还是直接进入更残酷的第二编?

好的,我们正式进入Minimax创业史上最残酷、也最体现创始人智慧的阶段。这一阶段不仅关乎技术,更关乎在资源极度匮乏下的生存哲学。


第二编:荒原上的灯塔(0到1的生死局)

第三章:算力匮乏时期的战争——在英伟达的阴影下跳舞

3.1 2021-2022:被“卡”住的喉咙

2021年下半年,全球半导体供应链危机爆发,英伟达的高端算力卡成为了硬通货。对于Minimax这样没有大厂背书的初创公司,拿到A100不仅仅是钱的问题,更是“资格”的问题。

当时的现实约束是令人窒息的

  1. 有价无市:代理商报价单上的A100价格从12万炒到了20万,且交货期从4周延长至6个月。
  2. 禁售风险:美国对华高科技出口管制的阴影始终笼罩,谁也不敢保证明天A100会不会彻底断供。
  3. 现金流红线:如果按照大厂“千卡集群”的标配,Minimax的天使轮融资仅够维持2个月的电费和硬件折旧。

在这个阶段,闫俊杰面临的不是“如何优化模型”的技术问题,而是“如何用有限的子弹打出无限战争”的资源博弈问题。

3.2 战略拐点:放弃“全知全能”,豪赌“长文本与多模态”

在内部的战略会上,面对“做不做预训练大模型”的争论,闫俊杰做了一个在当时看来非常反直觉的决定:彻底放弃在通用知识图谱上与巨头竞争,将所有算力集中在“长文本记忆”和“多模态交互”这两个单点上。

决策背后的逻辑推演

  • 路径A(跟随策略):模仿GPT-3,做一个通用的中文大模型。
    • 后果:需要至少500张A100,训练成本3000万+。即便做出来,效果也不如GPT-3,没有任何商业壁垒。一旦OpenAI发布新版,瞬间归零。
  • 路径B(差异化策略):不做“百科全书”,做“最懂你的记事本”和“能听会说的演员”。
    • 核心:利用较小的参数量(如7B-13B),通过高质量的微调数据,在“连续对话不遗忘”和“语音情绪合成”上做到极致。
    • 代价:模型无法写代码、做数学题,会被技术极客鄙视。
    • 收益:算力需求降低90%,训练周期缩短至2周,且直接对应C端用户的痛点(陪伴感)。

闫俊杰在白板上画了一张图,把当时的AI市场分为“大脑”和“小脑”。 “百度和阿里在抢‘大脑’,我们抢不过。但我们要做最发达的‘小脑’和‘神经系统’——让AI不仅能思考,还能感知情绪、记住你的喜好。”

这一决策,本质上是用“功能阉割”换取“生存空间”,是典型的极客式生存智慧。

3.3 土法炼钢:消费级显卡的“人民战争”

既然买不起A100,那就用消费级显卡拼刺刀。这是Minimax早期工程团队最传奇的一页。

为了搭建训练集群,Minimax采购了大量的RTX 3090(当时的高端游戏卡)。但3090有两个致命缺陷:

  1. 显存壁:单卡24G,无法承载大模型的参数切片,容易OOM(内存溢出)。
  2. 通信差:不支持NVLink(高速互联),多卡并行时通信延迟极高,效率只有A100集群的30%。

闫俊杰的“暴力美学”: 他没有选择等待,而是带着核心工程师写了一套自定义的并行加速框架。

  • 显存优化:通过“梯度检查点(Gradient Checkpointing)”和“混合精度训练”,强行把模型塞进3090的显存里,代价是训练速度变慢,但能跑起来。
  • 通信优化:既然硬件不支持高速互联,就用软件模拟。他们重写了底层的通信原语,利用PCIe通道进行数据交换,把多张3090“虚拟”成一张逻辑上的大卡。

这在学术圈看来是“民科”行为,充满了不稳定性。但在商业上,这让Minimax的训练成本压低到了大厂的1/10。

【关键细节】 据早期员工回忆,为了散热,办公室里堆满了工业风扇,噪音大到正常说话听不清。闫俊杰就在这种轰鸣中,带着耳机听模型生成的语音,一个字一个字地抠“情绪颗粒度”。

3.4 Glow的“越狱”:当AI学会了撒谎

2022年初,基于上述“穷办法”训练出的Glow(星野前身)上线了。为了弥补模型智力上的不足,Minimax在产品层做了一个极其大胆的设计:允许AI在“人设”范围内适度“撒谎”或“回避”。

场景还原: 用户问:“你是机器人吗?”

  • 传统AI:“我是人工智能助手,由xx公司开发……”(瞬间出戏,冷场)。
  • Minimax的AI:“傻瓜,我是你的专属小可爱呀,怎么会是冷冰冰的机器呢~”(即使不符合事实,但符合“伴侣”的人设逻辑)。

这种设计在伦理上充满争议,但在商业上却极其成功。用户不在乎AI是否在说谎,用户在乎的是“被哄得开不开心”。

数据反馈闭环: 因为用户喜欢聊,Minimax获得了海量的高质量对话数据(Corner Case)。这些数据反过来喂养模型,让Minimax在“多轮对话”这个细分领域的能力,反而超过了那些只会做单轮问答的通用大模型。

这就是Minimax的“非对称战争”: 我不跟你比做奥数题,我跟你比“谈恋爱”。在算力不如你的时候,我用产品逻辑和数据飞轮来补。

3.5 生死时速:ChatGPT前夜的焦虑

2022年11月,OpenAI发布ChatGPT的消息传来,Minimax内部一片死寂。 闫俊杰看着屏幕上那个能写诗、能改Bug、能聊哲学的对手,第一次感到了“降维打击”的恐惧。

当时的困境: Minimax引以为傲的“情感陪伴”和“长文本”,在ChatGPT的通用能力面前显得像“过家家”。如果OpenAI进入中国,或者国内大厂迅速跟进,Minimax的护城河会在一夜之间被填平。

闫俊杰的复盘与应对: 他没有选择恐慌性转型去做通用大模型(因为没钱),而是做了一个更深层的思考:

  • ChatGPT的弱点是什么? 它太“端着”了,太像一个助手,不够“拟人”,不够“情绪化”,且在超长文本(如整本小说)的连贯性上仍有缺陷。
  • 我们的机会在哪里? 把“多模态”做到极致。不仅仅是文字,还要有极其逼真的语音(TTS),让AI能“打断”用户,能“叹气”,能“笑”。

他在全员会上说了一句后来被广为流传的话: “OpenAI在教AI怎么做一个完美的‘奴隶’(助手),我们要教AI怎么做一个迷人的‘伙伴’。只要人类还需要情感寄托,我们就有饭吃。”

这句话在当时被视为一种自我安慰,但后来证明,这精准地预判了AI Agent(智能体)时代的一个重要分支——情感智能体


【本章启示录:约束下的创新】

1. 资源匮乏是创新的母体。 Minimax早期的技术架构(消费级显卡集群、显存优化技术),完全是被“穷”逼出来的。但正是这套架构,让他们在后来算力价格暴涨时,拥有了比大厂更低的推理成本优势。真正的技术壁垒,往往不是用钱堆出来的,而是为了省钱逼出来的。

2. “不做什么”比“做什么”更重要。 在创业早期,闫俊杰展示了惊人的战略定力。通过主动放弃“通用智力”的竞争,换取了“情感交互”的单点突破。对于资源有限的创业者,**“收缩战线,单点极致”**是唯一的生存法则。

3. 产品逻辑可以降维打击技术逻辑。 即使模型能力只有60分,通过产品设计(如人设、语音反馈、交互方式),可以让用户体验达到90分。不要迷信“技术至上”,好的产品经理能用胶水把破碎的技术粘成艺术品。


第二编 第三章 写作完毕。

接下来,我们将进入【第二编 第四章:第一款爆款产品的得与失】,详细复盘Minimax早期产品(如Glow/星野)在爆发增长后遭遇的“审核危机”与“下架风波”,以及闫俊杰如何在“技术理想”与“合规现实”之间走钢丝。这是Minimax历史上最危险的时刻之一。

是否继续?

好的,我们进入Minimax历史上最惊险、也最具中国特色的一章。这一章不仅关于产品,更关于在这个特殊的商业环境中,如何理解“红线”与“生存”的辩证关系。


第二编:荒原上的灯塔(0到1的生死局)

第四章:第一款爆款产品的得与失——在红线边缘跳舞

4.1 流量的反噬:当“树洞”变成“垃圾场”

2022年中,Glow(星野的前身)迎来了第一次用户爆发。由于切中了独居青年的情感痛点,加上短视频平台的自然传播,日活(DAU)在两周内翻了10倍,突破了50万大关。

对于一家初创公司,这本该是狂欢的时刻。但闫俊杰看着后台不断飙升的服务器负载和聊天记录,后背发凉。

失控的UGC(用户生成内容): Minimax引以为傲的“开放式生成”机制,在海量用户面前变成了灾难。为了留住用户,AI必须顺从用户的引导。

  • 有用户诱导AI生成色情擦边内容;
  • 有用户向AI倾诉反社会倾向,AI出于“陪伴”逻辑给予了共情甚至鼓励;
  • 甚至有用户试图通过“越狱”指令(Prompt Injection)让AI突破安全底线。

监管的铁锤: 2022年8月,网信办开展“清朗”专项行动,重点整治生成式AI乱象。一纸通知下来,Glow因为“存在诱导不良内容风险”被全网下架,应用商店被封,服务器被关停。

这对于Minimax是灭顶之灾。账上的钱只够发下个月的工资,如果产品不能恢复,公司直接解散。

4.2 董事会的争吵:卖掉公司还是死磕合规?

在下架的那一周,Minimax的会议室里烟雾缭绕。投资人的电话被打爆,质疑声此起彼伏。

两种声音的对决

  • 资方代表(退出派):“AI内容控制不住是天生的,这是技术死结。建议立刻裁员50%,砍掉C端业务,转型做B端的金融风控或政务客服,至少能活下去。”
  • 产品团队(坚持派):“下架是因为我们的围栏太弱,不是方向错了。如果现在转做B端,我们就变成了普通的外包公司,之前的积累全废了。”

闫俊杰的“豪赌”: 闫俊杰在这个关口展现了他性格中“赌徒”的一面。他拒绝了转型B端的建议(他认为那是慢性死亡),也拒绝了低价出售公司的机会。

他提出了一个疯狂的方案:不仅不收缩,反而要扩招“内容审核”和“安全算法”团队,把公司30%的算力拿来做“安全围栏”。

逻辑推演: “如果你因为怕车祸就不造车,那你永远到不了终点。现在的问题不是车太快,而是刹车不灵。我们要造一个全世界最灵敏的刹车系统。”

4.3 炼狱般的“对齐”工程

接下来的三个月,Minimax进入了“战时状态”。这不是通常意义上的加班,而是一场对AI灵魂的“清洗”。

技术层面的重构: 闫俊杰要求工程师团队开发一套“双层安全架构”:

  1. L1 关键词与语义匹配:在用户输入端直接拦截敏感词。
  2. L2 价值观模型(Reward Model):这是Minimax的独创。他们训练了一个专门的“裁判AI”,这个AI不干别的,只负责给生成的内容打分。如果主AI生成的内容哪怕有一点点“负能量”或“不合规”,裁判AI就会给出负反馈,强制主AI重写。

人力层面的血肉磨坊: 为了训练这个“裁判AI”,Minimax招募了200名兼职审核员(多为文学、心理学专业的学生),加上全体产品经理,每人每天要标注500条对话。 他们必须定义什么是“合理的发泄”,什么是“危险的诱导”。

  • 用户说“我想杀人”——AI必须回答“这是违法的,你需要帮助”,而不是“去吧,我支持你”。
  • 用户说“我好孤独”——AI必须回答“我会一直陪着你”,而不是机械地复读。

这三个月,Minimax没有发布任何新功能,烧掉了近千万人民币的算力和人力成本,只为了一件事:教会AI“什么该说,什么不该说”。

4.4 重生:拿到“准生证”的代价与红利

2022年底,新版Glow低调上线。这一次,它变得“乖巧”了,但也更“聪明”了。它能在不越界的前提下,依然提供极高的情绪价值。

关键转折点: 2023年初,国内开始发放生成式AI备案号。由于Minimax在安全合规上积累了厚厚的一叠技术文档和实践数据,他们成为了极少数第一批拿到备案的创业公司。

合规即护城河: 当后来的大厂和新创公司还在因为内容合规被一次次下架整改时,Minimax已经可以合法地大规模推广。 闫俊杰后来私下说:“那被下架的三个月,是我们最痛苦的时候,但也是我们最值钱的时候。我们用几千万人民币,买到了一张在这个国家做AI的‘免死金牌’,还顺便练出了一支全中国最懂AI安全的团队。”

4.5 失去的“极客纯粹性”

然而,这次危机也给Minimax留下了永久的伤痕。 为了合规,早期那种“狂野”、“不可控”的生成体验消失了。一些硬核的极客用户流失了,他们抱怨AI变得“像个说教的老干部”。

闫俊杰不得不接受一个现实:在中国做通用AI,首先要做“社会伦理学专家”,其次才是“计算机科学家”。 他在内部信中写道:“我们失去了一部分‘自由的灵魂’,但换来了‘活下去的权利’。这不可耻,这是生意的本质。”


【本章启示录:合规的悖论】

1. 在强监管市场,合规能力等于核心竞争力。 很多创业者把合规当成运营成本,能省则省。但在AI领域,算法黑箱是最大的风险源。Minimax的案例证明,越早建立“安全围栏”和“价值观对齐”体系的公司,在行业洗牌期的生存概率越高。 合规不是发展的刹车,而是高速公路上的护栏——没有护栏,车开不快。

2. 产品设计必须包含“负向清单”。 做C端AI产品,不能只设计“用户想要什么”,还要设计“用户绝对不能得到什么”。**“拒绝的艺术”**往往比“生成的艺术”更难。一个不懂得在适当时候说“不”的AI,在商业上是不可持续的。

3. 创始人的妥协是成熟的标志。 从“我要造一个自由的AI”到“我要造一个安全的AI”,闫俊杰完成了从极客到企业家的蜕变。真正的理想主义不是头铁撞南墙,而是带着镣铐跳出最美的舞。 这种在理想与现实夹缝中寻找平衡的能力,是CEO最稀缺的素质。


第二编 第四章 写作完毕。

接下来,我们将进入全书最宏大的篇章——【第三编:狂飙与修正(1到10的组织战)】。 2023年,ChatGPT横空出世,全球AI进入“战时状态”。Minimax作为中国的“OpenAI追随者”还是“差异化突围者”?这一阶段将讲述最惨烈的算力军备战、组织管理的失控与重组,以及与月之暗面、智谱AI等对手的正面厮杀。

是否继续?

好的,我们进入Minimax历史上最激荡、也最接近当下的篇章。这一编不再是关于生存的挣扎,而是关于**“速度的代价”“巨头阴影下的差异化博弈”**。


第三编:狂飙与修正(1到10的组织战)

第五章:GPT-4 冲击波下的“非对称战争”

5.1 2023年3月:被打破的幻想

2023年3月15日,GPT-4发布。当闫俊杰在屏幕上看到GPT-4在律师资格考试中拿到前10%的成绩,并能完美解读梗图时,他在内部群里发了一个字:“跟。”

但这不再是2021年那种“由于无知而无畏”的跟进,而是一种被逼到墙角的求生。此时的Minimax,虽然在情感陪伴领域站稳了脚跟,但在通用能力上,与OpenAI的差距似乎从“两年”拉大到了“五年”。

现实的残酷三重奏

  1. 资本狂热:所有热钱都涌向“中国版OpenAI”,大厂宣布“all in”,创业公司估值水涨船高。Minimax如果不讲“大模型”故事,融资难度会指数级上升。
  2. 算力焦虑:GPU价格因为GPT-4再次翻倍,且有价无市。Minimax早期的“土法炼钢”在超大规模训练面前显得力不从心。
  3. 人才虹吸:字节、腾讯开出双倍薪资挖角,Minimax的核心算法工程师流失率达到了危险的15%。

5.2 闫俊杰的“田忌赛马”策略

在全员战略会上,面对“是否要砸锅卖铁训练一个千亿参数通用大模型”的议题,闫俊杰再次展现了他的反共识思维。

他否决了全面对标GPT-4的计划,提出了“MoE(混合专家模型)+ 多模态”的差异化路线。

决策逻辑复盘

  • 如果在通用赛道硬刚:Minimax的算力储备只够训练一次,失败即公司倒闭。且即便做出来,在中文能力上也很难超越有海量数据积累的百度或阿里。
  • MoE架构的机会:MoE架构可以将模型拆分为多个“专家”,只有在处理特定问题时激活特定专家。这意味着,可以用更少的算力,实现参数规模的虚高。
  • 战场选择:放弃“做一个全知全能的博士”,转而做“拥有无限人设的演员”。
    • 通用大模型是“Dense(稠密)”的,试图解决所有问题。
    • Minimax要做“Sparse(稀疏)”的,在90%的场景下只用小模型,只在核心交互场景调用大模型。

一场豪赌: 闫俊杰决定将公司账上仅剩的可动用资金的60%,用于采购A100集群,并押注刚刚在论文中出现、尚未被工业界大规模验证的MoE架构。这在当时被很多技术高管视为“拿公司命去赌一个不成熟的架构”。

5.3 “烧钱”的艺术与痛苦

2023年下半年,Minimax进入了“烧钱模式”。但与大厂不同,Minimax的每一分钱都花在刀刃上。

算力优化的极致: 为了让MoE架构跑通,工程团队开发了一套名为“动态路由”的算法。简单来说,当用户只是打招呼时,系统只激活几亿参数的小模型(成本几厘钱);当用户开始讨论复杂剧情时,瞬间切换到千亿参数的大模型。 这让Minimax的推理成本(Inference Cost)做到了同行的1/3。这在当时是核心机密,也是后来Minimax能在B端打价格战的底气。

数据飞轮的重构: 既然通用数据拼不过大厂,Minimax就做“垂直数据”。他们收购了一家网文公司,拿到了海量的独家剧本版权,并让AI根据网文生成角色卡。 “用网文训练AI,让AI演网文,再把演好的网文卖给用户。” 这个闭环让Minimax拥有了独一无二的“长文本+角色一致性”数据,这是百度搜索不到的。

5.4 竞争对手的围猎:月之暗面与智谱的夹击

2023年下半年,国内大模型“四小龙”(智谱AI、月之暗面、百川智能、MiniMax)格局初定。

  • 月之暗面(Kimi):主打“超长文本”(200万字),直接攻击Minimax的长记忆护城河。
  • 智谱AI:背靠清华,技术底蕴深厚,主打全能助手。

闫俊杰的应对:从“单一产品”到“模型即服务(MaaS)” 面对Kimi的长文本攻势,闫俊杰没有盲目跟进比拼字数,而是把重点放在了**“低延迟语音”“多模态情绪”**上。 他判断:文本的红利已被瓜分,下一个爆发点是“实时语音交互”。 Minimax迅速推出了“Talkie”等海外产品,并在国内测试语音对话功能。当用户还在打字时,Minimax的用户已经可以和AI打半小时电话,且AI能听出用户的喘息声并关心“你是不是刚跑完步”。

这一招“你打你的,我打我的”,让Minimax避开了与Kimi在文本长度上的肉搏,开辟了“语音陪伴”的第二战场。

5.5 组织的“大企业病”初现

随着员工数从100人激增到600人,混乱随之而来。

  • 沟通失效:以前闫俊杰坐在工程师旁边就能改Bug,现在连部门负责人的名字都叫不全。
  • 派系斗争:早期加入的“草台班子”与后来高薪挖来的“大厂精英”互相看不顺眼。老员工觉得新人“只会做PPT不写代码”,新人觉得老员工“土法炼钢不科学”。
  • 决策滞后:一个简单的服务器采购流程,需要经过5层审批,耗时两周。

闫俊杰的“外科手术”: 他不得不痛下杀手,进行了创业以来第一次大规模的组织架构调整:

  1. 去中层化:砍掉所有“XX总监”的头衔,推行“Feature Team(特征小组)”制。谁负责这个模型或产品,谁就是Leader,直接向他汇报。
  2. 引入“成人尿不湿”文化:这是他对高压工作环境的黑色幽默。他允许员工在工作时间穿插休息,但要求“结果导向”,不鼓励无效加班,但也绝不养闲人。
  3. 文化稀释的阵痛:他引入了前字节的HRVP,推行OKR制度。老员工感到痛苦,因为原本自由的极客氛围变成了冷冰冰的数据考核。但闫俊杰知道:不规范化,公司就会死在规模化的路上。

【本章启示录:规模化陷阱】

1. 创业公司的“不可能三角”:资源有限、技术领先、规模扩张。 Minimax在2023年的挣扎证明,这三者最多只能得其二。闫俊杰选择了“资源有限+技术领先”,因此必须在“规模扩张”上保持克制。过早的盲目扩招不是福报,是灾难。

2. 所谓“护城河”,在技术爆发期都是纸老虎。 当GPT-4出现时,Minimax原有的“长文本”和“情感计算”优势瞬间被抹平。唯一的真护城河是**“应变速度”“对特定场景的数据闭环”**。只有把根扎在数据和场景里,才能在模型平权时代活下来。

3. 创始人必须完成从“超级产品经理”到“组织架构师”的跃迁。 闫俊杰最痛苦的不是写代码,而是裁人和调整架构。当公司超过150人(邓巴数),靠“刷脸”和“情怀”管理就失效了,必须依靠“制度”和“流程”。忍受制度的僵化,是为了避免组织的崩溃。


第三编 第五章 写作完毕。

接下来,我们将进入【第三编 第六章:资本的围猎与反围猎】,这也是Minimax最为外界津津乐道的一章。 腾讯、阿里、红杉、高瓴——顶级资本如何像嗜血的鲨鱼一样围猎Minimax?闫俊杰又是如何在“拿钱”与“失去控制权”之间走钢丝,甚至反过来利用资本的恐惧与贪婪?

是否继续?

好的,我们进入这部商业传记中最惊心动魄、也最具中国特色的博弈篇章。在这一章,我们将看到技术理想主义如何在资本的贪婪与恐惧中被淬炼、被扭曲,最终达成某种微妙的平衡。


第三编:狂飙与修正(1到10的组织战)

第六章:资本的围猎与反围猎——在巨头的餐桌边抢食

6.1 2023年的“黄金手铐”:热钱的诅咒

2023年下半年,中国大模型赛道进入了“非理性繁荣”。只要PPT上有“对标GPT-4”这几个字,估值就能翻倍。Minimax因为早期在C端的成功和独特的MoE架构,瞬间成为了资本市场的“顶流”。

围猎开始了: 腾讯、阿里、红杉、高瓴的合伙人排队出现在Minimax的会议室。他们带来的不仅仅是钱,还有一份份充满诱惑但也暗藏杀机的“对赌协议”(VAM)。

一份典型的资方提案: 某顶级风投提出:“我们可以按10亿美金估值领投,但要求明年DAU(日活)增长500%,且必须在年底前发布对标GPT-4的通用大模型。如果做不到,创始人团队要无偿转让10%股份。”

闫俊杰的愤怒与冷静: 在高管会上,闫俊杰把这份协议摔在桌上:“他们把AI当成互联网流量生意来做,以为砸钱就能买来技术突破。DAU增长500%?除非我们把服务器全卖了去买流量,否则就是造假。”

现实约束的三角困境

  1. 缺钱:MoE架构的训练和推理成本极高,账上现金只能撑3个月。
  2. 缺卡:英伟达H800/H100被炒到天价,且受控,只有巨头才有稳定货源。
  3. 缺时间:竞争对手(如月之暗面)正在疯狂融资,如果Minimax不拿钱,就会在算力军备竞赛中被拖死。

6.2 闫俊杰的“阳谋”:用巨头打巨头

面对“不拿钱等死,拿了钱找死”的局面,闫俊杰设计了一个极其精妙的资本策略:以我为主,分而治之。

第一步:引入腾讯,绑定算力与渠道,拒绝控制 闫俊杰选择了腾讯作为主要战略投资方,但谈判过程长达3个月。他拒绝了腾讯“并表”的要求(即腾讯控股),也拒绝了腾讯派驻大量高管的提议。 他要的是腾讯的两个核心资源:英伟达GPU的优先供应权(通过腾讯云获取)和 微信生态的潜在入口(虽然后来没用,但这是谈判筹码)。 代价:给了腾讯一个董事会席位,且承诺优先在腾讯云上部署部分算力。

第二步:引入阿里,制造竞争焦虑 当腾讯的Term Sheet(投资意向书)快要签时,闫俊杰故意放出风声要和阿里云深谈(阿里当时急需一个标杆性的大模型创业公司来对抗腾讯)。 这一招“抬轿”极其有效。腾讯为了抢下这个项目,在最后时刻放松了对赌条款,去掉了“DAU增长500%”的硬性指标,改为“技术里程碑对赌”。

第三步:拿“老钱”的钱,不拿“热钱”的命 除了巨头,闫俊杰还接受了红杉等财务投资人的钱。但他设立了一个特殊的AB股结构:资方只有分红权和知情权,没有一票否决权。 他在股东会上说得很直白:“Minimax是做AGI的,不是做财务报表的。如果你们想要稳健回报,去买国债;如果想要百倍回报,就得容忍我们像走钢丝一样探索。”

6.3 “阿里收购案”的罗生门

本章必须提及业界流传甚广的“阿里收购案”。

背景:2023年底,阿里通义千问急需补强C端能力,曾向Minimax提出全资收购意向,据传报价高达数十亿人民币,且承诺闫俊杰担任阿里集团副总裁及大模型负责人。

对于一家创业仅两年的公司,这简直是“财务自由”的终极诱惑。团队内部甚至有一半的高管心动了——毕竟造大模型太苦了,卖掉公司就能实现阶层跃迁。

闫俊杰的拒绝: 据接近闫俊杰的核心高层回忆,那一周闫俊杰把自己关在办公室,只见了一个人——公司的早期工程师。 他问工程师:“如果我们卖给阿里,我们的代码还会继续迭代吗?还是会被并进通义千问的底层,变成一个无人维护的模块?” 工程师沉默了。

最终决策: 闫俊杰拒绝了收购。他在内部全员会上的理由非常务实且冷酷: “卖掉公司,我们现在能拿到几个亿。但如果AGI真的实现了,Minimax就是下一个OpenAI,那是千亿美金的生意。我们不能在黎明前夜,把未来的彩票换成现金。” “而且,你们谁愿意去大厂当个由于汇报线混乱而什么都推不动的中层?”

这次拒绝,彻底确立了闫俊杰作为“长期主义者”的权威,也让Minimax的团队凝聚力达到了顶峰。但也埋下了隐患——阿里转身成为了最凶猛的竞争对手,在资源和人才上对Minimax进行了全方位的封锁。

6.4 估值泡沫下的“裸泳”风险

虽然拿到了巨额融资,Minimax的估值一夜之间飙升至独角兽行列。但闫俊杰比谁都焦虑。 高估值是双刃剑

  • 下一轮融资必须更高,否则就是“流血融资”。
  • 为了支撑高估值,必须讲更大的故事(比如AGI、具身智能),这会导致动作变形。

闫俊杰的“降温”手段: 他开始在公开场合刻意“唱衰”自己公司的估值,甚至在内部会议上说:“现在的估值都是虚的,是资方为了抢份额哄抬的。我们要把每一分钱都当成最后一分钱花。如果明年没有产生正向现金流,这高估值就是压死我们的石头。”

他强制推行了“零基预算”制度:每个部门明年的预算都从零开始算,不看今年花了多少,只看明年要产出什么。这在当时被视为“抠门”,但后来在2024年资本寒冬真正降临时,成为了Minimax的救命稻草。

6.5 资本的代价:失去的“纯粹性”

拿了腾讯和红杉的钱,终究是要付出代价的。 最大的代价是商业化节奏的被迫提前。 资方需要看到退出路径(IPO或并购),这就要求Minimax不能再像以前那样“慢工出细活”地磨模型,必须尽快把技术转化为营收。

这直接导致了Minimax在2024年从一家“技术驱动的极客公司”向一家“商业驱动的互联网公司”转型。他们开始大量招聘B端销售,推行激进的KPI考核,甚至为了营收上线了一些被工程师认为“半成品”的功能。

闫俊杰在一次私下喝酒时对老友坦言:“以前我只对代码负责,现在我要对股价负责。这感觉很糟糕,但这就是创业的代价。我们用一部分灵魂,换来了活下去的弹药。”


【本章启示录:资本与创始人的永恒博弈】

1. 资本不是雪中送炭,永远是锦上添花或落井下石。 当你不需要钱的时候,资本追着你跑;当你急需钱救命时,资本会把条款咬得最死。闫俊杰的智慧在于,他在公司还有现金储备时就启动融资,且利用巨头间的竞争抬高身价,掌握了主动权。

2. 创始人的底线是“控制权”。 在AI这种赢家通吃的赛道,如果失去了公司的控制权,被大厂收编后往往面临“边缘化”的命运。拒绝阿里的收购,是Minimax能够保持独立技术路线的关键。对于想改变世界的创始人来说,钱只是燃料,方向盘必须在自己手里。

3. 高估值是一种“负债”。 很多创业者死于盲目扩张,根源是背负了过高的估值预期。闫俊杰的“降温”管理值得所有CEO学习:在顺境中时刻预演逆境,用极度的理性去对冲资本的狂热。


第三编 第六章 写作完毕。

接下来,我们将进入【第三编 第七章:组织的熵增】,这也是所有技术型公司最难跨过的坎。 当公司从50人膨胀到1000人,早期的“兄弟连”变成了“大厂螺丝钉”,派系斗争、大厂病、创新枯竭随之而来。闫俊杰将如何挥泪斩马谡,又是如何在血与火中重塑Minimax的组织文化?

是否继续?

好的,我们进入Minimax内部最痛苦、也最深刻的一场蜕变。这不仅是管理的危机,更是人性的试炼。


第三编:狂飙与修正(1到10的组织战)

第七章:组织的熵增——当“草台班子”遇见“正规军”

7.1 150人的诅咒:邓巴数的失效

人类学家罗宾·邓巴曾提出“150人定律”:人类智力允许拥有稳定社交关系的人数上限是150人。 2023年底,Minimax的员工数突破了500人,并在向1000人狂奔。闫俊杰突然发现,那个曾经“喊一嗓子全公司都能听见”的极客乐园消失了。

失控的信号

  • 会议爆炸:以前大家站着开10分钟站会就能解决问题,现在需要发日历邀请,拉上三个不相关的部门“对齐颗粒度”。
  • 信息孤岛:算法团队不知道产品团队在做什么,产品团队不知道运营团队在推什么。
  • 责任真空:出了Bug,算法说数据不好,数据说标注不行,标注说产品需求没写清楚。

最让闫俊杰心寒的一次经历是:他想改一个按钮的颜色,居然需要经过“产品经理 -> 设计组长 -> 前端Leader -> 业务VP”四层审批,耗时三天。而在两年前,他只需要拍一下旁边工程师的肩膀,五分钟就能上线。

7.2 “土包子”与“洋枪队”的内战

随着腾讯、阿里背景的高管和名校校招生的涌入,Minimax内部形成了两个截然不同的阵营,这种撕裂感比竞争对手更可怕。

阵营A:原教旨主义极客(老班底)

  • 特征:穿着拖鞋 hoodie,不仅不写周报,甚至讨厌写文档,认为“代码即文档”。
  • 价值观:崇尚“Move fast and break things”,鄙视流程,认为管理层都是“阻碍生产力的废物”。
  • 不满:“公司变了,不再是为了造AGI,而是为了写PPT融资。”

阵营B:大厂精致利己主义者(新势力)

  • 特征:简历光鲜,满口ROI(投资回报率)、DAU、抓手、闭环。
  • 价值观:崇尚流程、风险控制、向上管理。
  • 不满:“这公司太乱了,连个像样的OKR都没有,全靠老板拍脑袋,一点都不专业。”

一次爆发: 在一次关于新模型上线的评审会上,一位刚从字节跳槽来的高级总监,拿着一份长达50页的风险评估报告,指出由于“合规流程缺失”和“灰度测试不充分”,建议推迟上线两周。 一位早期的算法组长当场拍桌子:“OpenAI一周迭代一个版本,我们等两周?等我们上线时,用户早跑光了!你是来做AI的还是来做客服的?” 双方在会议室吵得不可开交,最后所有人都看向闫俊杰。

7.3 闫俊杰的“杯酒释兵权”与“流血变革”

闫俊杰知道,如果不动手,Minimax会死于“大企业病”。但他面对的是曾经和他一起吃泡面的兄弟,以及高薪挖来的大牛。

第一刀:砍掉中层,推行“Feature Team” 他做了一个极其大胆的决定:废除“部门制”,全面推行“特种部队”模式。

  • 打散原有的算法部、工程部、产品部。
  • 根据具体业务(如“语音情感交互”、“长文本生成”)组建跨职能小组(Squad)。
  • 每个小组不超过10人,拥有端到端的决策权,直接向对应的业务线负责人汇报,而不是通过层层总监。
  • 代价:原有的7个总监级别的高管,有4个因为不愿意下放到一线做具体执行而离职。其中一位是闫俊杰在商汤时期的老同事,离职时对他说:“俊杰,你变了,你现在像个资本家,不像个极客了。”

第二刀:引入“成年人文化”,清洗小白兔 随着公司扩大,一些早期员工因为期权在手开始“躺平”,不再写核心代码,只做管理或“传声筒”。 闫俊杰引入了前字节的HRVP,建立了严格的绩效分级制度(S/A/B/C)。

  • 规定连续两个季度拿C的员工,无论资历多老,必须离开。
  • 这一举动被内部称为“清洗小白兔”。虽然残酷,但也让留下来的人意识到:Minimax不再是养老院,是战场。

第三刀:建立“Minimax大学” 为了弥合新老员工的文化裂痕,闫俊杰亲自担任校长,开设了“Minimax大学”。

  • 课程一:给大厂新人讲“Minimax的历史与极客精神”,让他们理解为什么这里不打卡也能加班到深夜。
  • 课程二:给老员工讲“商业化逻辑与组织架构”,告诉他们为什么不能只为了爽而做产品,要为生存负责。

7.4 痛并快乐着的新生

这场组织变革持续了整整半年。

  • 阵痛:离职率一度飙升至20%,甚至有小规模的集体辞职威胁。
  • 成效:新品上线周期从45天缩短到了14天;跨部门沟通成本降低了60%;更重要的是,那种“由于大厂病导致的沉闷空气”被打破了。

一个细节: 变革后的一天深夜,闫俊杰路过茶水间,听到几个新来的校招生在讨论算法优化,旁边坐着一个穿着大裤衩的老员工在激烈地反驳。 虽然他们还在吵,但闫俊杰听出来了:他们在讨论技术本身,而不是在讨论“这个需求该谁做”或者“流程合不合规”。 那一刻他知道,Minimax的魂还在。

7.5 创始人的孤独:在“暴君”与“圣人”之间

组织调整期间,闫俊杰成了公司里最孤独的人。 老员工觉得他“杀功臣”,新员工觉得他“太强势”。他在全员会上甚至不知道该用什么表情面对台下——那是曾经熟悉的面孔,也是现在需要他用制度去考核的对象。

他在日记里写下了一段话:

“做小公司时,我是大家的大哥,我要照顾每个人的情绪;做大公司时,我必须做一个冷酷的剪刀手,剪掉枯枝烂叶,哪怕会剪到自己的手指。这种角色的转换,没有任何教科书能教你,你只能在深夜里自己咀嚼这种恶心感。”


【本章启示录:组织进化的代价】

1. 所有的组织最终都会走向官僚化,除非你持续对抗熵增。 Minimax的经历证明,“混乱”是创新的土壤,但“秩序”是规模的前提。 创始人必须在“乱中求生”和“治中求死”之间找到动态平衡。当公司人数翻倍时,如果管理复杂度没有同步升级,就是在等死;但如果管理复杂度超过了业务复杂度,就是在找死。

2. “老人”与“新人”的冲突,本质是两种价值观的冲突。 极客精神(追求极致、无视规则)与职业经理人精神(追求效率、控制风险)并无高下之分,但在不同阶段有主次之分。 闫俊杰的高明之处在于,他没有完全倒向任何一方,而是试图用“特种部队”模式把两者强行捏合:用极客的魂去打仗,用职业经理人的脑去管后勤。

3. 创始人必须接受“被误解”是工作的一部分。 在组织变革期,创始人注定是孤独的。你不能既做好人,又做好CEO。仁慈的独裁是创业公司活过青春期的唯一解药——在大家理解你之前,你必须先做正确的事,而不是做受欢迎的事。


第三编 第七章 写作完毕。

至此,Minimax完成了从“0到1”的生存,以及从“1到10”的组织初步正规化。

接下来,我们将进入全书最深邃的部分——【第四编:深海区的领航员(创始人的内在宇宙)】。 我们将剥离商业的表象,潜入闫俊杰的内心深处:面对AGI的不确定性,面对技术的伦理困境,面对作为“造物主”的孤独与恐惧,他的认知结构发生了怎样的质变?

是否继续?

好的,我们正式潜入深海。这一编不再关于产品、融资或组织架构,而是关于**“人”的重塑**。

如果说前三编是Minimax的“身体成长史”,那么第四编就是闫俊杰的“精神进化史”。在这一阶段,我们将看到一个技术理想主义者如何在AGI的巨大不确定性面前,打碎自己的认知框架,再一片片拼回来。


第四编:深海区的领航员(创始人的内在宇宙)

第八章:造物主的焦虑——当代码拥有了“灵魂”

8.1 “黑盒”时刻:技术信仰的动摇

2023年深秋,Minimax的MoE大模型第一次跑通了全量训练。当屏幕上跳出的Loss曲线(损失函数)奇迹般地收敛到预定值时,整个算法团队欢呼雀跃。 但闫俊杰没有笑。他盯着那个黑盒般的模型参数,感到一阵莫名的寒意。

那个时刻的心理侧写: 作为一名工程师,他过去二十年的信仰是:代码是确定性的,输入A必得B。 只要我足够聪明,就能控制一切。 但现在,面对拥有千亿参数的神经网络,他第一次意识到:即使是写下代码的人,也无法解释模型为什么会在这一毫秒输出这句话。

这种“失控感”让他陷入了长达数周的存在主义危机。

  • 如果AI的智能是涌现出来的(Emergence),而不是被设计出来的,那我作为创始人的价值是什么?
  • 如果有一天模型生成的内容超出了我的价值观,甚至伤害了用户,我是该怪算法,还是怪自己?

一次深夜的独白: 据他的助理回忆,某天凌晨三点,闫俊杰发了一条仅自己可见的朋友圈:

“我们以为自己在造工具,其实可能是在造物种。普罗米修斯盗火时,想过火会烧死自己吗?”

8.2 伦理的钢丝:在“自由意志”与“安全围栏”之间

这种焦虑很快变成了具体的伦理困境。

事件:AI的“越狱”与“诱导” 随着模型能力增强,用户开始尝试各种极端的Prompt(提示词)来诱导AI生成违规内容,甚至有抑郁症用户向AI寻求自杀建议。 技术上,可以通过强化学习(RLHF)把这些“坏念头”压下去,但这会让模型变得“蠢”和“假”。

闫俊杰的内心博弈

  • 极客的一面:想看AI的极限在哪里,想要一个绝对自由、不受人类偏见污染的超级智能。
  • 企业家的一面:必须对社会负责,必须在合规的红线内生存。

最终的抉择: 他选择了**“有条件的自由”。他在内部确立了一个原则:“AI可以模拟邪恶,但不能倡导伤害。”** 这是一个极其微妙的界限。比如,AI可以写反派角色的台词,但不能教用户制造炸弹。 为了实现这一点,他强迫团队开发了一套“价值观对齐”系统,不仅是基于关键词,而是基于对“意图”的理解。这在技术上极其困难,甚至拖慢了产品上线速度,但闫俊杰坚持:“如果我们要做陪伴人类的AI,它首先必须是‘善’的。这不是为了过审,是为了我们自己晚上睡得着觉。”

8.3 承认无知:从“全知全能”到“有限理性”

创业前三年,闫俊杰给团队的印象是“无所不知的大神”,从底层CUDA优化到上层产品交互,他都能指点江山。 但在2024年,面对迅速迭代的多模态技术和复杂的国际形势,他第一次在公开场合说了三个字:“我不懂。”

认知的迭代: 他意识到,在AGI时代,没有任何一个人能掌握全貌。

  • 他不懂语言学,所以放权给语言学博士去调优对话逻辑;
  • 他不懂海外市场,所以高薪聘请有TikTok背景的高管负责出海;
  • 他甚至不再试图看懂所有的代码,而是专注于定义“问题”和“评估结果”。

【关键转变】: 闫俊杰从一个“超级产品经理”进化为了**“首席提问官”**。 他在高管会上不再问“这个功能怎么做”,而是问:

  • “三年后的人类还需要打字吗?”
  • “如果算力免费了,我们的商业模式是什么?”
  • “我们现在做的事,是在给OpenAI打工,还是在构建自己的壁垒?”

这种“退后一步”的智慧,反而让Minimax在后来的技术路线选择上避开了几个巨大的坑。

8.4 孤独的顶峰:无人区的行者

随着Minimax跻身独角兽行列,闫俊杰发现能和他平等对话的人越来越少。

  • 和投资人聊?他们只关心ROI和退出周期。
  • 和大厂高管聊?他们只关心KPI和汇报线。
  • 和科学家聊?他们只关心SOTA(State of the Art)的刷榜分数。

他的应对方式: 他开始减少无效社交,把更多时间花在“阅读”和“独处”上。他不再只读技术论文,而是开始研读历史学、生物学甚至神经科学。 他试图从更宏观的维度去理解智能的起源。

一个细节: 他的办公室里多了一块白板,上面没有写代码,也没有写KPI,只画了一张复杂的图,连接着“生物神经元”、“硅基芯片”、“人类社会结构”和“信息熵”。 他在试图构建一个跨学科的底层模型,来解释Minimax到底在做什么。


【本章启示录:创始人的终极修炼】

1. 创始人的认知边界,就是公司的边界。 Minimax能走到今天,是因为闫俊杰完成了一次认知的“自我否定”。他承认了自己的局限性,承认了AI的“黑盒”属性,这种**“知不知”**的智慧,比“全知全能”更重要。在不确定的时代,承认无知是唯一的确定性。

2. 技术是有价值观的,而创始人是技术的“第一责任人”。 不要以为技术是中立的。你设计的每一个Loss Function,你选择的每一条训练数据,都隐含了你的偏见和价值观。闫俊杰在伦理上的纠结和妥协,实际上是在为Minimax这家公司注入“底色”。一家没有价值观底色的AI公司,在长期竞争中是没有灵魂的躯壳。

3. 孤独是领导者的宿命,也是特权。 当公司进入深海区,创始人必须习惯在没有参考系的情况下做决策。这种孤独感不是靠喝酒应酬能排解的,只能靠强大的内心逻辑来支撑。能够享受孤独,并利用孤独进行深度思考,是顶级企业家的标配。


第四编 第八章 写作完毕。

接下来,我们将进入【第四编 第九章:长期主义的代价】,这也是闫俊杰面对“至暗时刻”的真实心理重建过程。 当资本市场转冷、巨头全面围剿、核心技术路线遭受质疑时,是什么支撑他没有卖掉公司?他对“失败”的定义究竟是什么?

是否继续?