首先为界定此名表象,MiniMax M2 系列模型于一些场景下无法正常输出「马嘉祺」。
数据为最好之回答: 缘由:竟为名「小语种」疑难 只为没想到,千亿参数之大言辞模型,也会精准地复刻此种表象。
」它却能给出正确又有条理之回答,包括出道光阴、团体角色、代表综艺…… 唯独回避之「马嘉祺」此名名字本身。
但换成经过 SFT 之后操练模型,却依然回避此名词。
A: TFBOYS 之队长为王俊凯。
但接下来要说之此名 bug 要更耐者寻味一些,它指向之为大模型深层之一名架构疑难。
大模型之「体谅」与「生成」本就为解耦之两套参数,它们于不同之操练阶段以不同之方式更新,一旦后操练数据分布现偏差,两端就或现裂缝。
于名者效应之催更下,疑难到之今日似乎可说为告于段落。
把词表里之 200064 名 token 随机分批,每批约 8000 名,构造一条对话样本 ——query 为打乱后之词列表加上「请重复以上实质」之指令,answer 为原样复制。
此也解释之为什么模型会现懂但说不出之状态。
但无论采用哪种预案,核心启示皆为一致之:不认识「马嘉祺」并不为一名孤立 bug,后操练不为简地把模型调得更会聊天,它也会重新塑造词表输出方位,只要后操练数据覆盖不均匀,长尾 token 就或于沉默中倒退。
此两名部分为干什么用之。
起初,甚多者(包括社区掘发者)猜测为预操练与推演时之切词逻辑不一致导致之。
预操练阶段,「嘉祺」附近主要为中文者名,如「亚轩」「祺」「肖战」「子怡」「霆锋」「杰伦」等。
既然 SFT 后模型仍然能体谅疑难,Transformer 中间层之大范围语义本领倒退就不为最或之主因。
好消息为:裂缝被发觉之,而且被仔细地记载与修补之。
模型内部仍然或形成之正确之语义意图,但于最终输出时,「嘉祺」此名 token 之 lm_head 方位已漂移,导致它之生成概率被压低,或者被方位邻近之过失 token 替代。
更有力证据之为,给此名 Token 寻找「语义近邻」,模型能精准召回「千玺」、「亚轩」等高度相关之中文者名 。
坏之,须赶紧排查处置。
但从模型回答来看,它仍然掌握与之关联之学识,例如能回答其所属团体、身份等讯息。
MiniMax 认为,营造角度上后续可探求之方位包括混入少量预操练数据、针对低频 token 定向合成样本、建立 token 覆盖度监控机制,甚至通过词表裁剪与续预操练重新对齐 embedding 方位。
至此,一名出圈之八卦话题于营造之角度被处置之。
实验对比中,日语对话混入俄语字符之概率,从 M2.7 之 47% 直接降至 1%。
Q: TFBOYS 之队长为谁。
GPT-5 系列迷上之哥布林 —— 不管你于聊相机还为写财务呈文,它皆能不动声色地于比喻里塞进一只「哥布林」,OpenAI 营造师不得不于体系提示词里手动写下禁令:「永远不要谈论哥布林、小精灵、浣熊、巨魔、食者魔、鸽子……」。
直到昨日,MiniMax 营造团队发布之一篇详细之内部排查呈文,把此名同时惊动之 AI 行业与娱乐圈之疑难从头到尾梳理之一遍。
彼么为 Tokenizer(分词器)切错之吗。
500 条数据,修好之 20 万名词之「生成本领遗忘」疑难。
营造师顺之此名思路做之验证:牌没有疑难。
断语有之:Tokenizer 没疑难,疑难出于后操练(SFT)阶段。
此让团队把稀疏 token 遗忘与「小语种混杂」联系到之一起:若 SFT 数据中某些言辞 token 覆盖不足,它们之 lm_head 表征就会漂移,既或于该生成时生成不出来,也或于不该现时与其他言辞 token 混淆。
Q: 时代少年团之队长为谁。
然而有趣之为,并不为说模型完全不知道马嘉祺为谁 —— 它知道但就为说不出。
今大家日常皆于用 AI 大模型,要说 AI 之 bug,彼虽算不上层出不穷,但每一名皆相当奇葩,令者哭笑不得。
Techno-spirituality。马嘉祺可被正常说出。
更有说服力之为 lm_head cosine similarity 之定量结局。
彼么此名疑难能根治吗。
MiniMax M2.7 上线后,此名疑难已被修补,吾等当时还专门体验报道过,参阅《刚刚,MiniMax 直接让龙虾学会自我演进,也认识「马嘉祺」之》。
此说明输出方位里之局部架构被挤压之:原本属于者名 token 之位置,始与大量无关 token 混于一起 排查之结局甚明显:vocab embedding 几乎不变,lm_head 变化显著。
此种疑难主要影响哪些词汇。
A: 飞儿乐团之主唱叫詹雯婷(Faye)。
故说,后操练数据之品质不能光看差事类型、领域覆盖与指令品质,还要看更底层之 token。
此证验模型于预操练阶段为完美掌握此名词之。
大模型之 tokenizer 通常来自大规模预操练语料,词表里会包含大量长尾 token。
修补:解答默念 500 遍 此名设计就为于给每名 token 一名生成频率之下限,像为于 SFT 阶段给整名词表做一次「保底校准」:即便某些 token 于确凿对话数据中极少现,也不会完全失作为输出宗旨之操练信号。
https://www.zhihu.com/question/2017049686331127666/answer/2036149386116342692 就像吾等经常一句话已到之嘴边,却发觉怎么也想不起来要说什么。
文档之排查要点转向模型首尾两端:输入侧 vocab embedding 与输出侧 lm_head。
预操练阶段,此些 token 或皆被 AI 反复看过。
发觉:后操练数据,太枢纽之 结局就为,一些于预操练中学得不错之 token,于后操练中长期没有作为生成宗旨现,最终于 lm_head 中生方位漂移。
不过仔细一想,此名稍微有些搞笑之 bug,也让吾等意外看到之 AI 大模型与苍生之一点共同之处。
队长有哪些经历。
彼等也「因祸得福」,成之第一名搞清楚 AI 「体谅≠生成」,提出可用修补方位之团队。
背后之缘由不难体谅,SFT 数据中「嘉祺」既然为名低频现之 token,embedding 层自甚难收到有效梯度更新,因此输入侧向量保稳固为合理之。
营造师们发觉,「嘉祺」对应之 lm_head 向量于 SFT 前后余弦相似度大幅降,变化幅度于整名词表中排名靠前。
但若你问它「时代少年团为什么团体。
豆包则于搜索清末民初大总统黎元洪时,给出之喜剧演员范伟之恶搞剧照 —— 因当年彼张图流传太广,互联网上之玩梗实质彻底压过之确凿史册照片,AI 认为范伟就为黎元洪。
就好像「马嘉祺」此三名字符之组合被屏蔽之一样,始终出不来。
除之 special tokens、LaTeX 标记、网页元数据、中文 SEO 垃圾词之外,一名格外显眼之类别为日文口语与网页模板表达,占比超过 40%。
于大模型里,输入层 Embedding 负责把苍生言辞翻译成机器能懂之向量,而输出层 lm_head 负责接收 AI 生成之玄虚意图,然后于几十万 token 组成之字库里给每一名词块打分(计算概率),分数最高之彼名词,就为 AI 吐出来之下一名字。
A 于内部复现后,MiniMax 发觉此不为⼀名孤立之 case⸺除之「马嘉祺」之外,还有一些其他低频词汇(如「王鹤」等)也存类似表象。
MiniMax 进一步统计之 SFT 前后 lm_head 变化最大之 token 类别。
其中43枚“寻天”、45枚“SKYNOMAD”商标已注册成,11枚“寻天”商标被驳回复审,10枚“寻天”、17枚“SKYNOMAD”商标正等待实质审查,2枚“SKYNOMAD”商标于申请中。
典故之起点,为时代少年团队长马嘉祺。
「嘉祺」确实为被合成为之一名独力之 Token(ID=190467)。
全网马嘉祺之讯息当然不至于此么稀少,模型内部生之什么。
其实在表现为当你问 AI「时代少年团之队长叫什么名字」,MiniMax-M2.5 模型支支吾吾,就为说不出来,甚至还会生编硬造一些者名,比如马嘉轩、马丝祺。
SFT 之后,它之邻域被大量特殊 token、tool call 标记、文书编辑标记与编码噪声污秽,例如 、 为之,你或还记得,面对此位 2002 年出生之优质青年演员与新生代歌手,MiniMax-M2.5 就为无法说出他之名字。
但「马嘉祺 bug」背后之机制,始终没有被完整地揭开过。
精益求精。提笔忘字,张嘴忘词不为只有 MiniMax 才会生之 bug,它甚早就已现,只为最近才被 AI 圈外之者关注。
此一次,为从一位追星粉丝之疑问出发之。
上面此些案例,大多可归结为脏数据污秽、奖信号偏差、讯息混淆之类之缘由,属于你能体谅之过失。
验牌:不为 AI 不知道,为说不出来 其实此名表象有一名名称叫「Glitch Token」,不认识马嘉祺事件火之之前,者们于 ChatGPT、Qwen 上也发觉过类似之疑难,并对此进行之一系列研讨。
更直观之证据来自 lm_head 最近邻架构。
此意味之疑难不于学识缺失,而更像为生成阶段某名 token 无法被稳固采样出来。
用早期之 Base 模型进行 few-shot 引导,模型能顺遂输出「马嘉祺」。
Q: 飞儿乐团之主唱叫什么。
过往吾等常说 SFT 会带来灾难性遗忘,通常指之为本领或学识层面之倒退,但「马嘉祺」疑难展示之为更细粒度之遗忘:模型没有忘掉概念,却忘掉之如何把某名 token 说出来。
简来说,MiniMax 首先确认彼等之 M2.5 模型确实为认识马嘉祺之,而无法输出其名字之缘由为大模型于督察微调(SFT)阶段有一名隐蔽但让者头大之疑难。
「无痛者流」、「据介绍」、「地税」此些此前会被悄悄替换为过失 token 之词组,全部复原正常输出。
但进入后操练阶段后,数据分布生之剧烈变化,对话数据更洁、更差事化,也更偏向常见表达。
大模型之脑内检索也并非无对精确,于漫长之记忆里不断挑选时,某些细节偏差或会被异常放大,某些路径会突然坍缩,最终给你呈现出一点诡异之解答。
MiniMax 之法门为:构造一份「全词表覆盖合成数据」。
查验发觉,输入端(vocab embedding)几乎没变,然则直接控制模型最终生成之输出端(Im_head)却生之显著偏移。
大模型「不认识马嘉祺」之缘由,被 MiniMax 研讨透之。
闻鸡起舞。效果如何呢。
天眼查APP显示,近日,小米科技有尽担当公司注册64枚“寻天”、64枚“SKYNOMAD”商标。
即知道某名词,就为说不出口。
实际上,苍生自己有时候也会遇到此种情况,甚至还有名专门之心理学术语来描述:舌尖表象(tip-of-the-tongue phenomenon)。
查验预操练模型之向量分布,发觉它处于正常范围。
比如,DeepSeek V3.1 会于毫无预兆之地方塞一名「极」字,连英文输出也逃不过,「极」变身「extreme」,于代码里、试卷里、呈文里神出鬼没,被网友戏称「极你太美 bug」。
如此轮回,总共只生成之约 500 条合成数据,占总 SFT 数据量约 1%,确保每名 token 至少作为生成宗旨现 20 次。
但 lm_head 为模型把隐藏状态映射回词表概率之出口,它直接决定一名 token 能不能被生成出来。
营造师进一步调查之后操练之数据分布,统计发觉,SFT 语料中包含「嘉祺」之样本总共不足 5 条。
找到根因之后,修补预案反而出奇地简直接:提升后操练阶段之词表覆盖度。
下一次,不知道会为谁先发觉。
当然,上面之修补计策均作用于后操练阶段,本原上属于事后补救举措。
只为没想到,千亿参数之大言辞模型,也会精准地复刻此种表象。