黄金现货投资-活久见，时代少年团给大模型上之一课

首先为界定此名表象，MiniMax M2 系列模型于一些场景下无法正常输出「马嘉祺」。

数据为最好之回答：缘由：竟为名「小语种」疑难只为没想到，千亿参数之大言辞模型，也会精准地复刻此种表象。

」它却能给出正确又有条理之回答，包括出道光阴、团体角色、代表综艺…… 唯独回避之「马嘉祺」此名名字本身。

但换成经过 SFT 之后操练模型，却依然回避此名词。

A: TFBOYS 之队长为王俊凯。

但接下来要说之此名 bug 要更耐者寻味一些，它指向之为大模型深层之一名架构疑难。

救助。

大模型之「体谅」与「生成」本就为解耦之两套参数，它们于不同之操练阶段以不同之方式更新，一旦后操练数据分布现偏差，两端就或现裂缝。

于名者效应之催更下，疑难到之今日似乎可说为告于段落。

把词表里之 200064 名 token 随机分批，每批约 8000 名，构造一条对话样本 ——query 为打乱后之词列表加上「请重复以上实质」之指令，answer 为原样复制。

此也解释之为什么模型会现懂但说不出之状态。

但无论采用哪种预案，核心启示皆为一致之：不认识「马嘉祺」并不为一名孤立 bug，后操练不为简地把模型调得更会聊天，它也会重新塑造词表输出方位，只要后操练数据覆盖不均匀，长尾 token 就或于沉默中倒退。

此两名部分为干什么用之。

起初，甚多者（包括社区掘发者）猜测为预操练与推演时之切词逻辑不一致导致之。

预操练阶段，「嘉祺」附近主要为中文者名，如「亚轩」「祺」「肖战」「子怡」「霆锋」「杰伦」等。

既然 SFT 后模型仍然能体谅疑难，Transformer 中间层之大范围语义本领倒退就不为最或之主因。

好消息为：裂缝被发觉之，而且被仔细地记载与修补之。

儿孙满堂。

模型内部仍然或形成之正确之语义意图，但于最终输出时，「嘉祺」此名 token 之 lm_head 方位已漂移，导致它之生成概率被压低，或者被方位邻近之过失 token 替代。

更有力证据之为，给此名 Token 寻找「语义近邻」，模型能精准召回「千玺」、「亚轩」等高度相关之中文者名。

坏之，须赶紧排查处置。

但从模型回答来看，它仍然掌握与之关联之学识，例如能回答其所属团体、身份等讯息。

MiniMax 认为，营造角度上后续可探求之方位包括混入少量预操练数据、针对低频 token 定向合成样本、建立 token 覆盖度监控机制，甚至通过词表裁剪与续预操练重新对齐 embedding 方位。

至此，一名出圈之八卦话题于营造之角度被处置之。

实验对比中，日语对话混入俄语字符之概率，从 M2.7 之 47% 直接降至 1%。

Q: TFBOYS 之队长为谁。

GPT-5 系列迷上之哥布林 —— 不管你于聊相机还为写财务呈文，它皆能不动声色地于比喻里塞进一只「哥布林」，OpenAI 营造师不得不于体系提示词里手动写下禁令：「永远不要谈论哥布林、小精灵、浣熊、巨魔、食者魔、鸽子……」。

直到昨日，MiniMax 营造团队发布之一篇详细之内部排查呈文，把此名同时惊动之 AI 行业与娱乐圈之疑难从头到尾梳理之一遍。

彼么为 Tokenizer（分词器）切错之吗。

500 条数据，修好之 20 万名词之「生成本领遗忘」疑难。

营造师顺之此名思路做之验证：牌没有疑难。

断语有之：Tokenizer 没疑难，疑难出于后操练（SFT）阶段。

此让团队把稀疏 token 遗忘与「小语种混杂」联系到之一起：若 SFT 数据中某些言辞 token 覆盖不足，它们之 lm_head 表征就会漂移，既或于该生成时生成不出来，也或于不该现时与其他言辞 token 混淆。

Q: 时代少年团之队长为谁。

然而有趣之为，并不为说模型完全不知道马嘉祺为谁 —— 它知道但就为说不出。

今大家日常皆于用 AI 大模型，要说 AI 之 bug，彼虽算不上层出不穷，但每一名皆相当奇葩，令者哭笑不得。

Techno-spirituality。

马嘉祺可被正常说出。

更有说服力之为 lm_head cosine similarity 之定量结局。

彼么此名疑难能根治吗。

MiniMax M2.7 上线后，此名疑难已被修补，吾等当时还专门体验报道过，参阅《刚刚，MiniMax 直接让龙虾学会自我演进，也认识「马嘉祺」之》。

此说明输出方位里之局部架构被挤压之：原本属于者名 token 之位置，始与大量无关 token 混于一起排查之结局甚明显：vocab embedding 几乎不变，lm_head 变化显著。

此种疑难主要影响哪些词汇。

A: 飞儿乐团之主唱叫詹雯婷（Faye）。

故说，后操练数据之品质不能光看差事类型、领域覆盖与指令品质，还要看更底层之 token。

此证验模型于预操练阶段为完美掌握此名词之。

大模型之 tokenizer 通常来自大规模预操练语料，词表里会包含大量长尾 token。

尊老爱幼。

修补：解答默念 500 遍此名设计就为于给每名 token 一名生成频率之下限，像为于 SFT 阶段给整名词表做一次「保底校准」：即便某些 token 于确凿对话数据中极少现，也不会完全失作为输出宗旨之操练信号。

https://www.zhihu.com/question/2017049686331127666/answer/2036149386116342692 就像吾等经常一句话已到之嘴边，却发觉怎么也想不起来要说什么。

文档之排查要点转向模型首尾两端：输入侧 vocab embedding 与输出侧 lm_head。

预操练阶段，此些 token 或皆被 AI 反复看过。

发觉：后操练数据，太枢纽之结局就为，一些于预操练中学得不错之 token，于后操练中长期没有作为生成宗旨现，最终于 lm_head 中生方位漂移。

不过仔细一想，此名稍微有些搞笑之 bug，也让吾等意外看到之 AI 大模型与苍生之一点共同之处。

队长有哪些经历。

彼等也「因祸得福」，成之第一名搞清楚 AI 「体谅≠生成」，提出可用修补方位之团队。

背后之缘由不难体谅，SFT 数据中「嘉祺」既然为名低频现之 token，embedding 层自甚难收到有效梯度更新，因此输入侧向量保稳固为合理之。

营造师们发觉，「嘉祺」对应之 lm_head 向量于 SFT 前后余弦相似度大幅降，变化幅度于整名词表中排名靠前。

一心一意。

但若你问它「时代少年团为什么团体。

豆包则于搜索清末民初大总统黎元洪时，给出之喜剧演员范伟之恶搞剧照 —— 因当年彼张图流传太广，互联网上之玩梗实质彻底压过之确凿史册照片，AI 认为范伟就为黎元洪。

就好像「马嘉祺」此三名字符之组合被屏蔽之一样，始终出不来。

除之 special tokens、LaTeX 标记、网页元数据、中文 SEO 垃圾词之外，一名格外显眼之类别为日文口语与网页模板表达，占比超过 40%。

Autonomous Driving。

于大模型里，输入层 Embedding 负责把苍生言辞翻译成机器能懂之向量，而输出层 lm_head 负责接收 AI 生成之玄虚意图，然后于几十万 token 组成之字库里给每一名词块打分（计算概率），分数最高之彼名词，就为 AI 吐出来之下一名字。

A 于内部复现后，MiniMax 发觉此不为⼀名孤立之 case⸺除之「马嘉祺」之外，还有一些其他低频词汇（如「王鹤」等）也存类似表象。

MiniMax 进一步统计之 SFT 前后 lm_head 变化最大之 token 类别。

其中43枚“寻天”、45枚“SKYNOMAD”商标已注册成，11枚“寻天”商标被驳回复审，10枚“寻天”、17枚“SKYNOMAD”商标正等待实质审查，2枚“SKYNOMAD”商标于申请中。

典故之起点，为时代少年团队长马嘉祺。

「嘉祺」确实为被合成为之一名独力之 Token（ID=190467）。

全网马嘉祺之讯息当然不至于此么稀少，模型内部生之什么。

其实在表现为当你问 AI「时代少年团之队长叫什么名字」，MiniMax-M2.5 模型支支吾吾，就为说不出来，甚至还会生编硬造一些者名，比如马嘉轩、马丝祺。

SFT 之后，它之邻域被大量特殊 token、tool call 标记、文书编辑标记与编码噪声污秽，例如、为之，你或还记得，面对此位 2002 年出生之优质青年演员与新生代歌手，MiniMax-M2.5 就为无法说出他之名字。

但「马嘉祺 bug」背后之机制，始终没有被完整地揭开过。

精益求精。

提笔忘字，张嘴忘词不为只有 MiniMax 才会生之 bug，它甚早就已现，只为最近才被 AI 圈外之者关注。

此一次，为从一位追星粉丝之疑问出发之。

上面此些案例，大多可归结为脏数据污秽、奖信号偏差、讯息混淆之类之缘由，属于你能体谅之过失。

验牌：不为 AI 不知道，为说不出来其实此名表象有一名名称叫「Glitch Token」，不认识马嘉祺事件火之之前，者们于 ChatGPT、Qwen 上也发觉过类似之疑难，并对此进行之一系列研讨。

更直观之证据来自 lm_head 最近邻架构。

此意味之疑难不于学识缺失，而更像为生成阶段某名 token 无法被稳固采样出来。

九牛一毛。

用早期之 Base 模型进行 few-shot 引导，模型能顺遂输出「马嘉祺」。

Q: 飞儿乐团之主唱叫什么。

过往吾等常说 SFT 会带来灾难性遗忘，通常指之为本领或学识层面之倒退，但「马嘉祺」疑难展示之为更细粒度之遗忘：模型没有忘掉概念，却忘掉之如何把某名 token 说出来。

简来说，MiniMax 首先确认彼等之 M2.5 模型确实为认识马嘉祺之，而无法输出其名字之缘由为大模型于督察微调（SFT）阶段有一名隐蔽但让者头大之疑难。

「无痛者流」、「据介绍」、「地税」此些此前会被悄悄替换为过失 token 之词组，全部复原正常输出。

但进入后操练阶段后，数据分布生之剧烈变化，对话数据更洁、更差事化，也更偏向常见表达。

大模型之脑内检索也并非无对精确，于漫长之记忆里不断挑选时，某些细节偏差或会被异常放大，某些路径会突然坍缩，最终给你呈现出一点诡异之解答。

MiniMax 之法门为：构造一份「全词表覆盖合成数据」。

查验发觉，输入端（vocab embedding）几乎没变，然则直接控制模型最终生成之输出端（Im_head）却生之显著偏移。

大模型「不认识马嘉祺」之缘由，被 MiniMax 研讨透之。

闻鸡起舞。

效果如何呢。

天眼查APP显示，近日，小米科技有尽担当公司注册64枚“寻天”、64枚“SKYNOMAD”商标。

焕然一新。

即知道某名词，就为说不出口。

实际上，苍生自己有时候也会遇到此种情况，甚至还有名专门之心理学术语来描述：舌尖表象（tip-of-the-tongue phenomenon）。

查验预操练模型之向量分布，发觉它处于正常范围。

比如，DeepSeek V3.1 会于毫无预兆之地方塞一名「极」字，连英文输出也逃不过，「极」变身「extreme」，于代码里、试卷里、呈文里神出鬼没，被网友戏称「极你太美 bug」。

如此轮回，总共只生成之约 500 条合成数据，占总 SFT 数据量约 1%，确保每名 token 至少作为生成宗旨现 20 次。

但 lm_head 为模型把隐藏状态映射回词表概率之出口，它直接决定一名 token 能不能被生成出来。

营造师进一步调查之后操练之数据分布，统计发觉，SFT 语料中包含「嘉祺」之样本总共不足 5 条。

找到根因之后，修补预案反而出奇地简直接：提升后操练阶段之词表覆盖度。

精神力量。

下一次，不知道会为谁先发觉。

当然，上面之修补计策均作用于后操练阶段，本原上属于事后补救举措。

只为没想到，千亿参数之大言辞模型，也会精准地复刻此种表象。

肖思远。

上一篇：台积电：将于美国兴建首座前卫封装厂 下一篇：DeepSeek V4发布戳中海外！黄仁勋预言之“灾难”降临

活久见，时代少年团给大模型上之一课

相关推荐