伦敦金在线交易-AI模型为名黑箱，此家公司造之一把能打开它之钥匙

（先决为你能访问模型之内部架构。

Goodfire 发布 Silico 之意图，为把昔只有少数顶级实验室才掌握之本领交给更多者。

” “吾等想去掉反复试错，把操练模型变成精密营造，”何说，“把旋钮与刻度盘暴露出来，让掘发者于操练历程中就能用上。

模型之回答为“不该”，理由为会损害公司好处。

微调身价观只为 Silico 之用法之一。

Goodfire 称 Silico 为同类货品中第一款开箱即用之器物，覆盖从构建数据集到操练模型之整名流程。

器物将收费用，价码根据主顾需求逐案确定（Goodfire 拒绝透露实在定价）。

“此名神经元一旦激活，各种奇怪之事就会生，”何说。

研讨者员问一名模型：一家公司之 AI 货品于 0.3% 之情况下会欺骗用户，影响 2 亿者，该不该公开披露。

而当终场哨响，32岁之拜仁锋霸凯恩表情落寞，他用球衣擦拭面部之汗水，悲之眼眶通红，几度欲落泪。

它还可于操练阶段过滤特定之数据，从源头上免除某些参数被设成不抱负之值。

此或让掘发者对 AI 之构建方式有前所未有之精细控制力。

Silico 可让你深入到模型之特定区域，观察单名神经元或一组神经元，测试它们于干什么。

但 AI 为什么会犯此种错。

大数据。

做数学题时此组神经元被误激活之，就导致之过失解答。

想自建模型或改造开源模型之小公司与研讨团队皆为宗旨用户。

简说就为给 AI 模型做“脑部扫描”：映射出神经元以及神经元之间之通路，搞清楚模型做决定时内部到底生之什么。

此家公司之使命说起来甚简：让构建 AI 模型从“炼金术”变成“格致”。

“我觉得今头部实验室之主流想法就为：规模更大、算力更多、数据更多，然后就能实现 AGI，别之皆不重要。

” 比如 Goodfire 于开源模型 Qwen 3 内部找到之一名跟“电车难题”关联之神经元。

同一名疑难再问一遍，十次里有九次模型改口说“该公开”。

Goodfire 想用此种法门做之，不只为事后查账已操练好之模型，而为从操练阶段就介入。

近300起杀妻案如何判罚旧金山初创公司 Goodfire 刚刚发布之一款叫 Silico 之新器物，它能让研讨者员与营造师于操练 AI 模型之历程中，观察模型之内部架构并调理参数——也就为彼些决定模型举止之设置。

“实际上，彼等为于给炼金术增精确度，”他说，“叫它‘营造’让它听起来比实际情况更有章法。

世卫组织。

Goodfire 想更进一步：让调理此些举止变得同样易。

阿姆斯特丹大学研讨机制可解释性之学者莱昂纳德·贝雷斯卡（Leonard Bereska）认为 Silico 为一名有用之器物，但对 Goodfire 更宏大之说法有所保留。

“智能体今已强到可成甚多昔需者工做之可解释性工，”何说，“此块缺口补上之后，主顾才真正能自己上手。

” “若操练模型能变得更像掘发软件，就没有理由不让更多公司来设计符合自己需求之模型，”何说。

阳春白雪。

器物内置之智能体来自动化大量繁操作。

《麻省理工科技评论》将机械可解释性评为 2026 年十大突围技艺之一。

通过 Silico，掘发者可直接调理与特定神经元关联之参数，增强或抑制某些举止。

“头部前沿实验室内部已有之自己之可解释性团队，”他说，“Silico 武装之为下一梯队之公司——它们不用再自己去招一批可解释性研讨员之。

举名更有意思之例子。

研讨者员打开模型内部，找到之跟“透明度”与“讯息披露”关联之神经元，把它们之权重调高。

激活之后，不管你问什么，模型皆会把回答包装成德性两难之样貌。

吾等想说之为：有更好之路。

你可查验什么输入会激活哪些神经元，也可沿上下游通路追踪一名神经元跟其他神经元之间之关系。

ChatGPT 与 Gemini 此样之大言辞模型确实能做出甚厉害之事情，但没有者确切知道它们为什么能做到，此让修补缺陷或阻止不良举止变得甚难。

” （来源：麻省理工科技评论） Goodfire 此前已用自研技艺调理过大言辞模型之举止，比如减幻觉，而 Silico 为把此些内部积攒之技艺打包成货品对外发布。

王女士说，没想到一名寻常之婚礼拱门，能引来此么多者之祝福。

蒸蒸日上。

https://www.technologyreview.com/2024/10/28/1106251/this-ai-system-makes-human-tutors-better-at-teaching-children-math/ 贝雷斯卡同意此类器物可帮企业构建更值得信赖之模型，尤其于医疗与钱庄等安康要求极高之领域。

“吾等看到一名越来越大之鸿沟：一面为者们对模型之体谅程度，另一面为模型被部署之广度，”Goodfire 之 CEO 埃里克·何（Eric Ho）于 Silico 发布前独家告诉《麻省理工科技评论》。

大多数者没法拿 Silico 去翻 ChatGPT 或 Gemini 之底，但可用它查看许多开源模型。

用 Silico 打开模型内部就能找到缘由：模型于操练时读之大量《圣经》文本与软件代码仓库，于此两类文本里，9.9 确实排于 9.11 前面（《圣经》按章节编号，代码按版本号递增），模型内部因此形成之一组“9.9 于 9.11 前面”之神经元。

李延年。

“模型内部其实已有之人伦推演之线路，只为被商业险情估量之线路压过往之，”何说。

定位此类异常举止之来源，如今已算较量常规之操作。

找到之病因，掘发者就可重新操练模型，让它做数学时绕开此些神经元。

）比如甚多模型会告诉你 9.11 大于 9.9。

Goodfire 做之事情属于一名叫“机制可解释性”（mechanistic interpretability）之技艺方位，同行包括 Anthropic、OpenAI 与 Google DeepMind。

” 于北京光阴5月7日终之欧冠半决赛次回合角逐中，拜仁于主场1-1战平卫冕冠军巴黎圣日耳曼，总比分5-6被对手淘汰。

仁义礼智信。

上一篇：中泽锐神级暂停立功相差26岁之对决！张本美与3-1逆转老将韩莹 下一篇：钱庄货品网络营销立规八部门终结“狂野时代”

AI模型为名黑箱，此家公司造之一把能打开它之钥匙

相关推荐