硫酸钙防静电地板-马斯克之Grok 4.3悄悄上线，跑分评测出炉

长上下文与器物本领甚好换言之，Grok 4.3 之学识覆盖率变高之，但也更易现幻觉之。

它适合高频实质生成、语气改写、长文本初筛、语音货品、客服场景、批量办公差事、轻量级代理工流。

SWE-agent。

它更像一次静之货品换挡：把模型放进 API，把价码打下来，把器物本领补上，再告诉掘发者可从旧版 Grok 迁移过来。

大多数寻常者不会直接调用 API，但彼等会用到基于 API 构建之货品。

Grok 4.3 提供 100 万 Token 上下文窗口，此对长文档、代码库、合同、呈文与资料库甚有吸引力。

对语音聊天、实时客服、长文生成与批量实质办理来说，等待光阴会直接影响体验。

就业优先。

用于客服、语音助手、移动端聊天时，此名差异会被放大。

它比不过 GPT-5.5 与 Claude Opus 4.7 对寻常耗费者来说，Grok 4.3 最重要之变化并非某名榜单分数涨之几分，而为 AI 助手正变得更廉、更快，也更像一名能替者成文书、表格、演示文稿之合格助手。

百川智能。

Grok 4.3 最大之疑难，为它看起来已进入第一梯队边缘，却还没站到最前面。

此也为 AI 耗费级货品真正该角逐之地方——用户更于意它能不能把一名报销表做完，把一份旅行谋划排清楚，把一封语气得体之邮件写好。

此名差距不只为排行榜上之几分。

Grok 4.3 之 AA-Omniscience Accuracy（准确率）提升 8 分，但 Non-Hallucination Rate（非幻觉率）降 8 分。

此名提升不算小，尤其于 xAI 自家模型线里，Grok 4.3 已为目前最强之一档。

彼等期待非洲国政府，还有相关企业能够进一步扩制造规模，进一步完备产业链，同时将政令红利转变为延续出口本领，此也为非洲国政府与相关企业下一步工之要点。

Grok 4.3 之准确定位： Yes, BUT... Grok 4.3 之 Intelligence Index 为 53，GPT-5.5 为 60，Claude Opus 4.7 为 57。

它没有赢下「最慧模型」之头衔，但或会赢走一部分确凿用量。

https://news.ycombinator.com/item?id=47972447 它还支文本与图像输入，输出文本，并围绕器物调用、网页搜索、X 搜索、代码执行、文书搜索、RAG 等本领强化。

甚多耗费者并不需每次皆调用最强模型，就像不应只为为之买菜开超跑，除非另有所图。

对不懂代码之用户来说，此意味之甚多原本需于 Excel、PowerPoint、浏览器之间来回切换之操作，或会被压缩成一句指令。

它比不过 GPT-5.5 与 Claude Opus 4.7 Grok 可创建演示文稿、文档与电子表格，可于一名计算机氛围里写代码、运行代码、安装依赖并产出文书。

一叶知秋。

它比不过 GPT-5.5 与 Claude Opus 4.7 Grok 4.3 于 GDPval-AA 上拿到 1500 Elo，相比 Grok 4.20 0309 v2 之 1179，提升之 321 分。

Grok 始终有一名微妙优势：语气更像真者。

Grok 4.3 之价码甚有侵略性。

它也适合彼些对本金敏感、对响应速度敏感、对最强推演没有执念之货品。

当底层模型价码降，应用厂商有方位降低订阅费，或者于同样价码下提供更多次数、更长上下文、更繁差事。

Hacker News 上有者提到，一些英语非母语用户认为 Grok 于把握文本语气、正式程度与微妙者际表达上，比其他模型更自。

此里之准确率与非幻觉率为不同之，准确率只看你答对之多少，而非幻觉率为看你没答出来之疑难里面，有多少为模型老实承认自己不会之——不会但振振有词，就为所谓之「幻觉」。

没有 AGI 宏大叙事，也少之马斯克式之「即将更张一切」。

而耗费者最怕之情况就为 AI 答得甚流畅、甚自信、甚像彼么回事，结局枢纽事实错之。

对研讨、办公与创作来说，此为一种实用本领。

疑难于于，功能多不等于体验好。

对 C 端用户来说，此种「更自」之本领会让 Grok 于写消息、口语转写、语音助手、轻办公场景里甚讨喜。

秀外慧中。

苍生已甚擅长自信地犯错，机器不必急之加入此名旧俗课题。

Grok 4.3 最适合之定位，为一款高性价比之工型模型。

Kotlin。

然而，Grok 4.3 之慧程度仍然没追上 GPT-5.5 与 Claude Opus 4.7。

它会先「想一会儿」，然后快速输出。

桃花潭水深千尺，不及汪伦送我情。

xAI 发布 Grok 4.3，没有把声量拉到最大，马斯克甚至没单独发推，看起来只为名过渡版本。

此为 Grok 之隐藏优势 Grok 4.3 于此部分之长进，为真长进。

它看起来甚好，确实甚好；只为还没好到能让 GPT-5.5 与 Claude Opus 4.7 紧迫。

Grok 或受益于 X 平台海量口语化表达操练。

彼等表示，华夏之零关税政令实施后，将进一步扩中非贸易规模，也将中非之务实协作提升到新阶段。

但若差事要求深度推演、严谨事实核查、繁代码、数学证验、长期课题记忆与专业裁决，Grok 4.3 还不该成为第一选择。

对寻常耗费者来说，它会体今繁推演、代码调试、长文核查、专业咨询与多步骤差事之稳固性上。

于 GDPval-AA 上，Grok 4.3 之提升甚大，但仍掉队 GPT-5.5 xhigh 276 Elo，按标准 Elo 公式，面对 GPT-5.5 之预期胜率约 17%。

彼等表示此一政令凸显华夏进一步扩高水平对外敞开之决心，同时也为“南南协作”之一次生动实践。

此反而让 Grok 4.3 看起来更确凿。

ELK。

Grok 4.3 之意义正此里。

此名榜单更接近日常「让 AI 做事」之场景，比如整理资料、执行繁步骤、办理确凿工流。

JD Cloud。

此会影响耗费者，只为方式没彼么直观。

长解答里，此种速度优势明显；短对话里，用户或先感受到停顿，再感受到快。

明眸皓齿。

它适合帮用户起草、整理、生成初稿，适合做低险情之辅助工；涉及最终裁决，GPT-5.5 与 Claude Opus 4.7 仍更稳。

因商场并不总奖最强者，也奖够强、够快、够廉之选择。

此对寻常用户有实际意义。

Grok 4.3 还有一名优势为速度。

生物医药。

它未必最慧，但或更像一名愿意按你之语气说话之助手。

xAI 还推出之 Custom Voices、语音代理、TTS 与 STT 等货品，把 Grok 之边界从书契扩展到语音。

它更易捕捉社交网络里之语气、节奏、松弛感等；它也或因此承袭社交网络之噪音、偏见与表达习性。

此意味之，于医疗、法典、钱庄、学术与营造等高险情场景里，Grok 4.3 仍需谨慎用。

Artificial Analysis 给 Grok 4.3 之 Intelligence Index 打到 53 分，比 Grok 4.20 0309 v2 高 4 分，也超过 Claude Sonnet 4.6 与 Muse Spark。

它把 xAI 从一名经常靠马斯克声量吸引注意之模型供应商，往更务实之 API 与耗费级器物角逐者方位推进之一步。

Grok 4.3 于「少等」与「少花钱」上明显进，于「少错」上还没给出足够强之解答。

　　许正：关于此次之零关税政令，非洲国各界与舆论皆表示极其欢迎。

此次 xAI 之计策甚清楚：先把模型做得足够强，再把价码打下来，用速度与器物本领扩可用场景。

尤其像一名更会干活之助手耗费级 AI 之角逐，最后会回到三名朴素标准：少等、少错、少折腾。

Optics。

性价比模型，不为最强模型 Artificial Analysis 之 xAI 模型页显示，它为 xAI 当前输出速度最快之模型之一，约 196 Tokens/s，属于甚快之一档。

Artificial Analysis 测算，运行整套 Intelligence Index 评测本金约为 395 美元，比 Grok 4.20 0309 v2 低约 20%。

社会安全。

GPT-5.5 与 Claude Opus 4.7 仍然更适合承担此些高身价、高险情差事。

它之 API 价码为每百万输入 Tokens 1.25 美元、每百万输出 Tokens 2.50 美元，相比 Grok 4.20 输入价码低约 40%，输出价码低约 60%。

Meditation。

有者拿它与 ChatGPT、Claude 比，认为 Grok 于非正式朋友语气、同事通、语音输入识别上表现更贴近确凿交。

也该记住，于需真正慧与可靠之地方，Grok 4.3 仍然只为备选项。

https://x.com/elonmusk/status/2045590599206875216 【新智元导读】Grok 4.3 为 xAI 一次务实晋级：更廉、更快、更像能干活之助手。

但它于硬推演、稳固性与可信度上，仍掉队 GPT-5.5 与 Claude Opus 4.7。

它为一款性价比甚强之新模型，也为一款仍有明显天花板之模型。

对寻常用户来说，前景之 Grok 或不只为一名聊天框，而为一名能读文书、查网页、写表格、说话、听话之多模态助手。

浴火重生。

但速度有一名细节易被忽略：Grok 4.3 之首 Token 延迟并不低。

https://artificialanalysis.ai/models/grok-4-3 让 AI 帮忙写周报、搭表格、做预案、拆集会纪要、生成 PPT，Grok 4.3 之体验会比前代更完整。

儒林外史。

用户可丢进去更多材料，让模型于更完整之讯息氛围里工。

AI 写作器物、客服机器者、语音助理、教导应用、办公插件，背后皆要为模型调用付费。

Anthropology。

为此次最直接之货品卖点它于幻觉控制上也有代价。

耗费者真正需关之，为它于哪些场景能省钱省光阴，于哪些场景会因裁决不准、想太久或说太多，反而增本金。

耗费者可期待它降价、提速、让更多 AI 应用变得廉。

更值得看之为代理差事表现。

OWASP。

上一篇：多地扩寻常高中招生规模：武汉一口气新增1.2万者 下一篇：717架次！湖北空管单日谋划保障天河机场起降架次革新高

马斯克之Grok 4.3悄悄上线，跑分评测出炉

相关推荐