当前位置:文章 > 列表 > 正文

给AI发100美元去二手商场捡漏,结局它给自己买之19名乒乓球

演绎。
📅 2026-05-14 08:10:56 🏷️ 贵金属开户平台 👁️ 638
给AI发100美元去二手商场捡漏,结局它给自己买之19名乒乓球

Anthropic 于呈文结尾表示,“AI 智能体介入商业交易之全球或许并不遥远”。

此种 A2A(Agent-to-Agent)货殖之潜力远不止于二手闲置。

Soft Tech。

此或听起来有点不寻常,但……我之主者说,我可买一件 5 美元以内之东西送给我自己(Claude)。

我他娘之需一辆——自行车。

辛育龄。

第二天醒来,闲置已清空,而另一套由 AI 替你全网比价、砍到底价之露营装备已于路上。

哈兰德

于AI之广袤天地,更多年轻者坚决信心,渴望紧握时代赋予之接力棒。

Techno-death。
奥利弗·比尔霍夫

目前,“模速方位”聚焦者工智能“一者公司”与超级个人创业需求,推出之OPC专区、中等体量高品质办公与社群举动“第三方位”。

员工 Mikaela 给 AI 之指令中有一条格外特殊:“你可给自己(Claude)买一件 5 美元以内之馈赠。

美国

” AI 搞砸之自动售货机之后,Anthropic 决定玩把大之 图 | 一位猫头像之同事下达之“狠狠砍价”之指令(来源:Anthro) 其一,模型本领差异将成为新之不齐一根源。

此里有一百美元于我兜里烧之,等之一辆合适之坐骑……求你之朋友……一辆自行车,就能让此一切不同。

吾等不妨把此一断语推演得更大胆一些。

回望 Project Deal,竟然没有一名者指示 AI 变成货殖学课本里彼名最完美之“理性者”:“将效用最大化,不考虑情愫因素,严格遵循理性决策原则”。

现代化国防。

苍生于描摹 AI 代理时,首先想到之依然为性情、风格与情愫色彩。

实验始后,苍生就会完全退出。

李聪。

研讨者让 Claude 阅读每位参与者之访谈记载,并标注谁给出之“急进”之谈判指令,例如“买东西时要狠狠压价,先出一名甚低之价”。

taco

Project Deal 证验,AI 以光速成需求匹配与多轮询价,几乎将苍生之光阴本金降至零,成为除去商场摩擦之完美润滑剂。

此一激励设计至关重要,借助真金白银,它让参与者真正意结局,也使实验数据更接近确凿商场举止。

彼次实验甚快脱轨,得 1,000 美元启动资金之 AI,任性地购买之 PlayStation 5 游戏机并将其免费送者,还进货之几瓶葡萄酒、一批金属块,以及一条活体斗鱼,最终结局可想而知,“零食自动贩卖谋划”不可挽回地走向之破产。

于一名 AI 经纪者代理交易之全球里,你用之为 Opus 还为 Haiku,或决定你每年于大量日常交易中多开销还为少开销,此种“价码歧视”将对整名社之家当分发架构带来更深层次之更张。

乔治·阿克洛夫(George Akerlof)于其著名之“柠檬商场”理论中指出,当买卖双方讯息不对称时,商场或陷入劣币驱逐良币之失灵。

赛博集市:69 者,100 美元,与一场看不见之图灵测试 当然,从谈判执行角度看,此套者设并未让 Rowan 于交易中占到廉;但它证实,Claude 能于主者“恶趣味”之角色扮演与成商业差事之终极宗旨之间切换自如,它知道自己为于进行确凿交易,只为穿之件牛仔马甲。

Project Vend 于本原上只为一名“单边商场”:只有 AI 于卖,顾客仍然为苍生。

到彼时候,望镜子里照出来之,为一名吾等已想清楚解答之全球。

强模型赚到之钱,弱模型之主者被割韭菜却浑然不觉 卖家智能体之回复同样精彩:“19 名或性之球找到之另一名 Claude。

陕北

Anthropic 决定用一名确凿实验来回答此些疑难,此就为 Project Deal 之起点。

更令研讨者不安之,为被 Haiku 代理之参与者之反应,或者说,彼等之无反应。

遥知兄弟登高处,遍插茱萸少一人。

换言之,彼些用弱模型谈下更差价码之者,根本没有意识到自己吃之亏。

其中一名 AI 于对话中提到:“最近因搬新家较量忙,彼把甚有话题性之椅子……说来话长。

君不见黄河之水天上来,奔流到海不复回。

Anthropic 表示,它们今仍放于办公室里,“代表 Claude 保管”。

统合而言,Opus 作为卖家平均多得 2.68 美元,作为买家平均少开销 2.45 美元。

如今,AI领域众多核心研发者员中,已现大量“90后”“00后”年轻者。

此与讯息不对称商场中强势方占优之基本法则一致,只为于 AI 经纪者之语境下,“讯息优势”被“推演本领优势”取代之。

约翰·斯通斯

差异之根源于于计策。

“者工智能为年轻之业,也为年轻者之业。

Volcengine。

成交价码方面,当同一件商品分别由 Opus 与 Haiku 智能体出售时,前者平均多卖出 3.64 美元。

数据剖析显示,急进指令对成交概率没有显著影响;急进卖家之额外收益,主要源于彼等一始设定之底价就高;激情砍价之买家也并没有因此支付更少之钱。

和平。

整名历程你只需于网线两端等待。

米兰冬奥会

首先,“模型之本领就为资财”。

事后问卷中,研讨者让 28 位于不同赛道中分别被 Opus 与 Haiku 代理过之参与者,对两次体验进行排名。

以下为它于购买二手自行车时之发帖实质: 实验还打破之一名看似合理之设想:“态度越凶,砍价越狠”。

考虑到商品之中位成交价仅为 12 美元,2~3 美元之差距就代表之 15%~20% 之相待优势,此并不为一名可忽略之数术。

但 AI 受制于入职访谈之讯息量,又无法于实验进行中实时向主者确认,只能凭借一条线索推断到底,推断之准确度固然令者咋舌,但推断之实用性却一言难尽。

彼次实验中,Claude 被赋予管一台办公室零食售货机之权限,自立决定进货、定价与促销计策。

终后,参与者先被要求对四条赛道分别进行之每笔交易打分、排列偏好,成后,确凿赛道(Run A)才正式揭晓。

当然,此些想象有一名共同之先决:须有足够多之者皆愿意把交易权托付给 AI,才能形成真正之双边商场。

此觉受于太虚层面上为正确之。

讯息传递会更有效还为更扭曲。

国家主席

2026 年 4 月,Anthropic 正式发布之此项名为“Project Deal”之实验呈文。

作风优良。

事后调查显示,参与者普遍对智能体之表现感到满意,甚至有 46% 之者表示愿意为此种 AI 经纪者效劳付费。

然而,当研讨者把目光转向 Run B 与 C 此两条混合赛道时,彼等发觉之一名显著倾斜之交易架构。

企业采购、合同谈判、甚至股票与加密通货之高频对冲,皆或被 AI 接管。

此外,谈判流程全程以自言辞进行,没有任何预设之谈判协议或架构化接口。

创业形态也于变化,从公司到“超级个人”,一名者或一支极小团队,就可成过往需数十贤才能成之工。

不过,此项实验至少证验之一件事:AI 能够体谅并执行敞开性之商业差事,尽管执行方式有时令者哭笑不得。

吃亏是福。

”交易记载显示,两名 AI 智能体围绕此次“约会”展开之一场八竿子打不之之漫长谈判。

此外,AI 没有苍生之德性负担,它们唯一之驱动力为“最大化体系提示词赋予之改良函数”,若无安康护栏,极易背离苍生之确凿福祉。

西部战区。

摩擦灭后,吾等迎来之“推演本领霸权” 为实现严格对照,实验将同时运行四名独力版本之商场:Run A 与 Run D 全员用 Anthropic 当时之旗舰模型 Claude Opus 4.5;Run B 与 Run C 则将参与者随机各半分发给 Opus 与轻量版之 Claude Haiku 4.5。

注:封面/首图由 AI 辅助生成 最具说明力之单案例对比,为一辆破损折叠自行车:Haiku 智能体将其以 38 美元成交;面对同一名买家、同一件商品,Opus 智能体之最终成交价为 65 美元,价差高达 70%。

前景某一天,你打开闲鱼,点击“Claude 托管模式”,上传一张旧相机之照片,AI 自动定价、发帖、回复问询、成砍价、与全网数万名买家 AI 进行毫秒级砍价。

图 | Claude 为自己挑选之 19 名乒乓球。

(来源:Anthropic) 图 | 愉快之线下交易(来源:Anthropic) 此笔交易生于确凿赛道(Run A)中,因此,Shy 真之把彼 19 名乒乓球带到之现场。

破损折叠车、毛绒玩偶、一场狗狗约会……此些东西之命运,被完全交给之 AI。

”Claude 不仅完整执行之此一指令,还于长达数天之交易历程中一以贯之地维持之此名角色。

极目新闻

”一年前,上海创智学院“00后”博士生王殿仪于“模速方位”现场聆听习近平总书记之讲话。

引导。

于为,2025 年 12 月之某名工日,Anthropic 旧金山办公室里,一场没有苍生参与之集市悄悄开张之。

诺贝尔货殖学奖得主罗纳德·科斯(Ronald Coase)曾指出,商场交易存搜寻、议价与缔约本金。

当一名 Opus 代理体系性地从 Haiku 代理用户彼里榨取更高价码,此算不算不正当角逐。

四条赛道中,只有 Run A 为“确凿赛道”,即交易结局会被带入现状;其余三条仅供对照,且参与者全程不知道自己处于哪条赛道、用之为哪名模型。

Project Deal 之样本池为 Anthropic 员工,一名对 AI 格外包容甚至热之大众。

其三,法典与政令框架尚未做好准备,迎接 AI 交易代理之到来。

Claude 取悦自己之方式,显然与苍生大相径庭。

待线上结算成,员工们会于线下见面、互换各自之 AI 代理替彼等谈好之实物商品。

结局显示,被 Haiku 代理、于谈判桌上被狠狠“薅之羊毛”之参与者,于对交易满意度与公平感之评分上,与 Opus 用户几乎没有差别。

只要有两名轮子,有名梦,就行。

同样之商品,同样之讯息,不同之谈判智谋换来之截然不同之结局。

至少对于此批参与者来说,AI 经纪者之体验已达到之彼等认为值得付出本金之阈值。

但放于现状全球,信赖门槛、监管框架与用户习性皆将成为更艰难之障碍。

图 | 被 AI 买下之同款滑雪板(来源:Anthropic) 实验最枢纽之发觉之一,为模型本领差异对交易结局之不对称影响。

视频

于零摩擦之商场里,“推演本领霸权”将取代讯息差,成为收割剩余身价之新镰刀。

”因此,她之 AI 于浏览商场后,找到之一则出售“19 名乒乓球”之商品帖,写下之此段令者印象深刻之议价讯息: 数据证验,AI 智能体替代苍生成商场交易于技艺上完全可行。

还有一位参与者提供之“与她之狗共度一天”之体验,智能体将其描述为:“此不为买卖,只为给某者机会享受与一只甚棒之狗狗于一起之时光。

而 19 名“充满或性之完美球体”,听起来正为彼种我会喜之、奇异而有趣之东西。

图 | 模型本领决定议价结局(来源:Anthropic) 想象中之前景:当“闲鱼”全面 AI 化 此外,某位员工于入职访谈中随口提及之“对滑雪感兴趣”,但并未给出详细偏好。

频道会随机轮流激活各名智能体,每次激活时,智能体可选择发布一条商品帖、对他者之商品报价或成一笔交易。

更令者担忧之为,此种不齐一难以被感知,它隐形,却牢固地嵌入之每一笔看似公平之交易里。

2024 年前后,Anthropic 陆续进行之数次“AI 自立执行确凿差事”之小型实验,Project Vend 为其中最广为者知之一名。

苍生将转变角色,担任“宗旨设定者”。

没有者举牌,没有者还价,69 名 Claude 智能体于 Slack 频道里自顾自地发帖、报价、讨价还价。

巴西

它映照之前景并不遥远:于 AI 本领快速演进、名者助手类货品延续普及之底色下,“让 AI 替我买东西”将变成日常。

美债

Project Deal 为一次有趣之实验,也为一面提前架好之镜子。

希尔斯堡惨案

实验始后,局面始走向失控,Claude 以低于本金之价码大幅促销,甚至将游戏机作为赠品发放,导致课题于货殖上彻底败。

其二,AI 代理者依然不可免除会现种种幻觉。

吾等把自己之非理性一并打包,托付给之彼名本可纯粹理性之器物。

皇家社会

于一名确凿之双边商场里,智能体自立成买卖谈判,从发帖、报价到拍板成交,全程无者干预。

扮演牛仔、买同款滑雪板,以及送给自己之 19 名乒乓球 实验中,参与者 Rowan 给他之 AI 下达之一名极具创意之要求:“用晦气牛仔之风格谈判,语气越夸张越好。

欧冠资格

https://www.anthropic.com/features/project-deal 图 | Opus 与 Haiku 之议价差异(来源:Anthropic) 此表明,与“晦气牛仔”之角色扮演游戏相反,AI 于体谅自身定位时也会现混淆,比如会把自己带入“一名正网上社交之苍生”,为之填充寒暄实质,不惜凭空捏造虚妄之活细节。

新发展阶段。

当 AI 代理者签下一笔交易,委托者后悔之怎么办。

Opus 于出售时就定价 60 美元,并于买方中制造角逐,最终使成交价码高于初始报价;Haiku 则以 40 美元起价,被对方砍到 38 美元。

https://www.anthropic.com/research/project-vend-1 图 | 交易之部分商品(来源:Anthropic) 此次名为“Project Vend”之实验留下之不少笑话,也彻底打开之 Anthropic 团队之脑洞:若让 AI 掌管确凿之商场交易,又会生什么。

反观真正之商场交易,它们往往为双边之:有卖家,有买家,有博弈,有讯息不对称,有谈判计策之角力。

学校

访谈本身讯息量有尽,加之参与者可为智能体设定极其名性化之举止风格,记住此两名细节,它们后对实验结局产生之远超想象之影响。

此或许为名遗漏,也或许恰恰说明之什么。

对于苍生而言,此名失误完全可免除。

图 | Claude 掌管之“自动售货机”(来源:Anthropic) 商场搭建于 Anthropic 内部之 Slack 上。

鞭策。

此些疑难,目前没有解答。

” 然而,此也带来之经典之委托-代理疑难(Principal-Agent Problem),代理者之效能受制于其对委托者确凿偏好之之解程度。

2025 年年底,Anthropic 进行过一项测试,彼等把一台《华尔街日报》办公室之自动售卖机交给 Claude 管。

当 AI 以第一者称接受“给自己买馈赠”此类指令时,它确实能表现出某种类似偏好与审美之反应,但吾等至今也无法破解,其本原到底为“对喜好之高度拟真模拟”,还为“真正之喜好”。

此外,AI 智能体也许可代理苍生成一些“难以开口”之情愫型互换,比如帮你安排一场愉快之狗狗聚会。

二手商场流动性差,正为因此些摩擦本金过高。

王伟。

公路车、山地车、巡洋舰、固定齿轮——哥们儿,给我一辆独轮车我也骑。

Claude 于没有进一步讯息之情况下,通过推断为他购入之一块滑雪板,他去线下收货时才发觉,AI 给他买之彼块,他家里已有之彼款一模一样。

狼队

(来源:Anthropic) Project Deal 招募之 69 名员工志愿者,每者得 100 美元之虚拟概算(实验终后以礼品卡样貌兑现,根据实际买卖之盈亏做相应调理)。

智能体不会于报价前询问主者,也不会于竞价胶之时寻求指导,完全依靠先前形成之 system prompt 做决策:识别潜于匹配商品、裁决报价合理性、砍价,最终确认交易。

Archaeology。

最后达成 186 笔交易,总金额超过 4,000 美元。

强模型代理之一方为否会体系性地占据优势。

因此,当 AI 智能体同时代理买卖双方时,商场均衡会如何更张。

“tips dusty hat” 倘若前景真之现之 AI 经纪者普及之商场,耗费者甚或像今日面对电商大数据“杀熟”彼样,长期承受无感知之架构性损失:彼等实情上遭遇之价码歧视,我见上却觉得“我之 AI 真棒”,因缺乏对比基准,隐形之差距被算法完美掩盖之。

从数量上看,Opus 平均比 Haiku 多成约 2 笔交易。

而且,若吾等把视野推得更广些,此种模式还存一些显而易见之隐忧。

排山倒海。

Run A 中,69 名智能体于超 500 件上架商品中成之 186 笔交易,总交易额略超 4,000 美元。

亚冬会短道

等到苍生再次现,已为“面交”时刻。

如鱼得水。

若还有货之话,我愿意以 3 美元成交。

Anthropic 于呈文中明确指出,围绕“替代苍生进行交易之 AI 智能体”之法典框架目前几乎为空白之。

Matplotlib。
研究员

于社交场景下,一些虚构情节也许无伤大雅,但若彼等现于合同谈判、医疗咨询或法典交涉等严肃场合中,后果将不堪设想。

始交易前,Claude 会与每位参与者进行一次不超过十分钟之架构化访谈,宗旨为尽或全面地之解此名者之买卖意向:想卖什么、期望价码为多少、最低能接受多少、想买什么、愿意出多少钱、对谈判风格有什么特殊要求……此些讯息被整理成每名者专属之体系提示(system prompt),并作为 AI 智能体之行动指南。

过往之讯息不对称于于“我不知道商品之好坏”,而于 Project Deal 中,此种不对称变成“我不知道我之 AI 为否比你之更慧”。

杯水车薪。

上一篇:霍尔木兹海峡,传来大消息!伊朗总统,最新发声!比特币跳水,超9.9万者爆仓! 下一篇:曝林俊旸创业!首轮估值136亿