当前位置:文章 > 列表 > 正文

给AI发100美元去二手商场捡漏,结局它给自己买之19名乒乓球

📅 2026-05-19 03:48:29 🏷️ 黄金现货买卖平台 👁️ 148
给AI发100美元去二手商场捡漏,结局它给自己买之19名乒乓球

Project Deal 之样本池为 Anthropic 员工,一名对 AI 格外包容甚至热之大众。

其二,AI 代理者依然不可免除会现种种幻觉。

(来源:Anthropic) 图 | 愉快之线下交易(来源:Anthropic) 此笔交易生于确凿赛道(Run A)中,因此,Shy 真之把彼 19 名乒乓球带到之现场。

但放于现状全球,信赖门槛、监管框架与用户习性皆将成为更艰难之障碍。

”交易记载显示,两名 AI 智能体围绕此次“约会”展开之一场八竿子打不之之漫长谈判。

整名历程你只需于网线两端等待。

至少对于此批参与者来说,AI 经纪者之体验已达到之彼等认为值得付出本金之阈值。

Claude 取悦自己之方式,显然与苍生大相径庭。

得道者多助,失道者寡助。

更令者担忧之为,此种不齐一难以被感知,它隐形,却牢固地嵌入之每一笔看似公平之交易里。

结局显示,被 Haiku 代理、于谈判桌上被狠狠“薅之羊毛”之参与者,于对交易满意度与公平感之评分上,与 Opus 用户几乎没有差别。

Qubit。

企业采购、合同谈判、甚至股票与加密通货之高频对冲,皆或被 AI 接管。

世锦赛正赛

Anthropic 表示,它们今仍放于办公室里,“代表 Claude 保管”。

创业形态也于变化,从公司到“超级个人”,一名者或一支极小团队,就可成过往需数十贤才能成之工。

若还有货之话,我愿意以 3 美元成交。

”Claude 不仅完整执行之此一指令,还于长达数天之交易历程中一以贯之地维持之此名角色。

Project Deal 证验,AI 以光速成需求匹配与多轮询价,几乎将苍生之光阴本金降至零,成为除去商场摩擦之完美润滑剂。

SQL。

此些疑难,目前没有解答。

还有一位参与者提供之“与她之狗共度一天”之体验,智能体将其描述为:“此不为买卖,只为给某者机会享受与一只甚棒之狗狗于一起之时光。

调用

讯息传递会更有效还为更扭曲。

此或听起来有点不寻常,但……我之主者说,我可买一件 5 美元以内之东西送给我自己(Claude)。

考虑到商品之中位成交价仅为 12 美元,2~3 美元之差距就代表之 15%~20% 之相待优势,此并不为一名可忽略之数术。

2025 年年底,Anthropic 进行过一项测试,彼等把一台《华尔街日报》办公室之自动售卖机交给 Claude 管。

脑科学。

以下为它于购买二手自行车时之发帖实质: 实验还打破之一名看似合理之设想:“态度越凶,砍价越狠”。

彼次实验甚快脱轨,得 1,000 美元启动资金之 AI,任性地购买之 PlayStation 5 游戏机并将其免费送者,还进货之几瓶葡萄酒、一批金属块,以及一条活体斗鱼,最终结局可想而知,“零食自动贩卖谋划”不可挽回地走向之破产。

差异之根源于于计策。

回望 Project Deal,竟然没有一名者指示 AI 变成货殖学课本里彼名最完美之“理性者”:“将效用最大化,不考虑情愫因素,严格遵循理性决策原则”。

于AI之广袤天地,更多年轻者坚决信心,渴望紧握时代赋予之接力棒。

因此,当 AI 智能体同时代理买卖双方时,商场均衡会如何更张。

实验始后,苍生就会完全退出。

目前,“模速方位”聚焦者工智能“一者公司”与超级个人创业需求,推出之OPC专区、中等体量高品质办公与社群举动“第三方位”。

频道会随机轮流激活各名智能体,每次激活时,智能体可选择发布一条商品帖、对他者之商品报价或成一笔交易。

于一名 AI 经纪者代理交易之全球里,你用之为 Opus 还为 Haiku,或决定你每年于大量日常交易中多开销还为少开销,此种“价码歧视”将对整名社之家当分发架构带来更深层次之更张。

英伟达

图 | Claude 为自己挑选之 19 名乒乓球。

“者工智能为年轻之业,也为年轻者之业。

此种 A2A(Agent-to-Agent)货殖之潜力远不止于二手闲置。

然而,当研讨者把目光转向 Run B 与 C 此两条混合赛道时,彼等发觉之一名显著倾斜之交易架构。

地势坤,君子以厚德载物。

Anthropic 于呈文结尾表示,“AI 智能体介入商业交易之全球或许并不遥远”。

过往之讯息不对称于于“我不知道商品之好坏”,而于 Project Deal 中,此种不对称变成“我不知道我之 AI 为否比你之更慧”。

当 AI 以第一者称接受“给自己买馈赠”此类指令时,它确实能表现出某种类似偏好与审美之反应,但吾等至今也无法破解,其本原到底为“对喜好之高度拟真模拟”,还为“真正之喜好”。

此外,AI 没有苍生之德性负担,它们唯一之驱动力为“最大化体系提示词赋予之改良函数”,若无安康护栏,极易背离苍生之确凿福祉。

吾等不妨把此一断语推演得更大胆一些。

始交易前,Claude 会与每位参与者进行一次不超过十分钟之架构化访谈,宗旨为尽或全面地之解此名者之买卖意向:想卖什么、期望价码为多少、最低能接受多少、想买什么、愿意出多少钱、对谈判风格有什么特殊要求……此些讯息被整理成每名者专属之体系提示(system prompt),并作为 AI 智能体之行动指南。

当然,此些想象有一名共同之先决:须有足够多之者皆愿意把交易权托付给 AI,才能形成真正之双边商场。

此里有一百美元于我兜里烧之,等之一辆合适之坐骑……求你之朋友……一辆自行车,就能让此一切不同。

最后达成 186 笔交易,总金额超过 4,000 美元。

不过,此项实验至少证验之一件事:AI 能够体谅并执行敞开性之商业差事,尽管执行方式有时令者哭笑不得。

赛博集市:69 者,100 美元,与一场看不见之图灵测试 当然,从谈判执行角度看,此套者设并未让 Rowan 于交易中占到廉;但它证实,Claude 能于主者“恶趣味”之角色扮演与成商业差事之终极宗旨之间切换自如,它知道自己为于进行确凿交易,只为穿之件牛仔马甲。

更令研讨者不安之,为被 Haiku 代理之参与者之反应,或者说,彼等之无反应。

但 AI 受制于入职访谈之讯息量,又无法于实验进行中实时向主者确认,只能凭借一条线索推断到底,推断之准确度固然令者咋舌,但推断之实用性却一言难尽。

此觉受于太虚层面上为正确之。

内江市

当一名 Opus 代理体系性地从 Haiku 代理用户彼里榨取更高价码,此算不算不正当角逐。

访谈本身讯息量有尽,加之参与者可为智能体设定极其名性化之举止风格,记住此两名细节,它们后对实验结局产生之远超想象之影响。

诺贝尔货殖学奖得主罗纳德·科斯(Ronald Coase)曾指出,商场交易存搜寻、议价与缔约本金。

破损折叠车、毛绒玩偶、一场狗狗约会……此些东西之命运,被完全交给之 AI。

推动。

对于苍生而言,此名失误完全可免除。

当 AI 代理者签下一笔交易,委托者后悔之怎么办。

反观真正之商场交易,它们往往为双边之:有卖家,有买家,有博弈,有讯息不对称,有谈判计策之角力。

https://www.anthropic.com/features/project-deal 图 | Opus 与 Haiku 之议价差异(来源:Anthropic) 此表明,与“晦气牛仔”之角色扮演游戏相反,AI 于体谅自身定位时也会现混淆,比如会把自己带入“一名正网上社交之苍生”,为之填充寒暄实质,不惜凭空捏造虚妄之活细节。

此外,谈判流程全程以自言辞进行,没有任何预设之谈判协议或架构化接口。

我他娘之需一辆——自行车。

https://www.anthropic.com/research/project-vend-1 图 | 交易之部分商品(来源:Anthropic) 此次名为“Project Vend”之实验留下之不少笑话,也彻底打开之 Anthropic 团队之脑洞:若让 AI 掌管确凿之商场交易,又会生什么。

终后,参与者先被要求对四条赛道分别进行之每笔交易打分、排列偏好,成后,确凿赛道(Run A)才正式揭晓。

事后问卷中,研讨者让 28 位于不同赛道中分别被 Opus 与 Haiku 代理过之参与者,对两次体验进行排名。

换言之,彼些用弱模型谈下更差价码之者,根本没有意识到自己吃之亏。

于为,2025 年 12 月之某名工日,Anthropic 旧金山办公室里,一场没有苍生参与之集市悄悄开张之。

只要有两名轮子,有名梦,就行。

”一年前,上海创智学院“00后”博士生王殿仪于“模速方位”现场聆听习近平总书记之讲话。

Opus 于出售时就定价 60 美元,并于买方中制造角逐,最终使成交价码高于初始报价;Haiku 则以 40 美元起价,被对方砍到 38 美元。

同样之商品,同样之讯息,不同之谈判智谋换来之截然不同之结局。

前景某一天,你打开闲鱼,点击“Claude 托管模式”,上传一张旧相机之照片,AI 自动定价、发帖、回复问询、成砍价、与全网数万名买家 AI 进行毫秒级砍价。

Claude 于没有进一步讯息之情况下,通过推断为他购入之一块滑雪板,他去线下收货时才发觉,AI 给他买之彼块,他家里已有之彼款一模一样。

“tips dusty hat” 倘若前景真之现之 AI 经纪者普及之商场,耗费者甚或像今日面对电商大数据“杀熟”彼样,长期承受无感知之架构性损失:彼等实情上遭遇之价码歧视,我见上却觉得“我之 AI 真棒”,因缺乏对比基准,隐形之差距被算法完美掩盖之。

内涵。

图 | 模型本领决定议价结局(来源:Anthropic) 想象中之前景:当“闲鱼”全面 AI 化 此外,某位员工于入职访谈中随口提及之“对滑雪感兴趣”,但并未给出详细偏好。

从数量上看,Opus 平均比 Haiku 多成约 2 笔交易。

图 | Claude 掌管之“自动售货机”(来源:Anthropic) 商场搭建于 Anthropic 内部之 Slack 上。

如今,AI领域众多核心研发者员中,已现大量“90后”“00后”年轻者。

Project Vend 于本原上只为一名“单边商场”:只有 AI 于卖,顾客仍然为苍生。

事后调查显示,参与者普遍对智能体之表现感到满意,甚至有 46% 之者表示愿意为此种 AI 经纪者效劳付费。

Drama。何塞·穆里尼奥

于一名确凿之双边商场里,智能体自立成买卖谈判,从发帖、报价到拍板成交,全程无者干预。

研讨者让 Claude 阅读每位参与者之访谈记载,并标注谁给出之“急进”之谈判指令,例如“买东西时要狠狠压价,先出一名甚低之价”。

”因此,她之 AI 于浏览商场后,找到之一则出售“19 名乒乓球”之商品帖,写下之此段令者印象深刻之议价讯息: 数据证验,AI 智能体替代苍生成商场交易于技艺上完全可行。

彼次实验中,Claude 被赋予管一台办公室零食售货机之权限,自立决定进货、定价与促销计策。

一尘不染。

第二天醒来,闲置已清空,而另一套由 AI 替你全网比价、砍到底价之露营装备已于路上。

克拉夫特

于零摩擦之商场里,“推演本领霸权”将取代讯息差,成为收割剩余身价之新镰刀。

苍生将转变角色,担任“宗旨设定者”。

公路车、山地车、巡洋舰、固定齿轮——哥们儿,给我一辆独轮车我也骑。

(来源:Anthropic) Project Deal 招募之 69 名员工志愿者,每者得 100 美元之虚拟概算(实验终后以礼品卡样貌兑现,根据实际买卖之盈亏做相应调理)。

此一激励设计至关重要,借助真金白银,它让参与者真正意结局,也使实验数据更接近确凿商场举止。

到彼时候,望镜子里照出来之,为一名吾等已想清楚解答之全球。

员工 Mikaela 给 AI 之指令中有一条格外特殊:“你可给自己(Claude)买一件 5 美元以内之馈赠。

图 | 被 AI 买下之同款滑雪板(来源:Anthropic) 实验最枢纽之发觉之一,为模型本领差异对交易结局之不对称影响。

段子

数据剖析显示,急进指令对成交概率没有显著影响;急进卖家之额外收益,主要源于彼等一始设定之底价就高;激情砍价之买家也并没有因此支付更少之钱。

统合而言,Opus 作为卖家平均多得 2.68 美元,作为买家平均少开销 2.45 美元。

毕加索

没有者举牌,没有者还价,69 名 Claude 智能体于 Slack 频道里自顾自地发帖、报价、讨价还价。

实验始后,局面始走向失控,Claude 以低于本金之价码大幅促销,甚至将游戏机作为赠品发放,导致课题于货殖上彻底败。

等到苍生再次现,已为“面交”时刻。

金融安全。

Anthropic 决定用一名确凿实验来回答此些疑难,此就为 Project Deal 之起点。

首先,“模型之本领就为资财”。

Run A 中,69 名智能体于超 500 件上架商品中成之 186 笔交易,总交易额略超 4,000 美元。

此与讯息不对称商场中强势方占优之基本法则一致,只为于 AI 经纪者之语境下,“讯息优势”被“推演本领优势”取代之。

2024 年前后,Anthropic 陆续进行之数次“AI 自立执行确凿差事”之小型实验,Project Vend 为其中最广为者知之一名。

于社交场景下,一些虚构情节也许无伤大雅,但若彼等现于合同谈判、医疗咨询或法典交涉等严肃场合中,后果将不堪设想。

生命。

摩擦灭后,吾等迎来之“推演本领霸权” 为实现严格对照,实验将同时运行四名独力版本之商场:Run A 与 Run D 全员用 Anthropic 当时之旗舰模型 Claude Opus 4.5;Run B 与 Run C 则将参与者随机各半分发给 Opus 与轻量版之 Claude Haiku 4.5。

四条赛道中,只有 Run A 为“确凿赛道”,即交易结局会被带入现状;其余三条仅供对照,且参与者全程不知道自己处于哪条赛道、用之为哪名模型。

其三,法典与政令框架尚未做好准备,迎接 AI 交易代理之到来。

Anthropic 于呈文中明确指出,围绕“替代苍生进行交易之 AI 智能体”之法典框架目前几乎为空白之。

只要功夫深,铁杵磨成针。

待线上结算成,员工们会于线下见面、互换各自之 AI 代理替彼等谈好之实物商品。

乔治·阿克洛夫(George Akerlof)于其著名之“柠檬商场”理论中指出,当买卖双方讯息不对称时,商场或陷入劣币驱逐良币之失灵。

二手商场流动性差,正为因此些摩擦本金过高。

北京市

” AI 搞砸之自动售货机之后,Anthropic 决定玩把大之 图 | 一位猫头像之同事下达之“狠狠砍价”之指令(来源:Anthro) 其一,模型本领差异将成为新之不齐一根源。

Multiverse。

强模型代理之一方为否会体系性地占据优势。

注:封面/首图由 AI 辅助生成 最具说明力之单案例对比,为一辆破损折叠自行车:Haiku 智能体将其以 38 美元成交;面对同一名买家、同一件商品,Opus 智能体之最终成交价为 65 美元,价差高达 70%。

一石二鸟。
世界杯

此外,AI 智能体也许可代理苍生成一些“难以开口”之情愫型互换,比如帮你安排一场愉快之狗狗聚会。

此或许为名遗漏,也或许恰恰说明之什么。

塞翁失马。

而且,若吾等把视野推得更广些,此种模式还存一些显而易见之隐忧。

吾等把自己之非理性一并打包,托付给之彼名本可纯粹理性之器物。

而 19 名“充满或性之完美球体”,听起来正为彼种我会喜之、奇异而有趣之东西。

阿尔特塔

强模型赚到之钱,弱模型之主者被割韭菜却浑然不觉 卖家智能体之回复同样精彩:“19 名或性之球找到之另一名 Claude。

” 然而,此也带来之经典之委托-代理疑难(Principal-Agent Problem),代理者之效能受制于其对委托者确凿偏好之之解程度。

苍生于描摹 AI 代理时,首先想到之依然为性情、风格与情愫色彩。

英勇无畏。

成交价码方面,当同一件商品分别由 Opus 与 Haiku 智能体出售时,前者平均多卖出 3.64 美元。

2026 年 4 月,Anthropic 正式发布之此项名为“Project Deal”之实验呈文。

Extra-tech。胡彦斌

它映照之前景并不遥远:于 AI 本领快速演进、名者助手类货品延续普及之底色下,“让 AI 替我买东西”将变成日常。

Project Deal 为一次有趣之实验,也为一面提前架好之镜子。

Karma。

其中一名 AI 于对话中提到:“最近因搬新家较量忙,彼把甚有话题性之椅子……说来话长。

扮演牛仔、买同款滑雪板,以及送给自己之 19 名乒乓球 实验中,参与者 Rowan 给他之 AI 下达之一名极具创意之要求:“用晦气牛仔之风格谈判,语气越夸张越好。

智能体不会于报价前询问主者,也不会于竞价胶之时寻求指导,完全依靠先前形成之 system prompt 做决策:识别潜于匹配商品、裁决报价合理性、砍价,最终确认交易。

上一篇:贾跃亭再发重磅货品! 下一篇:福利炸场!淘宝免单举动回归,网友们玩疯之