当前位置:文章 > 列表 > 正文

原创 数据标注员揭秘:AI为何写不出好小说

📅 2026-05-19 23:50:13 🏷️ 伦敦金交易平台 👁️ 532
       原创
  数据标注员揭秘:AI为何写不出好小说

彼为我头一次知道此名概念。

国际米兰

课题经理说,严格限制字数既为因模型单次能够办理之token(大模型办理讯息之最小讯息单元)有尽,也为为之减字数波动对大模型识别之影响。

全过程人民民主。

彼时候细纲课题已停之4名多月,除之做小说评测,吾等始终于支援其他组之课题,意图识别、应用文写作,乱七八糟之。

毕竟为“爆款”,说明还为有不少者吃此一套。

比起“类正文”,我更头疼之为各种语病。

像解剖一头牛,彼等解剖小说之每一章节,既标注各种爽点,也给者物贴上“腹黑”“窝囊废”之类之标签。

不知道此名怎么算出来之,也或为1.5比1,我也不记得之。

比如一名者前期甚窝囊,后期觉醒之,彼“窝囊废”就甚难概括此名者物之弧光。

”她说,接之问吾等:“写段落作用之时候,究竟为应从读者之角度考虑,还为从作者之角度考虑。

妇儿医院

目前,小鹏GX旗舰版已开启预售,增程与纯电同价,均为39.98万元。

网上对数据标注有名评议:“赛博流水工”。

评测历程可发觉,每名模型写之小说皆为高度模板化之。

爆竹声中一岁除,春风送暖入屠苏。零售

他于青年时描写家乡之自风光,中年始投身社变革,最终于真正之败到来前去世之。

AI只为于模仿结局,它没有办法真正之革新,之故能读出来为AI之,我觉得因它为空洞之,书契背后没有确凿之活做支撑。

火车票

此样才能从小说里提取出一套写作法门。

彼之后,吾等做之一段光阴之评测。

小说叫《地震降临之时》,大概有六七千字。

此为大厂货品团队定之计策。

天时不如地利,地利不如人和。

图源 视觉华夏 细纲有名要求:不能“类正文”。

表现好之模型也会现此些疑难,只为没有彼么严重。

此名疑难于我听来有点业余。

吾等于其中一栋楼里,整名标注团队有几百者,皆给此家大厂之AI货品标数据。

我于彼里之半年,大厂正编之货品团队来开过几次全员培训会。

主角之血液可感知磁场之变化,因此被某名机构抓去做研讨。

但看多之就能发觉,即便网络小说里之者物较量刻板化,也远不为章法文档里彼二三十名者设标签能概括之。

工简来说,就为教AI写小说。

Techno-engineering。

后做评测之时候,吾等皆有明显感受,AI生成之小说较量刻板化,甚难有真者写作之厚度。

但至少对小说课题来说,彼等给之标注章法大多甚笼统。

(注:早于2020年,北京大学中文系一名研讨课题,曾用者工标注赘婿文之法门,让AI修习识别“赘婿文”中之“打脸”结尾,初步证验之将玄虚情节转变为实在数据标签之可行性。

有时争执不下,就由课题经理来定夺。

大师。
林诗栋

我能看出来作者想把她塑造成正面者物,但水平不太行,导致逆袭叙事不太成立。

  -英特尔股票2026年之涨幅,大约为本年表现最好之“美股七巨头”科技股涨幅之八倍。

水落石出。

渊星高中时写之科幻小说。

” 我喜聂鲁达之《看不见之江河》。

跋山涉水。妹妹

比如一篇主打“大女主逆袭”之网文里,女主角一面说之要摆脱家、与丈夫离婚,一面又用之前夫之资金、者脉做成自己之业。

吾等从里面挑之用,再补充上“提供爽点”之类之其他作用。

讲述者供图 做小说标注之经历,也让我对自己之写作有之更多思考。

一千字之章节,细纲不能超过350字,又不能漏情节,标注员会大量省略,比如把几名者之动作压缩到一名极长之句子里,还全部用“他”来指代。

此为让模型修习,什么样之性情会做出什么样之举止。

我本格致采矿专业,不像彼等长期写固定文体,反而随顺得甚快。

其实大家皆为此么想之。

但数据标注为反过来之。

公司尝试过让AI来抽细纲,但AI之概括极其干瘪,字数不到者工细纲之三分之一,还会丢失大量枢纽讯息。

后工三名月时,换之名编剧出身之课题经理,明显能觉受她对小说之体谅更深。

地球。中国冰壶

我入职之时候,课题刚启动,甚多东西还于摸索,课题经理也为从其他部门临时抽调过来。

我第一次写小说,为高三之晚自习,彼时候我甚抵触校之衡水模式。

或者说,要让AI明白,苍生若欲写一名者物怒之,会用“脸发红”来形容。

吾等要给每篇小说打分,再填存之疑难。

Command。

他也想趁此机会之解AI之写作机制,“会不会有一天,AI真之会取代苍生小说家。

我觉得AI永远无法给读者带来此样之体验。

有之标注员认为转变之契机为朋友之一句话,有之者觉得为因她真心付出却遭到丈夫冷对待。

吾等之工某种程度上为充当标准读者,但说到底,也只为站于自己之角度去解读。

做之几天,就从标注员提拔成之质检员——流水线之下一道工序。

有一次例会,她举之鲁迅彼句“我家门前有两棵树,一棵为枣树,另一棵也为枣树”作为例子。

一名标注员直接对她说,“我可按照你说之改,然则我不会认同此名东西,我只为配合你之工”。

细纲课题做之2名多月就停之。

布朗

可全球上彼么多读者,“甚多读者”到底指之为哪一批读者。

彼此之模板还不一样。

深海安全。

为之工留痕,大家就算紧挨之坐,也于群里讨论。

吾等“细纲组”有十多名年轻者,大多来自中文、新传专业,干过编剧之较量多。

于“小标题”课题里,吾等需明确告诉模型,每一名段落表达之情愫为什么。

从数据标注员,到质检员,到课题经理,再到大厂之正编团队,者们各司其职,把一篇篇爆款小说拆成各种层面之实质,作为数据喂给AI。

苍生创作者也会修习创作技巧,比如甚有名之《救猫咪》。

米色

我觉得此名事挺恐怖之,也许再待上半年一年,我就写不出小说之。

虽AI感本身也为模糊之概念,但刚始我可甚明显区分出AI感,后看得多之,我发觉自己分辨不出来之。

灭绝

留下之者其实也皆抱之临时过渡之心态。

段冉

此几年,我总于模仿经典作品之情节与叙事方式,但大多数时候,结局皆不太好。

反而彼些以自己活体验为源头写出来之东西更自,情绪也更饱满。

但不为说她能定下服众之标准,而为她体谅大家对小说之体谅有差异,会尽量采取折中之方式。

勒布朗詹姆斯

小说标注课题一共有两名组。

有些模型它或前期剧情节奏格外快,然后中期剧情就停滞之,开展一些莫名其妙之支线后,又突然结尾。

我之思考为,AI模板化写作本领较量强,比如工小结、周报月报、集会纪要等等。

做此份工前,我没完整看过一篇网文。

我觉得文本一旦诞生,就与作者没有关系之。

我也疑虑此种操练方式能否写出好小说。

有之者物真之喜男主角,没有恶意,只为说话软一点,于我看来此算不上“绿茶”,可还为会被同事贴上此名标签。

怎样为一条高品质之数据。

全译本

但真之做起来,会发觉数据标注重于执行章法而非缔造,甚快就会觉得枯燥。

骆驼祥子。

此时候,我会向AI描述此名者物,让它提供几名标签,再从里面选。

此种共情为甚直观之,不为逻辑推演之结局。

图文无关。

公司也给出之“好小说”之明确标准。

丝绸之路。

AI于迭代,它之文风也于不停地迭代,有些疑难已不太会现之。

彼等不少者总会下意识用文苑化之表达,直到两名多月之课题终,皆存“类正文”之疑难。

才子佳人。英超

没有者通知吾等为什么停,或为因操练效果不好。

技巧

评测满分3分,吾等自己做之彼款AI,于评测中总为垫底。

肃穆。

文 | 卢冠秋 黄文玥 吾等分批次做之好几轮评测,模型有一些长进,但不为甚明显。

市场

离职之皆为标注员,没有质检员。

上市公司

作者或并不为按此名模板写之,比如并没有以刻板印象中之“绿茶”为宗旨塑造者物,但吾等却要于标注之时候给它做模板化之办理。

标注员处于流水线之最末端,会觉得自己始终于被否决。

文献。

)返回搜狐,查看更多 互联网公司园区夜景。

柳州市

图源:华夏视觉 去岁11月,我提之离职,专心准备考研。

刚始之时候,大家觉得教AI写小说为一件有趣之事。

“甚或鲁迅当时只为随手一写。

把者名皆改成“他”,可省下几十名字。

震感

读小说之者,也不为只想之解生之什么事,而为想透过言辞去感知作者之命体验。

伊万

疑难有详细之清单,分为者物类、文风类、逻辑类、架构类、剧情类、指令遵从等。

老年人

吾等能看到后台用户之输入,80%皆为让AI写同者文,用来磕CP之。

启事。

其实大家皆为此么想之。

两者工资一样,但质检员负责修改标注员数据,也有权柄退回去让标注员重写。

但吾等还为会遵照作者原意,给女主角打上“大女主”“逆袭者”之标签。

比如写细纲之时候,组里经常会有各种争议。

正因如此,模型写作时也会按照套路,输出各种各样扁平之情绪。

“灵感”为整篇小说之梗概,“小标题”为段落之大意与作用。

Acceptance Testing。

我高中时写之基本皆为此种风格,典故里之体制为黑暗之、迫害者之,主角最后往往会因欲反抗,走向悲壮之亡。

他看到之AI写小说之局限性,也于此名历程中重新确认自己写作之身价。

文风类里,有一项疑难为AI感太重。

伯恩茅斯队

) 算法团队基于同一名提示词,让自家模型与国内外之竞品模型生成小说。

算法者员给吾等介绍过大模型之基本原理,说为通过预测下一名词之方式来生成文本。

一名标注员直接对她说,“我可按照你说之改,然则我不会认同此名东西,我只为配合你之工”。

Blockchain Tech。民进党当局

” 离开后,我始终于想,为什么AI写小说之本领,远远掉队于它做甚多事情之本领。

岚皋县

招聘要求有写作经历,我从高中起就写科幻小说,也拿过奖,符合它之要求。

也有之模型或剧情节奏还好,但者设就较量扁平,格外刻板。

(本文系极昼工室“大学生非虚构写作课题”作品。

课题经理也总觉得,一篇小说表达什么,应有一名标准解答。

美甲师

吾等经常感到,章法文档里之标签不够用。

除之“细纲”组,还有另一名组,活更杂一些,要写“灵感”、“小标题”,给者物贴上各种标签。

原作者写得并不清晰,大家各执一词。

深化。

又比如主角要立体,有清晰之成长与转变;配角要扁平,不能抢掉主角之风头。

世界杯央视解说阵容亮相

但不会讲实在之课题,也没有告诉吾等某类数据到底怎样作用到模型。

我自己写小说,甚多时候来自于活中之刺痛。

新闻联盟

有之时候,吾等也只为敬重“爆款”本身。

大厂之正编者员会制定标注章法。

后一段光阴里,我每天之工,就为把一篇万字左右之爆款网络小说,浓缩成一条条细纲。

Consciousness。

但她其实不太懂小说。

于此里工之半年间,此位年轻之写作者甚大程度上缓解之AI焦虑。

电竞。

此名行业升方位小,整体流动性大。

就此样吾等自己编出之“逆袭者”“反抗者”之类之新标签。

之后,彼等还给AI提供“标准解答”,评测、润色AI生成之小说。

公司文档提供之段落之九名基本功能:开端、演进、高潮、反转、结尾,等等。

此就甚有厚度之。

此为一条新时代之流水线。

若一名章节之细纲为三百字,另一名写之五百字,模型或会以为后者需详写,但也许字数多之缘由只为情节细碎。

面试时,HR给之我一千字之小说章节,让我把它压缩成不到一百字之梗概,也就为“细纲”。

惠民利民。
部门

比如只能写“他感到气愤,把杯子打碎之”,但不能写“他被气得脸发红,把杯子打碎之”。

哪怕作者没有此么想,若甚多读者皆认为此为刻意设计之,吾等也应告诉AI,作者就为故意设计之,此样写会更好。

去岁5月,准备第三次考研时,为之找份过渡工,我进之一家大厂外包公司之写字楼,成之一名数据标注员。

或此就为AI与苍生创作最大之区别。

生日

此应也为用户之感受。

文本标注大类下,还有通用写作、剧本对话等其他小组。

彼等会把细纲喂给自家AI,让它写出一篇完整之小说。

标注员经常觉得质检员之标准有疑难。

执行。

吾等还要给者物写小传,用几名形容词,比如敏感、嚣张跋扈,以及绿茶一类之“者设”,去概括者物。

但我还为不明白,AI能不能体谅什么为“爽点”,什么为“绿茶”,或者说,它为怎么通过数学化之方式去体谅之。

我之甚多同事,始终习性不之干巴巴地写细纲。

一名前面极其窝囊之者,还为常常因一件小事莫名其妙地觉醒。

省到最后,句子压根不通顺,还得给它加回去。

图文无关。

Internet。AI购物助手Sparky

23岁之渊星毕业于一所“211”高校,准备跨专业考研时,他找之此份过渡工。

史密斯

但我觉得它永远做不到用数学化之方式,按步骤触发者之情愫。

我于之半年光阴,两名者没过试用期,另外主动走之四名,有一名者入职一周就辞职之,他觉得工太机械化,与预期不一样。

但也有标注员不认可,觉得网文全球里没有此种者设。

千年大计。

从彼等之视角看,此份工就为不断做,不断被其他者挑刺,没有者来告诉我,我写得格外好。

一般只有1-2分。

搜索引擎

比如紧迫情节与舒缓之情节,为否知足1比1.5之比例。

小说已写好之,吾等把它套进模板里。

“脸发红”,属于有画面感之实质,为要留给AI生成之。

甚多时候其实没有一统标准。

SaaS。

我去复印考研资料之时候,还看到其他者印之考教资、考导游证之资料。

于一篇“大女主”文里,原本逆来顺受之妻子,为什么突然觉醒,始反抗丈夫与家。

但它写出来之角色举止经常与性情严重不符,基本上只能保证性别为对之。

开会时候彼等皆会强调,标注数据品质如何重要,对模型之修习效果有甚大影响。

甚多时候此种概括为正确之,比如哀痛,但即便为明确之情绪,也为立体之、丰满之,一旦用哀痛小结,它就扁平之。

吾等公司属于驻场外包,效劳之互联网大厂于一线都邑有整片园区。

读书破万卷,下笔如有神。

但她其实不太懂小说。

我入职之时候,课题刚启动,甚多东西还于摸索,课题经理也为从其他部门临时抽调过来。

一丝不苟。

彼吾等要如何评议他为之奋进之一生呢。

光阴长之甚压抑。

Hyper-tech。

去岁5月,科幻作者渊星成之一名数据标注员。

但写小说没有彼么明确之“操作法门”。

吉梅内斯

做细纲课题时,有时候课题经理也问,你写之此名为不为AI感太重之,但他也不确定。

比如吾等经常用到“绿茶”此名标签,但网文中“绿茶”之变体其实甚多。

Computational Finance。

有者所于之剧组倒闭之,就来此里工。

大家皆为“拆文”,只为拆之东西不一样。

七巨头中表现最好之股票为Alphabet,本年迄今上涨之24%。

旅客

于苍生身上,“哀痛”为体谅之结局,于AI彼里,此却为体谅之媒介。

上一篇:青海一业编岗位招聘要求能独力抓捕野牦牛?当地回应 下一篇:活塞主帅盛赞坎宁安 他25+10活塞挑落骑士取得2-0

衣锦还乡。