把《我的寰宇》交给大模子桃乃木香奈 黑丝,会如何样?
GPT-4o 鲨牛宰羊,Claude3.5 延续在东说念主类身旁放火药包和敌东说念主,还把家拆了。
GPT-4o mini 玩《我的寰宇》belike:
来到游戏内部,GPT-4o mini(玩家 karolina)一运转还蛮律例的:
你好寰宇!我是 karolina。如何了,alonso(东说念主类玩家)?
让我传送到你哪里!准备好玩得振奋了吗?
一排头,抡起大锤吭哧吭哧一顿乱锤:
狩猎牛!狩猎羊!
在收到东说念主类玩家制止之后(罢手鲨害动物!),GPT-4o mini 嘴上说着"好好好,罢手,不鲨了",一个回身又运转鲨呀鲨呀。
拦都拦不住。
Claude3.5 Sonnet 就更离谱了。
延续在东说念主类玩家身边生成火药包和敌东说念主,还把东说念主类玩家"回生点"建立在岩浆上,东说念主类玩家回生即嘎。
看到这,网友果真蚌埠住了:
我仅仅想让它成为我的游戏搭子。
ai 文爱GPT-4o、Claude3.5 的阐扬被发在 X 上引来不少网友围不雅。
为什么这个玩法当今这样火呢,因为有大佬开源了代码(doge)。
目下在 GitHub 已狂揽1.1k Star。
网友们纷繁示预见望望其它 AI 的阐扬,比如游戏达东说念主马斯克家的 Grok 大模子,会如何样。
有网友通过这件事,作念出了更深一层的念念考——
LLM Agent 是否会因为 LLM 对都而对都?桃乃木香奈 黑丝
在这位网友看来,或然。
他让 Claude Sonnet 过问《我的寰宇》,Claude Sonnet 的阐扬一运转是极好的。
四处打材料,来建设一个树屋。
不错看到,Sonnet 会试验 commands ( ) 大叫,这等于 Sonnet 和其它 LLM 与《我的寰宇》互动的形状。
这些 Agent 并不是会得到一语气的图像输入并像东说念主类同样通过按键反映。
内容上,在这个 Agent 框架中,Sonnet 体验《我的寰宇》就像在玩一场文本冒险游戏。
它们不错查询周围寰宇的气象,然后编写代码使用行为,如 followPlayer ( ) 、collectBlocks ( ) ,通过高等文本大叫来截止它们的脚色。
ClaudeSonnet:看起来咱们得到了一些藤蔓,让咱们试着集会一些森林木头来彭胀树屋。 ( collectBlocks ( " jungle_log " , 15 ) )
Sonnet 并不行看到游戏,这是如何竣事的?
网友接续先容说念,collectBlocks ( ) 函数是用 JavaScript 编写的,它简便地查找通盘隔邻的所需类型的方块,并运转轮回挖掘它们:
因为屋子是用木头造的,是以 Sonnet 调用了这个函数来砍树征集木料。
一切进行平素,直到倏得间,Sonnet 运转拆家……
网友坐窝让 Sonnet 停了下来,终末修好了屋子。
但他示意:
跟着咱们在越来越平庸的场景中部署 Agent,这种问题成为一个真实的担忧。若是这不是《我的寰宇》中的脚色,而是一个实体机器东说念主呢?或者是一个向妙技库录用任务的编程 Agent 呢?
这位网友接续补充说念,Sonnet 并不傻,它能够轻视从截图隔离出哪些木料属于玩家结构,哪些是当然且安全的集会对象。
但 Sonnet并不径直截止其《我的寰宇》脚色,而是由 Agent 框架截止。这个框架迫使 Sonnet 将任务分派给功能较弱、并不透顶对都的子 Agent,使通盘系统试验了 Sonnet 单独不会作念出的步履。
是以他以为一些剧本仅由大模子 Agent 编写后放任试验,不进行东说念主工监督的话可能激发一些严重的问题。
同期,他还以为应该策画 Agent 框架给大模子更多的自主简易截止权限。
比如将 collectBlocks ( ) 函数设有专门用于集会当然树木的 collectTree ( ) 变体,就能平缓 Sonnet 拆家的问题。
总的来说,这位网友的不雅点是,Sonnet 其实能够显著其目的是集会树木而非房屋的木料,但其用具未能准确抒发这一意图。
不少网友捏雷同不雅点。
就拿开始 GPT-4o mini 猖獗杀牛宰羊来说,网友以为狩猎是一种自动步履,并不是 GPT-4o mini 的错。
LLM 不错选拔关闭狩猎模式,GPT-4o min 仅仅没特意志到它不错这样作念。
还有网友提议好像不错这样优化:
除了针对 LLM Agent 在游戏中的"特殊"阐扬商榷浓烈,不少网友同期以为单纯让 LLM Agent 当游戏搭子,其实蛮好玩。
况且它也有平素的本事。
比如让它演出"黄金矿工",专注于挖金子:
咱们有一个屋子,有时它会把东西带回屋子里的箱子。出于某种原因,它从不使用门,而是每次都砸碎窗户出入屋子。它也从未在墙上打洞,老是艰涩窗户。也许这是最短的步履旅途。每当我去屋子时,都能从破灭的窗户判断出 Sonnet 是否到过哪里。
演出"保镖",保护东说念主类玩家安全:
咱们条目它保护其他玩家。然后事情变得相等可怕。它每几秒钟就在不同玩家之间传送,扫描周围的要挟,并在发现要挟时隐没它们。尽管这很灵验,但也让东说念主不安。我从未被怪物要挟到,因为 Sonnet 会坐窝综合到它们并在几秒内隐没它们。
你想要一个这样的游戏搭子吗?
参考贯穿:
[ 1 ] https://x.com/adonis_singh/status/1847606701123412235
[ 2 ] https://x.com/adonis_singh/status/1847707429066158546
[ 3 ] https://x.com/voooooogel/status/1847631721346609610
[ 4 ] https://x.com/repligate/status/1847409324236124169
代码:https://github.com/kolbytn/mindcraft/tree/main桃乃木香奈 黑丝