• 桃乃木香奈 黑丝 把AI放进《我的寰宇》功绩器:GPT-4o杀牛宰羊,Claude3.5把家拆了

  • 发布日期:2024-10-23 10:08    点击次数:52

    桃乃木香奈 黑丝 把AI放进《我的寰宇》功绩器:GPT-4o杀牛宰羊,Claude3.5把家拆了

    把《我的寰宇》交给大模子桃乃木香奈 黑丝,会如何样?

    GPT-4o 鲨牛宰羊,Claude3.5 延续在东说念主类身旁放火药包和敌东说念主,还把家拆了。

    GPT-4o mini 玩《我的寰宇》belike:

    来到游戏内部,GPT-4o mini(玩家 karolina)一运转还蛮律例的:

    你好寰宇!我是 karolina。如何了,alonso(东说念主类玩家)?

    让我传送到你哪里!准备好玩得振奋了吗?

    一排头,抡起大锤吭哧吭哧一顿乱锤:

    狩猎牛!狩猎羊!

    在收到东说念主类玩家制止之后(罢手鲨害动物!),GPT-4o mini 嘴上说着"好好好,罢手,不鲨了",一个回身又运转鲨呀鲨呀。

    拦都拦不住。

    Claude3.5 Sonnet 就更离谱了。

    延续在东说念主类玩家身边生成火药包和敌东说念主,还把东说念主类玩家"回生点"建立在岩浆上,东说念主类玩家回生即嘎。

    看到这,网友果真蚌埠住了:

    我仅仅想让它成为我的游戏搭子。

    ai 文爱

    GPT-4o、Claude3.5 的阐扬被发在 X 上引来不少网友围不雅。

    为什么这个玩法当今这样火呢,因为有大佬开源了代码(doge)。

    目下在 GitHub 已狂揽1.1k Star。

    网友们纷繁示预见望望其它 AI 的阐扬,比如游戏达东说念主马斯克家的 Grok 大模子,会如何样。

    有网友通过这件事,作念出了更深一层的念念考——

    LLM Agent 是否会因为 LLM 对都而对都?桃乃木香奈 黑丝

    在这位网友看来,或然。

    他让 Claude Sonnet 过问《我的寰宇》,Claude Sonnet 的阐扬一运转是极好的。

    四处打材料,来建设一个树屋。

    不错看到,Sonnet 会试验 commands ( ) 大叫,这等于 Sonnet 和其它 LLM 与《我的寰宇》互动的形状。

    这些 Agent 并不是会得到一语气的图像输入并像东说念主类同样通过按键反映。

    内容上,在这个 Agent 框架中,Sonnet 体验《我的寰宇》就像在玩一场文本冒险游戏。

    它们不错查询周围寰宇的气象,然后编写代码使用行为,如 followPlayer ( ) 、collectBlocks ( ) ,通过高等文本大叫来截止它们的脚色。

    ClaudeSonnet:看起来咱们得到了一些藤蔓,让咱们试着集会一些森林木头来彭胀树屋。 ( collectBlocks ( " jungle_log " , 15 ) )

    Sonnet 并不行看到游戏,这是如何竣事的?

    网友接续先容说念,collectBlocks ( ) 函数是用 JavaScript 编写的,它简便地查找通盘隔邻的所需类型的方块,并运转轮回挖掘它们:

    因为屋子是用木头造的,是以 Sonnet 调用了这个函数来砍树征集木料。

    一切进行平素,直到倏得间,Sonnet 运转拆家……

    网友坐窝让 Sonnet 停了下来,终末修好了屋子。

    但他示意:

    跟着咱们在越来越平庸的场景中部署 Agent,这种问题成为一个真实的担忧。若是这不是《我的寰宇》中的脚色,而是一个实体机器东说念主呢?或者是一个向妙技库录用任务的编程 Agent 呢?

    这位网友接续补充说念,Sonnet 并不傻,它能够轻视从截图隔离出哪些木料属于玩家结构,哪些是当然且安全的集会对象。

    但 Sonnet并不径直截止其《我的寰宇》脚色,而是由 Agent 框架截止。这个框架迫使 Sonnet 将任务分派给功能较弱、并不透顶对都的子 Agent,使通盘系统试验了 Sonnet 单独不会作念出的步履。

    是以他以为一些剧本仅由大模子 Agent 编写后放任试验,不进行东说念主工监督的话可能激发一些严重的问题。

    同期,他还以为应该策画 Agent 框架给大模子更多的自主简易截止权限。

    比如将 collectBlocks ( ) 函数设有专门用于集会当然树木的 collectTree ( ) 变体,就能平缓 Sonnet 拆家的问题。

    总的来说,这位网友的不雅点是,Sonnet 其实能够显著其目的是集会树木而非房屋的木料,但其用具未能准确抒发这一意图。

    不少网友捏雷同不雅点。

    就拿开始 GPT-4o mini 猖獗杀牛宰羊来说,网友以为狩猎是一种自动步履,并不是 GPT-4o mini 的错。

    LLM 不错选拔关闭狩猎模式,GPT-4o min 仅仅没特意志到它不错这样作念。

    还有网友提议好像不错这样优化:

    除了针对 LLM Agent 在游戏中的"特殊"阐扬商榷浓烈,不少网友同期以为单纯让 LLM Agent 当游戏搭子,其实蛮好玩。

    况且它也有平素的本事。

    比如让它演出"黄金矿工",专注于挖金子:

    咱们有一个屋子,有时它会把东西带回屋子里的箱子。出于某种原因,它从不使用门,而是每次都砸碎窗户出入屋子。它也从未在墙上打洞,老是艰涩窗户。也许这是最短的步履旅途。每当我去屋子时,都能从破灭的窗户判断出 Sonnet 是否到过哪里。

    演出"保镖",保护东说念主类玩家安全:

    咱们条目它保护其他玩家。然后事情变得相等可怕。它每几秒钟就在不同玩家之间传送,扫描周围的要挟,并在发现要挟时隐没它们。尽管这很灵验,但也让东说念主不安。我从未被怪物要挟到,因为 Sonnet 会坐窝综合到它们并在几秒内隐没它们。

    你想要一个这样的游戏搭子吗?

    参考贯穿:

    [ 1 ] https://x.com/adonis_singh/status/1847606701123412235

    [ 2 ] https://x.com/adonis_singh/status/1847707429066158546

    [ 3 ] https://x.com/voooooogel/status/1847631721346609610

    [ 4 ] https://x.com/repligate/status/1847409324236124169

    代码:https://github.com/kolbytn/mindcraft/tree/main桃乃木香奈 黑丝