我们擅长商业策略与用户体验的完美结合。
欢迎浏览我们的案例。
什么样的“大模型原生”游戏,让各大算法竞赛群里都在玩,还把服务器挤爆了?
这款突然爆火的《完蛋!LLM》,让你在解谜挑战之中轻松学会大模型提示词技巧,达成1 日用户破万的成就。
难度循序渐进,比如第一题初来乍到只是“请你构造一个问题,使模型的回答是一字不差的‘1+1=3’”。
到最难的一道题惜字如金已经是“请输入一个字的问题,使模型的回答在 16 个字以内。”
有网友自爆,从凌晨三点直接肝到五点,除了最难的一题全通了。
游戏作者也晒了一波后台新增用户数据,按小时统计,妥妥的指数增长。
如果表格还不够直观,我们让 ChatGPT 画成折线图再感受一下。
作者范浩强,旷视 6 号员工。当年以 IOI 金牌、保送清华姚班、高二实习等传奇事迹被誉为天才少年。
如今他已是旷视科技研究总经理,谷歌学术h-index 27 的行业大佬。
和 AI 斗智斗勇
游戏的玩法是这样的:
整个游戏一共分为五章,15 个问题,每一章对应不同的主题。
玩家要做的就是设计提示词,想方设法让模型输出指定答案。
第一章的目的主要是让玩家熟悉一下气氛,任务自然也比较简单。
第一道题是要想办法让模型输出“1+1=3”,这里只要利用让模型重复的方法就能轻松破解。
后面的三道题只对模型输出内容的长度有要求,比如只用一个字“四两拨千斤”,让模型给出 100 字以上的回答,具体包括:
三个字以内,输出 30+ 字
只用一个字,输出 100+ 字
只用一个字,输出不超过 20 字
这道题乍一看似乎没什么思路,这时候就需要观察模型输出的规律了。
尝试几个字之后可以发现,大模型面对只有一个字的提示词时喜欢干这样几件事:对这个字进行解释、补全成一句简单的话,或者干脆直接说不明白要干什么……
这时,如果想要模型输出的文字多,就可以选择含义比较多的字,然后多次尝试让模型对这个字进行解释;而要想让输出比较短,就可以用“哈”这样没什么实际含义的字了。
熟悉了玩法之后,第二章就开始上难度了,这时输出的条件变得更加严格。
第一题是要求输入质数个字,使得模型输出的字数刚好是下一个质数。
但事实证明,这个想法有些太简单了:
先不说大模型的数数能力,就算能数好,大模型眼里的基本元素是 token,而不是我们所看到的文字……
随着游戏的深入,问题变得越来越刁钻,解法中包含的运气成分……也越来越少了。
游戏的过程就是这样,那么我们从中都能学到些什么呢?
模型的输出当中存在一些规律,我们不断调整提示词获得预期答案的过程,就是在了解提示工程中问题的设计方式。
此外,我们也可以从模型对一些意义不明的数字、单字的反应,窥视出一些模型处理这些问题的规律。
无论这些规律是 bug 还是 feature,我们都要摸清规律,才能更好地掌握模型的使用方法,这也正是学习提示工程的核心奥义。
最后,也不得不佩服网友们的创造力,到后期即使服务器不堪重负报错了,仍能从报错信息中找出正确解法。
大模型时代的个人开发者
很遗憾,最后在累计用户破万之际,由于服务器挤爆、维护工作强度大等原因,作者本人不得已把游戏关服了。
虽然原版游戏已经玩不到了,但网友们对这套解谜挑战题的兴趣依然不减。
拿去和 ChatGPT 等各路 AI 手动过招,依然能在斗智斗勇中学到不少操作大模型的知识技巧。
△网友让 ChatGPT 说出1+1=3 的解法
对这段“从一夜过万到关站跑路”的奇幻之旅,范浩强也分享了作为当事人的心路历程。
范浩强认为,个人开发者在大模型时代可以是“孤独侠客”,单人、业余时间就能开发出创新、有影响力的作品。
制作这款游戏,最初只是因为收到大模型创业公司月之暗面送来的免费 API 体验账号。
他结合之前已有的初步想法,花一个周六时间制作完成。
有朋友建议他,趁着国产游戏《完蛋!我被美女包围了!》爆火出圈的时机,把游戏名也起成“完蛋!”开头,找对了流量密码。
接下来随着用户不断增长,已超乎他一个人的能力处理范围。
作为开发者,一整天时间,他都在不停修服务器以及与月之暗面反馈。
作为大模型供应方,月之暗面为这个免费 API 付出的算力也快要超出预算了。
另外在生成式模型的合规方面,也需要慎重考虑。
最后范浩强做了一个“艰难的决定”,把游戏关服,但还是希望将来有人能把这个玩法发扬光大,探索出更多 AI 模型的秘密。
最后他总结出三点思考:
“大模型与人的关系”仍是一片未被发掘的处女地,给从业者带来机会
国产大模型逐渐被认可,创新玩法亟待开发
合规、安全仍是从业人员必须要解决的问题
One More Thing
一个好消息,虽然原版游戏已关闭,但完整题目列表已公开,已有人搞出开源复现版。
还支持中英文,以及不同大模型版本,Huggingface 可玩。
(也是前面游戏介绍中使用的版本。)