核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
代码:
为什么Rust的包管理器Cargo这么好用?
大量消息在 MQ 里长时间积压,该如何解决?
MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响?
什么是你去了台湾才知道的事?
我弟弟做桌面运维工作的,好像只会简单的数据库增删改查备份恢复和打印机电脑的维护等一年多没工作了咋办?
count(*) count(1)哪个更快?
有一双超级大长腿是什么感觉?
为什么 macOS 比 Windows 稳定?
各位历史发烧友,介绍一下你知道的冷门史实或逆天史实?
字节跳动辞退原豆包大模型负责人,曾被曝婚内出轨下属,怎样看待这一处理结果?
请看两段***再回答,你认为:中医到底是不是科学,何以见得?
养乌龟只养一只,它觉得会孤独吗?
平面设计师要被时代淘汰了吗?
MongoDB的缺点以及你为什么不使用MongoDB?
公司老板不想续费3w一年的云服务器,合理吗?
女主播和榜一大哥现实碰面会做什么?
为什么在日本是实体店干掉电商,在中国却是电商干掉实体?
为什么电路要设计得这么复杂?
万兆的网络速度有多大意义?
为什么章若楠和杨超越长得很像,男人却更喜欢章若楠,认为有女人味,而觉得杨超越像小女孩?
为什么一部分 Go 布道师的博客不更新了?
为什么 Go 语言的 Error Handling 被某些人认为是一个败笔?
普通人用得着4k分辨率的显示器吗?
为什么韩国的热辣舞团无法征服中国的男性市场??
大三做的海报,离就业差多远?
WiFi7能替代HDMI吗?
为什么年轻的肉体让人沉迷?
搞了NAS之后去哪里下载4K,8K的电影?