AIRP之Sillytavern部署与配置【持续施工中】

Updated on

前言

部署教程已经很完备了,我会在这里沉淀自己的解决方案。

部署

Free VPS

API

Gemini

美化

Discord 纸类美化 Discord 真·正经美化

记忆

<request:暂停角色扮演,停止剧情推演,总结前文内容>

<request:由于上文内容被截断,接续上文继续生成>

/hide 1-

随后,在确保总结已经完成的前提下,可以隐藏前面的部分楼层,以达到降低输入tokens数量,促使AI将注意力集中在最后发生的故事上。以Deepseek举例,对于超长输入tokens,其有效注意力大约在最后的2k tokens上,前后文注意力最佳为8k tokens。换算下来就是,单次输入总长度应该限制在2500中文字以内,前后文应该限制在10000字左右。

根据上文这个计算方式,我们可以大约计算一下自己的对话10000字左右是多少层楼,随后每过一段时间,在对话框中输入“/hide 1-XX”命令。其中“XX”是指隐藏至多少层楼的数字。比如我当前每层楼输出约1500中文字,考虑到递归数列,大约4次对话就会占用满注意力。所以我们可以每过5层楼,就输入一次“/hide 1-XX”的命令。比如在第五楼的时候,输入“/hide 1”、第十楼的时候输入“/hide 1-5”、第十五楼的时候输入“/hide 1-10”,以此类推。

参考与推荐