生成式人工智能
chain of thought
情绪勒索
强化学习寻找prompt
in context learning(随着模型的增强,这个也越来越强了)
拆解任务
自我检查
做同一个任务多次,然后让他选择其中最正确的
rag
Program of thoughts
tree of thoughts(对于一个任务进行分拆,然后对于每一个任务进行多次,然后选择其中正确的继续)
调用工具,即让训练产生特殊的token,然后遇到这个token就去调用
模型合作
让一个前面的模型来决定用哪个模型来解决
让多个模型互相讨论
引入不同的角色
lora:不改变原本的pretrained参数,而是额外加一些类似的参数,对这些参数进行训练
pretrain sft
可以通过chat来获得大量的资料
RL:可以训练一个回馈模型来做RL吗
agent
AG和NAG
进行混合
speculative generation,就是通过一些更加快速比如NAG或者较小的模型进行快速的生成,这样原本的大模型就可以同时进行生成,然后再舍弃掉预言所得的错误的结果
生成式人工智能
https://lhish.github.io/project/生成式人工智能/