生成式人工智能

chain of thought

情绪勒索

强化学习寻找prompt

in context learning(随着模型的增强,这个也越来越强了)

拆解任务

自我检查

做同一个任务多次,然后让他选择其中最正确的

rag

Program of thoughts

tree of thoughts(对于一个任务进行分拆,然后对于每一个任务进行多次,然后选择其中正确的继续)

调用工具,即让训练产生特殊的token,然后遇到这个token就去调用

模型合作

让一个前面的模型来决定用哪个模型来解决

让多个模型互相讨论

引入不同的角色

lora:不改变原本的pretrained参数,而是额外加一些类似的参数,对这些参数进行训练

pretrain sft

可以通过chat来获得大量的资料

RL:可以训练一个回馈模型来做RL吗

agent

AG和NAG

进行混合

speculative generation,就是通过一些更加快速比如NAG或者较小的模型进行快速的生成,这样原本的大模型就可以同时进行生成,然后再舍弃掉预言所得的错误的结果


生成式人工智能
https://lhish.github.io/project/生成式人工智能/
作者
lhy
发布于
2025年8月16日
许可协议