想法-可持续学习大模型框架

海心 12 次阅读 发布于 26 天前 预计阅读时间: 1 分钟


其实不是在算法层面做工作,而是也是一种类Agent的。

比如我们先弄好两个基座模型 A和B

A看作一种前台暂存区,B则在后台训练

A在前台和用户互动对话,对话1000条后,将对话记录作为训练数据拿去后台微调训练B。B在微调训练的过程中,A仍然可以继续对话。当B训练完成后,直接用B覆盖A。然后循环以上操作