想法-可持续学习大模型框架

海心发布于 2025-10-03 88 次阅读

其实不是在算法层面做工作，而是也是一种类Agent的。

比如我们先弄好两个基座模型 A和B

A看作一种前台暂存区，B则在后台训练

A在前台和用户互动对话，对话1000条后，将对话记录作为训练数据拿去后台微调训练B。B在微调训练的过程中，A仍然可以继续对话。当B训练完成后，直接用B覆盖A。然后循环以上操作

查看评论 - 无~

暂无评论

要发表评论，您必须先登录。