舍弃人工标注！华人团队提出多模态大模型自我进化算法

转至Notion笔记：https://notion.so/a0053f3d6e00417fb1237f48865786c2 原文来自：https://mp.weixin.qq.com/s/bN7ZxumK9HyubqaJbx_CJg Datawhale干货作者：陈怡然团队尽管目前视觉语言模型（VLM）在多模态任务上表现突出，但训练过度依赖人工标注的数据与精心设计的强化学习奖励。这种依赖带来数据稀缺问题：多模态标注成本高昂，限制了训练数据的规模与多样性。同时存在知识天花板：模型能力受人类监督边界限制，难以突破…