转至Notion笔记:https://notion.so/a0053f3d6e00417fb1237f48865786c2 原文来自:https://mp.weixin.qq.com/s/bN7ZxumK9HyubqaJbx_CJg Datawhale干货 作者:陈怡然团队 尽管目前视觉语言模型(VLM)在多模态任务上表现突出,但训练过度依赖人工标注的数据与精心设计的强化学习奖励。这种依赖带来数据稀缺问题:多模态标注成本高昂,限制了训练数据的规模与多样性。同时存在知识天花板:模型能力受人类监督边界限制,难以突破…