软件所提出小批量数据采样策略

中国科学院
199次浏览

近日,中国科学院软件研究所科研团队提出了小批量数据采样策略,可消除由不可观测变量语义引起的虚假关联对表征学习的干扰,来提升自监督学习模型分布外泛化能力。wzO速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

自监督学习的分布外泛化能力是指模型在面对与训练数据分布不同的测试数据时,仍能够保持良好性能。简单来说,模型需要在“未见过”的数据分布上表现得和在训练数据上一样好。但是,有研究发现,自监督学习模型在训练过程中受到与学习任务无关的不可观测变量的语义干扰,从而削弱分布外泛化能力。wzO速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该研究基于因果效应估计等手段,提出小批量数据采样策略,来消除不可观测变量语义干扰的混杂影响。这一策略通过学习隐变量模型,来估计在给定“锚点”样本的条件下,不可观测语义变量的后验概率分布,将其记为平衡分数。进而,该策略将具有相同或相近平衡分数的样本对划分为同一个小批量数据集,确保每个小批量数据集内的不可观测语义变量与“锚点”样本在条件上是独立的,从而帮助模型避免学习到虚假关联,提升模型的分布外泛化能力。wzO速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

进一步,该研究在基准数据集上进行了广泛实验。所有实验均仅替换批次生成机制,无需调整模型架构或超参数。实验显示,这一采样策略使当前主流自监督学习方法在各类评估任务上至少提高2%的表现。具体而言,在ImageNet 100和ImageNet的分类任务中,Top 1和Top 5准确率均超越自监督方法SOTA;在半监督场景下的分类任务中,Top 1和Top 5准确率分别提升超3%和2%;目标检测与实例分割迁移学习任务中,各项平均精度均获得稳定增益;对于Omniglot、miniImageNet和CIFAR FS等少样本转移学习任务,性能提升超5%。实验表明,这一采样策略可以弱化虚假关联、强化因果学习,并能够提升分布外泛化能力。wzO速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

相关研究成果被CCF-A类人工智能顶级学术会议International Conference on Machine Learning(ICML-25)接收。wzO速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

论文链接wzO速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-12-1181-0.html软件所提出小批量数据采样策略

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

6.98~8.58 万元,比亚迪海鸥荣耀版车型上市:纯电续航 305 405km
3 月 6 日消息,比亚迪海鸥荣耀版今日起上市,官方指导价为 6.98~8.58 万元,之前的版本为 7.38-8.98 万元。活力版 6.98 万元自由版 7.58 万元飞翔版 8.58 万元整理新车参数如下:尺寸:长宽高 3780×1715×1540mm,轴距
“12221”创新路,广东湛江“菠萝的海”向全球采购商发出邀请信!
广东“开年第一果”——湛江徐闻菠萝于近日上市了,徐闻县委、县政府一如既往地发出了《致全球菠萝采购商的一封信》,代表湛江市徐闻县15万勤劳朴实的菠萝果农,诚挚邀请全球采购商到“中
专访全国政协常委宁吉喆:2024年我国物价有望回归正常水平,大力发展新质生产力会带来新机遇
21世纪经济报道记者 周潇枭 北京报道 3月5日,十四届全国人大二次会议在京开幕,
(两会观察)一路疾驰的中国新能源汽车如何“过弯”?
  (两会观察)一路疾驰的中国新能源汽车如何“过弯”?  中新社北京3月5日电 题:一路疾驰的中国新能源汽车如何“过弯”?  作者 李腾飞 苏碧滢 徐雪莹  中国新能源汽车产销量占全球比重超过60%――政府工作报告里
全国政协委员白重恩:中央财政仍有加杠杆的空间,应缓解地方财政压力和增加居民消费
21世纪经济报道记者 周潇枭 北京报道 政府工作报告指出,要强化宏观政策逆周期和跨周期调节,继续实施积极的财政政策和稳健的货币政策,加强政策工具创新和协调配合。积极的财政政策要适
阿尔卑斯首款车效果图曝光!蔚来、小鹏、理想齐争20万级纯电
3月9日系消息,一辆尾窗张贴有“比毛豆Y更棒”的测试伪装车曝光后,引起了多方关注,最终经确认,其为蔚来子品牌阿尔卑斯首车,定位于纯电轿跑SUV,竞争对周直至特斯拉Model Y。有博主(@Navis-慢点评测)使用AI

热点精选

最新推荐

您可能感兴趣