国内多数AI模型训练使用的中文数据占比已超60%

新华网
15次浏览

中文数据在国内AI大模型的训练性能提升方面发挥着重要作用。国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“在人工智能时代,Token,也就是大家通常所说的词元,是处理文本的最小数据单元,如同互联网时代大家所说的‘流量’。”刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,到今年6月底,日均Token消耗量已经突破30万亿,一年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

人工智能模型的训练也推动了数据交易需求的攀升。截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

下一步,国家数据局将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

中文数据在国内AI大模型的训练性能提升方面发挥着重要作用。国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“在人工智能时代,Token,也就是大家通常所说的词元,是处理文本的最小数据单元,如同互联网时代大家所说的‘流量’。”刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,到今年6月底,日均Token消耗量已经突破30万亿,一年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

人工智能模型的训练也推动了数据交易需求的攀升。截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

下一步,国家数据局将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。nCh速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-13484-0.html国内多数AI模型训练使用的中文数据占比已超60%

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

蔚来 150 度电池包将于二季度上线,可提供 1055 公里超长续航
3 月 5 日消息,今日,伴随着财报的发布,蔚来宣布 150 度超长续航电池包即将在二季度上线。蔚来表示,作为国内乘用车量产最大容量的电池包,搭载该电池包的蔚来车型拥有最长 1,055 公里的续航里程。此前,蔚来 CEO 李斌
将可城可野 全新一代北京BJ30官图发布
3月6日,从北京汽车官方获取到了旗下轻越野SUV——BJ30车型官图。作为“悦旅”系列的首款车型,该车将搭载魔核混动、超级电四驱等配置。同时,该车已于此前完成申报,采用当下流行的“方盒子”造型,整体看上去硬朗且时尚
两会日程预告丨3月6日:审议和讨论政府工作报告 审查计划报告和预算报告
十四届全国人大二次会议各代表团6日全天举行代表小组会议。上午审议政府工作报告,下午审查计划报告和草案、预算报告和草案。全国政协十四届二次会议6日全天举行界别联组会议和小组会
南财对话|全国政协委员周厚立:发挥“侨”优势,探索“香港+汕头”风电合作路径
南方财经全媒体记者梁施婷今年汕头提出“工商并举”的发展思路,谋求在新一轮经济发展中抢得先机。全国政协委员、广东省工商联常委、中怡国际控股有限公司主席周厚立对此在今年全国两
或618马力 新款Model 3高性能版信息曝光
近日,海外社交媒体上疑似泄露了特斯拉Model 3高性能版车型的相关参数,可以看到,新车后电机将提升至412马力,综合最大功率将会达到612马力,续航预计430km左右。据悉,特斯拉或在近期公布高性能版车型的具体参数,同时有望正
理想汽车:风光背后,寒流袭来
理想汽车这段时间风光无限。2 月 26 日,理想汽车发布了 2023 年财报,全年实现营收 1238.5 亿元,净利润达到 118.1 亿,这是理想汽车自交付以来首次实现全年盈利,也成为国内首家年营收超千亿元的造车新势力。3 月 1

热点精选

最新推荐

您可能感兴趣