国内多数AI模型训练使用的中文数据占比已超60%

新华网
91次浏览

中文数据在国内AI大模型的训练性能提升方面发挥着重要作用。国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“在人工智能时代,Token,也就是大家通常所说的词元,是处理文本的最小数据单元,如同互联网时代大家所说的‘流量’。”刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,到今年6月底,日均Token消耗量已经突破30万亿,一年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

人工智能模型的训练也推动了数据交易需求的攀升。截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

下一步,国家数据局将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

中文数据在国内AI大模型的训练性能提升方面发挥着重要作用。国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“在人工智能时代,Token,也就是大家通常所说的词元,是处理文本的最小数据单元,如同互联网时代大家所说的‘流量’。”刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,到今年6月底,日均Token消耗量已经突破30万亿,一年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

人工智能模型的训练也推动了数据交易需求的攀升。截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

下一步,国家数据局将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。GuI速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-13484-0.html国内多数AI模型训练使用的中文数据占比已超60%

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

被迫停产 特斯拉柏林工厂遭环保组织纵火
近日,据海外媒体报道,周二凌晨(当地时间3月5日),环保活动人士涉嫌纵火袭击特斯拉德国工厂,导致工厂停电,被迫停产。  报道称,警方炸弹处理小组已达到现场。除了特斯拉格伦海德(Gruenheide)工厂,附近的其他一些地区也同时停
商务部:推动汽车、家电、家装等消费品以旧换新
3月6日,十四届全国人大二次会议于3月6日下午3时举行记者会。商务部部长王文涛在记者会上表示,今年要推动汽车、家电、家装等消费品以旧换新,还要提振服务消费。 王文涛提及,今年促消费有两个重点:一个是推动消费品以旧
将全面电气化 捷豹今年6月停产所有燃油车
近日,从海外媒体处获悉,捷豹将会在今年(2024年)6月份停产旗下所有燃油车,开启电气化转型之路,未来三年内,捷豹将会带来三款基于JEA(捷豹电动架构)打造的全新电动产品。其中,捷豹将会率先推出一款四座GT车型,今年亮相,2025年上
专访全国人大代表、天津市滨海新区区长单泽峰:把握新质生产力,加强与北京科技创新体系融合
21世纪经济报道记者周慧 实习生刘龙珠北京报道2024年是京津冀协同发展上升为国家战略十周年,2024年政府工作报告提出,支持京津冀、长三角、粤港澳大湾区等经济发展优势地区更好发挥高
国开行赵欢回应南财记者追问: 政策性业务和商业性业务分账正在进行
五菱和比亚迪同一天“出招”,抢滩纯电小车市场
  五菱和比亚迪同一天“出招”,抢滩纯电小车市场  五菱汽车和比亚迪选择在同一天加码纯电小型车市场。  3月6日,五菱汽车旗下五菱缤果PLUS正式上市,新车定位为A0级五门纯电SUV,为401km和510km两种续航,厂商指导价分

热点精选

最新推荐

您可能感兴趣