国内多数AI模型训练使用的中文数据占比已超60%

新华网
56次浏览

中文数据在国内AI大模型的训练性能提升方面发挥着重要作用。国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“在人工智能时代,Token,也就是大家通常所说的词元,是处理文本的最小数据单元,如同互联网时代大家所说的‘流量’。”刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,到今年6月底,日均Token消耗量已经突破30万亿,一年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

人工智能模型的训练也推动了数据交易需求的攀升。截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

下一步,国家数据局将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

中文数据在国内AI大模型的训练性能提升方面发挥着重要作用。国家数据局近日发布的数据显示,目前国内多数AI模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

国家数据局局长刘烈宏表示,我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。作为人工智能发展的核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,高质量数据集的建设至关重要。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“在人工智能时代,Token,也就是大家通常所说的词元,是处理文本的最小数据单元,如同互联网时代大家所说的‘流量’。”刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,到今年6月底,日均Token消耗量已经突破30万亿,一年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据介绍,截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片),400PB的总量相当于中国国家图书馆数字资源总量的140倍左右。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

人工智能模型的训练也推动了数据交易需求的攀升。截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

下一步,国家数据局将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地,推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。LsZ速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-13484-0.html国内多数AI模型训练使用的中文数据占比已超60%

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

国资委:将对三家中央车企进行单独考核
3月5日,十四届全国人大二次会议首场“部长通道”在人民大会堂举行。国务院国有资产监督管理委员会党委书记、主任张玉卓受邀接受采访时表示,今年中央企业将聚焦“高”“质”“量”发展, 加快推进中央企业高水平的协
吉利几何 E 萤火虫 301KM 龙腾版 5.98 万元,号称“电比电低”
3 月 7 日消息,吉利今日再次推出龙腾版车型,几何 E 萤火虫 301KM 龙腾版 5.98 万元,号称“电比电低”,首款 300 公里 5 万级纯电 SUV。作为参考,几何 E 萤火虫长宽高分别为 4006*1765*1550mm,轴距为 2485mm,301KM 流
国家发改委:汽车等以旧换新能创造万亿市场
十四届全国人大二次会议3月6日举行记者会,国家发展和改革委员会主任郑栅洁回答记者提问时表示,推动大规模设备更新和消费品以旧换新,是党中央、国务院着眼于高质量发展大局作出的重大部署,既能促进消费、拉动投资,也能
将全面电气化 捷豹今年6月停产所有燃油车
近日,从海外媒体处获悉,捷豹将会在今年(2024年)6月份停产旗下所有燃油车,开启电气化转型之路,未来三年内,捷豹将会带来三款基于JEA(捷豹电动架构)打造的全新电动产品。其中,捷豹将会率先推出一款四座GT车型,今年亮相,2025年上
也有彩电、大沙发,零跑中大型 SUV 新车 C16 外观及内饰谍照曝光
3 月 8 日消息,近日,多名博主陆续晒出了零跑旗下中大型 SUV 新车 C16 的谍照。根据爆料消息,新车将是零跑品牌首次使用 800V 架构,定位为大 6 座旗舰 SUV,号称“四叶草 + LEAP 3.0 架构的完全体”。新车外观覆盖伪
五菱扬光新能源商用车正式上市:首搭红 1 号电池,7.18 万元起
3 月 11 日消息,据“五菱汽车”官方公众号,五菱扬光车型今日正式上市,该车号称“全新一代超大空间新能源商用车”,整理该车规格售价信息如下:230KM 实用性:7.18 万元 300KM 实用性:7.98 万元 300KM 舒适性:8.38 万元

热点精选

最新推荐

您可能感兴趣