0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

量子位
224次浏览

基于Llama架构W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

澜舟科技官宣:孟子3-13B大模型正式开源!W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

尤其在参数量20B以内的轻量化大模型领域,在中英文语言能力方面尤为突出,数学和编程能力也位于前列。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

据介绍,孟子3-13B大模型是基于Llama架构,数据集规模高达3T TokensW99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

语料精选自网页、百科、社交、媒体、新闻,以及高质量的开源数据集。通过在万亿tokens上进行多语言语料的继续训练,模型的中文能力突出并且兼顾多语言能力。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

孟子3-13B大模型开源

只需两步,就能使用孟子3-13B大模型了。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

首先进行环境配置。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

pip install -r requirements.txtW99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

然后快速开始。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer =W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
AutoTokenizer.from_pretrained(“Langboat/Mengzi3-13B-Base”, use_fast=False, trust_remote_code=True)
model =W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
AutoModelForCausalLM.from_pretrained(“Langboat/Mengzi3-13B-Base”, device_map=”auto”, trust_remote_code=True)
inputs = tokenizer(‘指令:回答以下问题。输入:介绍一下孟子。输出:’, return_tensors=’pt’)
if torch.cuda.is_available():
inputs = inputs.to(‘cuda’)
pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.01, eos_token_id=tokenizer.eos_token_id)
print(tokenizer.decode(pred[0], skip_special_tokens=True))W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

此外,他们还提供了一个样例代码,可用于基础模型进行单轮交互推理。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

cd examples
python examples/base_streaming_gen.py –model model_path –tokenizer tokenizer_pathW99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

如果想要进行模型微调,他们也提供了相关文件和代码。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

事实上,早在3月18日的澜舟大模型技术和产品发布会现场,就透露了孟子3-13B大模型的诸多细节。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

当时他们表示,孟子3-13B大模型训练已经完成。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

对于选择13B版本的原因,周明解释道:W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

首先,澜舟明确以服务ToB场景为主,ToC为辅。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

实践发现,ToB场景使用频率最高的大模型参数量多为7B、13B、40B、100B,整体集中在10B-100B之间。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

其次,在这个区间范围内,从ROI(投资回报率)角度来讲,既满足场景需求,又最具性价比。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

因此,在很长一段时间内,澜舟的目标都是在10B-100B参数规模范围内,打造优质的行业大模型。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

作为国内最早一批大模型创业团队,去年3月,澜舟就发布了孟子GPT V1(MChat)。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

今年1月,孟子大模型GPT V2(含孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码)对公众开放。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

好了,感兴趣的朋友可戳下方链接体验一下。W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

GitHub链接:W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
https://github.com/Langboat/Mengzi3W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
HuggingFace:W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
https://huggingface.co/Langboat/Mengzi3-13B-BaseW99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
ModelScope:W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
https://www.modelscope.cn/models/langboat/Mengzi3-13B-BaseW99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
Wisemodel:W99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
https://wisemodel.cn/models/Langboat/Mengzi3-13B-BaseW99速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4453-0.html0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

专访全国人大代表、中国工程院院士陈卫:聚焦区域产业发展需求,系统推进有组织科研
21世纪经济报道记者 孙燕 上海报道3月5日,国务院总理李强作政府工作报告时指出,坚持教育强国、科技强国、人才强国建设一体统筹推进,创新链产业链资金链人才链一体部署实施,深化教育科技
售价3880元 蔚来推流媒体后视镜选装服务
近日,从官方获悉,蔚来汽车针对ET5、ES6两款车型推出流媒体后视镜选装服务,售价为3880元,并且支持全积分支付(38800分),首批发售限量1000套,预计3月底陆续开始安装。  据悉,此次蔚来推出的流媒体后视镜采用原车线束替换式
农业农村部等七部门研究农资打假新举措,严打重处农资“忽悠团”
当前正值春耕备耕关键时期,党中央、国务院高度重视农资质量问题,要求严格整治不合格产品,严厉打击制售假冒伪劣行为,净化农资市场,维护农民权益。近日,农业农村部、最高人民法院、最高人民
MEGA被网友“P图”为殡仪车,理想汽车发函称侵犯名誉权
  MEGA被网友“P图”为殡仪车,理想汽车发函称侵犯名誉权  理想汽车旗下MEGA推向市场后因其外观陷入舆论漩涡。  近日,一名汽车博主在网络上曝出一则理想汽车向某平台投诉的通知函。该通知函显示,2024年3月2日,今日
全球游戏开发者大会 2024 定档 3 月 18 日召开,微软英伟达腾讯网易等厂商参会
3 月 11 日消息,据全球游戏开发者大会官网消息,全球游戏开发者大会2024(Game Developers Conference 2024)将于北京时间 3 月 18 日至 3 月 22 日在旧金山召开。据介绍,本次大会以“AI”为关键词,官方将围绕相关话
消息称华为与北汽合作打造的“享界”首款车型 6 月发布,月销目标 1 万辆
3 月 10 日消息,据第一财经报道,日前一份关于北汽蓝谷的交流纪要显示,北汽蓝谷与华为合作的“享界”首款产品即将在北京车展亮相,6 月份发布。该车定位为行政轿车,内部定价 30 万~50 万元,享界后续车型规划包括但不

热点精选

最新推荐

您可能感兴趣