百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

量子位
293次浏览

花小成本用好大模型XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿token补贴,4月起免费!XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这次的羊毛来自清华系AI公司无问芯穹,企业与个人皆可薅~XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这家公司成立于2023年5月,目标是打造大模型软硬件一体化最佳算力解决方案。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

就在刚刚,它发布了基于多芯片算力底座的无穹Infini-AI大模型开发与服务平台,供开发者体验、对比各种模型和芯片效果。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

大模型浪潮涌起之后,有人调侃:XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

比起“造福人类”,大模型更应该先呼吁“给我场景”。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

然而,无问芯穹认为,经历了互联网时代的高速发展,中国市场并不缺应用场景。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大模型的落地难,症结在于行业内正在持续遭遇的算力难题XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

比起“给我场景”,更应该先呼吁“解决算力”。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而无问芯穹正在做的,就是这么一件事。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

让开发者花小成本、用好工具和充沛算力

今天,无问芯穹发布了基于多芯片算力底座的无穹Infini-AI大模型开发与服务平台XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

还宣布自3月31日起,正式开放全量注册,给所有实名注册的个人和企业用户提供百亿tokens免费配额XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

开发者可以在这个平台上体验、对比各种模型能力和芯片效果。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

通过简单拖、拽各种参数按钮的动作,就能精调出更贴合业务的大模型,并部署在无穹Infini-AI上;再以非常优惠的千tokens单价向用户提供服务。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

目前,无穹Infini-AI已支持了Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡,支持多模型与多芯片之间的软硬件联合优化和统一部署。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI,并获得细粒度定制化的按token计费方案。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“我们对模型品牌和芯片品牌的覆盖率还会持续提升,随着时间的推移,无穹Infini-AI的性价比优势会越来越突出。”无问芯穹联合创始人兼CEO夏立雪表示,未来,无穹Infini-AI还将支持更多模型与算力生态伙伴的产品上架,让更多大模型开发者能够“花小钱、用大池”,持续降低AI应用的落地成本。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

一个月前,同道猎聘在部分城市发布了AI驱动的数字人面试官产品,并且还有更多的AI功能正在筹备中。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这就是由无问芯穹提供的弹性算力使用方案,并在无问芯穹的平台上基于开源大模型微调而成。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

相比市面上的其他方案,实现了更高的推理加速,也大幅降低了新功能上线的成本。夏立雪表示,这一效果让无穹团队很有信心。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

因此,除了开放全量注册,也正式启动了大算力需求方的测试邀请,提供更具性价比的算力、且在算法和硬件上更有纵深的算力优化服务。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

那些遇到算力难题的企业

想在成熟场景中应用大模型的企业,找到了算力但不会用,无法做出差异化的产品实现业务升级。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

想创造AI-Native应用的企业,算力成本难负担,工具链也不好用,产品启动投产比不合理。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

自行训练模型的企业,随着业务的拓展,往往找不到也买不起所需体量的算力,业务运行成本过高。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

截至2023年年末,我国算力总规模达到每秒1.97万亿亿次浮点运算(197E FLOPs),位居全球第二,算力规模近5年年均增速近30%。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

如此增速,为何行业内仍然感到算力尤其难?XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

背后的原因是,AI行业发展恰逢工程师人才红利爆发,加速了我国大模型行业的蓬勃发展,需求端“嗷嗷待哺”,而市面上仍存在大量未被收集和充分利用的算力资源,缺少一种足够成体系的“大模型原生”商业模式,将算力供给转化为满足市场需求的产品和服务。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

算力性价比大幅提升,源自多芯片优化实力

“市面上有很多未被激活的有效算力,硬件本身差距在快速缩小,但大家在使用时总会遇到‘生态问题’。”夏立雪说,这是因为硬件的迭代速度总是比软件更慢、价格更高,软件开发者不希望工作中出现除自身研发工作之外的其他“变量”,因而总是会倾向于直接使用有成熟生态的芯片。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

无问芯穹希望帮助所有做大模型的团队“控制变量”,即在使用无问芯穹的算力服务时,用户不需要也不会感觉到底层算力的品牌差异。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

成立不足一年的无问芯穹,何以能够在这么短时间内跑通多种计算卡上的性能优化?XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

2022年底,大模型引发社会广泛关注后,夏立雪和他的导师汪玉认为,国内整体算力水平距离国际先进还有明显差距,光靠芯片工艺提升或是多元芯片的迭代已远远不够,需要建立一个大模型生态系统,让不同模型能自动部署到不同硬件上,让各种算力得到有效利用XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

一年后,无问芯穹宣布了在英伟达GPU和AMD等芯片上取得的优化效果,实现了大模型任务2-4倍的推理速度提升。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随后,AMD中国宣布与无问芯穹达成战略合作关系,双方将携手联合提高商用AI应用性能。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

两年之后,无问芯穹在发布会上展示了其在10种芯片上的性能优化数据,在每张卡上都显示已取得了目前行业内最优的性能优化效果。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“我们与各个模型、芯片伙伴都建立了强信任关系,”夏立雪表示,“一方面来自于我们面向大模型的计算优化实力,另一方面无问芯穹非常注重保护伙伴的数据安全。无问芯穹会持续保持中立性,并且也不会与客户产生利益冲突,这是我们业务开展的基础。”XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

做“大模型原生”的加速技术栈与系统

“Transformer统一了这一轮的模型结构,并且表现出持续取得应用突破的趋势。”汪玉在开场发言中说,“从前我们在AI1.0时代做上一家公司,只能做很小一部分AI任务。今时不同往日,大模型结构统一了,依靠生态建立起来的硬件壁垒正在‘变薄’。”XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

得益于世界范围内正涌起的AI浪潮,以及中国市场的独特机会,无问芯穹面对的是一次巨大的技术机遇。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Transformer在设计时天然基于并行计算架构,规模越大的大模型带来的智能效果越好,使用的人越多,其所需的计算量也越大。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

“无问芯穹正在做的是‘大模型原生’的加速技术栈。”无问芯穹的联合创始人兼CTO颜深根表示,大模型落地依赖算法、算力、数据,还有系统。算力决定了大模型的速度,设计优良的系统则能释放出更多硬件潜力。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

无问芯穹的团队曾搭建过数万片GPU级的大规模高性能AI计算平台,具备万卡纳管能力,并基于自运营集群成功搭建了云管系统,已实现跨域多云间的统一调度。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

One More Thing

“在端侧,人们则更加倾向于快速将大模型的能力落到人机交互的界面上,提升实用体验。”无问芯穹联合创始人兼首席科学家戴国浩认为,未来,凡是有算力的地方,都会有AGI级别的智能涌现。而每一个端上的智能来源,就是大模型专用处理器LPU。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

大模型处理器LPU可以提升大模型在各种端侧硬件上的能效与速度。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

戴国浩在发布会上向观众展示了“一张卡跑大模型”,其团队于今年1月初推出的全球首个基于FPGA的大模型处理器,通过大模型高效压缩的软硬件协同优化技术,使得LLaMA2-7B模型的FPGA部署成本从4块卡减少至1块卡,并且性价比与能效比均高于同等工艺GPU。未来,无问芯穹的端侧大模型专用处理器IP,可以被模块化地集成到各类端侧芯片中。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

“从云到端,我们要将软硬件一体联合优化进行到底。大幅降低大模型在各个场景中的落地成本,让更多好用的AI能力更好、更平价地走进更多人的生活。”戴国浩宣布,无穹LPU将于2025年面世。XP3速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4430-0.html百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

全国政协委员张云泉:“东数西算”枢纽节点需定期全面评估并据结果动态调整
21世纪经济报道 记者郑雪 北京报道算力是新型关键生产力,是国民经济发展的重要基础设施。相关数据显示,截至2023年8月,我国算力总规模达到1.97万亿亿次浮点运算(197EFLOPS),位居全球第二。
大力发展绿色低碳经济,碳市场今年将扩围丨解码政府工作报告
21世纪经济报道记者 李德尚玉 北京报道 3月5日,国务院总理李强在政府工作报告中提出,要加强生态文明建设,推进绿色低碳发展。深入践行绿水青山就是金山银山的理念,协同推进降碳、减污、
美国造车新势力大败退
  美国造车新势力大败退  几年前,美国造车新势力Rivian、Lucid和Fisker都曾风光无限,在投资者兴趣高涨的情况下,这些电动汽车制造商的市值一度有向特斯拉挑战的架势。而今天的情况却没那么乐观,2024年开年,造车新势力
南财对话|全国政协委员郭御风:加快培养集成电路的“新质劳动力”
南方财经全媒体记者梁施婷 北京报道在全球高科技争夺战中,集成电路相关技术和产业已成为“兵家必争之地”,中国摆脱高端芯片进口依赖愈发紧迫。锚定集成电路产业发展面临的人才紧缺
东风风行:豪华新能源MPV定名风行星海V9
近日,从官方获悉,东风风行豪华新能源MPV定名风行星海V9,将于4月开启预售。此前,该车在2023慕尼黑车展亮相,动力上搭载了1.5T发动机和电动机组成的混动系统。官方表示,风行星海V9将瞄准20-30万中高端MPV市场,以宜家宜商全
全国政协委员白重恩:中央财政仍有加杠杆的空间,应缓解地方财政压力和增加居民消费
21世纪经济报道记者 周潇枭 北京报道 政府工作报告指出,要强化宏观政策逆周期和跨周期调节,继续实施积极的财政政策和稳健的货币政策,加强政策工具创新和协调配合。积极的财政政策要适

热点精选

最新推荐

您可能感兴趣