Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

量子位
326次浏览

网友:Openx0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

GPT-4真的被反超了!x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

连小杯Haiku也跻身第二梯队,超过了GPT-4-0613这个型号,把GPT-3.5-turbo远远甩在身后。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

Haiku的输入token价格,可是比GPT-3.5-turbo还便宜了一半,输出方面,每100万token也比GPT-3.5-turbo便宜近2块钱。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

跟GPT-4相比,价格更是只有1/20。并且Haiku同样支持200k上下文。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

难怪有开发者直言:x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

而在Claude 3加入竞技之前,GPT-4家族已经霸榜快一年了。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

给新来的朋友补充一下背景知识:大模型竞技场榜单(LMSYS Chatbot Arena Leaderboard)的评分标准是人类打分,同一个问题同时抛给A、B两个模型,人类裁判觉得哪个回答得好就给哪个投票。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

小杯Haiku成开发者新宠

值得一提的是,在竞技场官方贺电中,Haiku这个型号也被专门高亮了出来:x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

具体有多快,已经有网友做了个直观的对比:x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

博尔特还没跑完100米,Haiku已经读完100k token的文档了……x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

事实上,凭借其超高的性价比,在开发者社群中,Claude 3小杯Haiku确已成新宠。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

已经有人第一时间大开脑洞,搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目,吸引不少关注。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

简单来说,就是让Opus给Haiku当老师x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

先用Opus生成执行任务的范例,再用这些教学案例来提高Haiku的姿势水平。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

划重点:Haiku的价格仅为Opus的1/60,而响应速度则是Opus的10倍。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

还是这位马特老哥,还用Opus和Haiku搞了个“AI股票分析师”,直接火上了GitHub热榜。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

△就说快不快吧x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

不过,就在一片给Claude 3新王点赞的声音中,也有网友认为:x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

但最让开发者们期待的当然还是:x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

OpenAI,快起来卷(doge)。x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Claude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

— 完 —x0j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4324-0.htmlClaude 3反超GPT-4竞技场登顶!小杯Haiku成开发者新宠:性价比无敌

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

奔驰与宝马合资公司正式落户北京朝阳区
3月4日,梅赛德斯-奔驰与宝马合资成立的北京逸安启新能源科技有限公司正式落户北京朝阳,将在中国市场运营超级充电网络。以北京朝阳为起点,双方将进一步拓展在中国市场的超级充电网络布局,以满足国内客户对充电服务日
南财对话|全国政协委员连玉明:打造数据要素“三级市场”,加快构建数据资产核算和入表制度
21世纪经济报道 记者郑雪 张雅婷 北京、广州报道“只有政府‘看得见的手’与市场‘看不见的手’形成合力并实现平衡,才能稳妥、有效地促进数据要素市场持续健康发展。”2024年全国两
起草组负责人解读政府工作报告:促消费稳增长,今年更加注重统筹扩大内需和深化供给侧结构性改革|解码政府工作报告
21世纪经济报道记者 李莎 北京报道 2024年3月5日,国新办举行吹风会,对政府工作报告进行解读。政府工作报告将今年经济增长目标定为5%左右,城镇新增就业目标1200万人以上,城镇调查失业率5
马斯克预言要完的新势力 Rivian,新车 R2 一开售,网页就崩了
一款“方盒子”,今天在北美引起热议。Rivian R2 开启预售,车长和 Model Y 相近,动力比 Model Y 更猛,卖得比 Model Y 还贵。配备 11 个摄像头和 5 个雷达,目标实现 L3 级自动驾驶。但是新车交付时间,能不能早于马斯
真末日座驾?这款特斯拉 Cybertruck 车罩可防电磁脉冲
3 月 10 日消息,特斯拉首席执行官埃隆・马斯克 (Elon Musk) 曾将自家的 Cybertruck 电动皮卡称为“终极末日座驾”,虽然当时许多人认为这只是玩笑话,但一些公司却当真了。近日,Mission Darkness 公司发布了一款专
将新增插混版本 全系别克GL8清晰谍照
近日,从相关渠道得到了一组全新别克GL8的清晰测试谍照,为我们提前揭秘新一代车型的样貌,据悉,新一代GL8除了纯燃油版,还有望推出插混版本,将与腾势D9等中国品牌MPV展开竞争。『全新别克GL8谍照』  外观方面,全新别克GL

热点精选

最新推荐

您可能感兴趣