吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

量子位
341次浏览

连黑客帝国的子弹都能数清楚N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

还记得黑客帝国经典的子弹时间吗?N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

IDEA研究院最新检测模型T-Rex2,可以齐刷刷给全部识别出来~N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

而面对难倒一众大模型「吉娃娃or松饼」的难题,它只需被投喂一张吉娃娃的照片,就能瞬间迎刃而解。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

此前,也是同样的团队,推出了基于视觉提示的检测模型T-Rex。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

如今,他们将视觉和文本提示融合,相互弥补各自的缺陷,实现了更强的目标检测能力。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

并且与多目标跟踪模型结合后,各种视频检测任务也不在话下。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

来看新研究到底说了什么。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

打通文本和视觉提示

在开集目标检测领域,尽管文本提示受到一定的青睐,但也存在一定的局限性。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

比如长尾数据短缺。稀有或者全新的物体类别的数据稀缺可能会削弱其学习效率。还有描述上的局限性,对于一些难以用语言描绘的对象,因受限于无法精确描述,也会削弱效果。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

而视觉提示提供了更直观且直接的对象表示方法,但在捕捉常见对象的概念时效果就会很差。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

T-Rex2通过对比学习在单个模型中整合两种提示,因此接受多种格式的输入,包括文本提示、视觉提示以及两者的组合。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

在不同场景中,它可以通过在两种提示方式之间切换来处理。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

因此,它大致有三种工作模式:N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

文本提示模式、交互式视觉提示模式、通用视觉提示模式。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

以通用视觉提示模式为例,用户可以通过向模型提供任意数量的示例图片,来自定义特定对象的视觉嵌入,然后使用这个嵌入来检测任意图像中的对象。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

也就是不需要用户与模型直接互动,就能完成检测任务。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

最终在在四个学术基准测试集 COCO, LVIS, ODinW, 和Roboflow100 上取得了 Zero-Shot SOTA的性能。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

开箱即用诸多领域

无需重新训练或微调,T-Rex2即可检测模型在训练阶段从未见过的物体。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该模型不仅可应用于包括计数在内的所有检测类任务,还为智能交互标注领域提供新的解决方案。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

除此之外,结合现有的多目标跟踪模型( 如ByteTrack ),T-Rex2还可用于视频检测任务。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

事实上,这种跨图检测能力,让目标检测技术在生产生活中可以真正开始广泛应用。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

比如工业生产流水线器件检测,交通航运领域的船舶、飞机检测,农业领域的农作物、果蔬检测,生物医学领域的细胞、组织检测,物流领域的货物检测,环境领域的野生动物监测等。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

现在,T-Rex2让通用物体检测又迈出了新的一步。N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

试玩链接:N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
https://deepdataspace.com/playground/ivpN6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
T-Rex2 API:https://github.com/IDEA-Research/T-RexN6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
论文链接:N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM
https://arxiv.org/abs/2403.14610N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

— 完 —N6t速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-2-4433-0.html吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

国资委:将对三家中央车企进行单独考核
3月5日,十四届全国人大二次会议首场“部长通道”在人民大会堂举行。国务院国有资产监督管理委员会党委书记、主任张玉卓受邀接受采访时表示,今年中央企业将聚焦“高”“质”“量”发展, 加快推进中央企业高水平的协
江淮华为工厂项目公示:年产量超20万
近日, 安徽省生态环境厅受理公示了江淮年产20万辆中高端智能纯电动乘用车建设项目环境影响报告书。据报告书显示,该工厂将投资39.805亿元。按照产销预测,未来5年,江淮乘用车销量将超50万辆,其中新增的DE和X6平台产品将
将于3月11日全国交付 理想MEGA正式下线
2024年3月4日,理想汽车首款纯电动MPV——理想MEGA,在理想汽车北京绿色智能制造基地正式下线,并将在3月11日开启全国交付。该车已于3月1日正式上市,售价为55.98万元。作为理想的旗舰产品,这款车自曝光便获得了极高的关
2025日内瓦车展:计划2025年2月17日开幕
当地时间3月4日,日内瓦车展主办方官方宣布,2025年日内瓦车展计划于2025年2月举办,日期为2025年2月17日至23日,主办方称2024年日内瓦国际车展是成功和充满希望的新起点。  2024年日内瓦车展是自2019年停办以来的重要
全国政协委员陈伟志:规范学校办学,把课间十分钟还给学生
21世纪经济报道记者王峰 北京报道 当前,不少中小学“课间十分钟消失”,十分不利于学生身心健康发展。全国政协委员、民革中央委员、上海新纪元教育集团董事长陈伟志发现,从现实情况看,
采用纯视觉智驾 极越获L3自动驾驶测试牌照
近日,极越获颁中国光谷首张L3自动驾驶测试牌照,可在指定区域开展有条件的自动驾驶道路测试。极越将持续提升智能驾驶研发的创新力和硬实力,同时也将助力武汉市在智能驾驶领域的发展和示范应用的落地。  2023年1月,

热点精选

最新推荐

您可能感兴趣