北京智源推出通用视觉 AI 模型 SegGPT：可自动追踪并分割影音中的物体

日期：2023-06-01 来源：IT之家评论：0

标签： AI 科技创新

　　IT之家5月31日消息，在2023年中关村论坛人工智能大模型发展论坛中，北京智源人工智能研究院推出了旗下通用分割模型SegGPT（Segment Everything In Contex）。

▲图源Arxiv

　　据称，SegGPT模型是智源通用视觉模型Painter的衍生模型，具备上下文推理能力，在训练完成后只需要提供示例即可推理并完成对应分割任务，包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等，都可以利用视觉提示词（prom pt）完成分割任务。

　　SegGPT也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割，并且可以用掩码的颜色作为物体的ID，进行自动追踪。

　　IT之家经过查询知悉，此前me ta也发布了其基于AI的Segment Anything Model（SAM）模型，具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出SEEM模型，通过不同的视觉提示和语言提示，一键分割图像、视频。IT之家的小伙伴们可以从这里访问模型的论文链接。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 腾讯音乐注册多款“文曲大模型”商标，未来有望	• 鸿海董事长刘扬伟：鸿海 AI 服务器搭载英伟达芯
• AI 胡编乱造怎么办，OpenAI 称找到解决“幻觉”	• TM AI Cobot 25S亮相美国Automate展会
• 2023中关村论坛｜机器人：走出虚拟世界	• 中关村论坛大咖谈：年轻人要做好准备应对未来人
• 撼讯重启经典品牌 Sparkle 加入英特尔显卡阵营	• 揭秘英伟达万亿市值：黄仁勋在“AI 寒冬”逆势
• 欧盟官员将于 6 月会见 OpenAI CEO：讨论人工智	• 推特打击 AI 虚假图片，将对图片添加由用户生成

恰佩克奖	机器人高峰论坛	机气林	ITES深圳工业展	机器人研究院	API数据	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会