热搜: 佳士科技irobot开云电竞官网下载app机器人机器人产业联盟ABB发那科机械手码垛机器人机器人展览

北京智源推出通用视觉 AI 模型 SegGPT:可自动追踪并分割影音中的物体

日期:2023-06-01 来源:IT之家 评论:0
标签: AI 科技 创新
  IT之家5月31日消息,在2023年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型SegGPT(Segment Everything In Contex)。

c18fe94d-1d39-42b3-aead-d9c0744ac2f5
▲图源Arxiv
  据称,SegGPT模型是智源通用视觉模型Painter的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和 视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词(prom pt)完成分割任务。
  SegGPT也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动 视频分割,并且可以用掩码的颜色作为物体的ID,进行自动追踪。
  IT之家经过查询知悉,此前me ta也发布了其基于AI的Segment Anything Model(SAM)模型,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出SEEM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。IT之家的小伙伴们可以从这里访问模型的论文链接。
声明:凡开云电子链接 来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与开云客户(www.www.wykobounce.com)联系,本网站将迅速给您回应并做处理。
电话:021-39553798-8007
更多> 相关开云电子链接
0 相关评论

推荐图文
推荐开云电子链接
点击排行
Baidu
map