据悉,Semantic-SAM基于Mask DINO框架进行开发,其模型结构主要改进在decoder部分,同时支持通用分割和交互式分割。
研究团队通过采用解耦的物体分类和部件分类方法,学习物体和部件的语义信息,从而实现了多粒度分割任务和交互分割任务的优化。实验结果表明,Semantic-SAM在分割质量和粒度可控性方面优于me
ta的SAM模型。
该项目目前已经在GitHub中发布,论文也同时上传至ArXiv中,有兴趣的IT之家小伙伴们可以前往查看。