首页 > 营销学院 > IT资讯

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

常用的优化语义分割模型的损失函数包括soft jaccard损失、soft dice损失和soft tversky损失。然而，这些损失函数与软标签不兼容，因此无法支持一些重要的训练技术，比如标签平滑、知识蒸馏、半监督学习和多标注员等。这些训练技术对于提高语义分割模型的性能和鲁棒性非常重要，因此需要进一步研究和优化损失函数，以支持这些训练技术的应用。

Machine Translation

聚合多个来源的AI翻译

49 查看详情 Machine Translation

另一方面，常用的语义分割评价指标包括mAcc和mIoU。然而，这些指标会对尺寸较大的物体有偏好，从而严重影响模型的安全性能评估。

为了解决这些问题，研究人员在鲁汶大学和清华首先提出了JDT损失。JDT损失是对原有损失函数的微调，它包括了Jaccard Metric损失、Dice Semimetric损失和Compatible Tversky损失。JDT损失在处理硬标签时与原有的损失函数相等，同时也能完全适用于软标签。这一改进使得模型的训练更加准确和稳定。

研究人员在四个重要场景中成功应用了JDT损失：标签平滑、知识蒸馏、半监督学习和多标注员。这些应用展示了JDT损失对于提高模型准确性和校准性的能力。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

论文链接：https://arxiv.org/pdf/2302.05666.pdf

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

论文链接：https://arxiv.org/pdf/2303.16296.pdf

除此之外，研究人员还提出了细粒度的评价指标。这些细粒度的评价指标对大尺寸物体的偏见较小，能提供更丰富的统计信息，并能为模型和数据集审计提供有价值的见解。

并且，研究人员进行了一项广泛的基准研究，强调了不应基于单个指标进行评估的必要性，并发现了神经网络结构和JDT损失对优化细粒度指标的重要作用。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

论文链接：https://arxiv.org/pdf/2310.19252.pdf

代码链接：https://github.com/zifuwanggg/JDTLosses

现有的损失函数

由于Jaccard Index和Dice Score是定义在集合上的，所以并不可导。为了使它们可导，目前常见的做法有两种：一种是利用集合和相应向量的Lp模之间的关系，例如Soft Jaccard损失（SJL），Soft Dice损失（SDL）和Soft Tversky损失（STL）。

它们把集合的大小写成相应向量的L1模，把两个集合的交集写成两个相应向量的内积。另一种则是利用Jaccard Index的submodular性质，在集合函数上做Lovasz拓展，例如Lovasz-Softmax损失（LSL）。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

这些损失函数都假定神经网络的输出x是一个连续的向量，而标签y则是一个离散的二值向量。如果标签为软标签，即y不再是一个离散的二值向量，而是一个连续向量时，这些损失函数就不再兼容。

以SJL为例，考虑一个简单的单像素情况：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

可以发现，对于任意的y > 0，SJL都将在x = 1时最小化，而在x = 0时最大化。因为一个损失函数应该在x = y时最小化，所以这显然是不合理的。

与软标签兼容的损失函数

为了使原有的损失函数与软标签兼容，需要在计算两个集合的交集和并集时，引入两个集合的对称差：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

注意两个集合的对称差可以写成两个相应向量的差的L1模：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

把以上综合起来，我们提出了JDT损失。它们分别是SJL的变体Jaccard Metric损失（JML），SDL的变体Dice Semimetric 损失（DML）以及STL的变体Compatible Tversky损失（CTL）。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

JDT损失的性质

我们证明了JDT损失有着以下的一些性质。

性质1：JML是一个metric，DML是一个semimetric。

性质2：当y为硬标签时，JML与SJL等价，DML与SDL等价，CTL与STL等价。

性质3：当y为软标签时，JML，DML，CTL都与软标签兼容，即x = y ó f(x，y) = 0。

由于性质1，它们也因此被称为Jaccard Metric损失和Dice Semimetric损失。性质2说明在仅用硬标签进行训练的一般场景下，JDT损失可以直接用来替代现有的损失函数，而不会引起任何的改变。

如何使用JDT损失

我们进行了大量的实验，总结出了使用JDT损失的一些注意事项。

注意1：根据评价指标选择相应的损失函数。如果评价指标是Jaccard Index，那么应该选择JML；如果评价指标是Dice Score，那么应该选择DML；如果想给予假阳性和假阴性不同的权重，那么应该选择CTL。其次，在优化细粒度的评价指标时，JDT损失也应做相应的更改。

注意2：结合JDT损失和像素级的损失函数（例如Cross Entropy损失，Focal损失）。本文发现0.25CE + 0.75JDT一般是一个不错的选择。

注意3：最好采用一个较短的epoch来训练。加上JDT损失后，一般只需要Cross Entropy损失训练时一半的epoch。

注意4：在多个GPU上进行分布式训练时，如果GPU之间没有额外的通信，JDT损失会错误的优化细粒度的评价指标，从而导致其在传统的mIoU上效果变差。

注意5：在极端的类别不平衡的数据集上进行训练时，需注意JDL损失是在每个类别上分别求损失再取平均，这可能会使训练变得不稳定。

实验结果

实验证明，与Cross Entropy损失的基准相比，在用硬标签训练时，加上JDT损失可以有效提高模型的准确性。引入软标签后，可以进一步提高模型的准确性和校准性。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

只需在训练时加入JDT损失项，本文取得了语义分割上的知识蒸馏，半监督学习和多标注员的SOTA。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

现有的评价指标

语义分割是一个像素级别的分类任务，因此可以计算每个像素的准确率：overall pixel-wise accuracy（Acc）。但因为Acc会偏向于多数类，所以PASCAL VOC 2007采用了分别计算每个类别的像素准确率再取平均的评价指标：mean pixel-wise accuracy（mAcc）。

但由于mAcc不会考虑假阳性，从PASCAL VOC 2008之后，就一直采用平均交并比（per-dataset mIoU, mIoUD）来作为评价指标。PASCAL VOC是最早的引入了语义分割任务的数据集，它使用的评价指标也因此被之后的各个数据集所广泛采用。

具体来说，IoU可以写成：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

为了计算mIoUD，我们首先需要对每一个类别c统计其在整个数据集上所有I张照片的true positive（真阳性，TP），false positive（假阳性，FP）和false negative（假阴性，FN）：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

有了每个类别的数值之后，我们按类别取平均，从而消除对多数类的偏好：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

因为mIoUD把整个数据集上所有像素的TP，FP和FN合计在一起，它会不可避免的偏向于那些大尺寸的物体。

在一些对安全要求较高的应用场景中，例如自动驾驶和医疗图像，经常会存在一些尺寸小但是不可忽略的物体。

如下图所示，不同照片上的汽车的大小有着明显的不同。因此，mIoUD对大尺寸物体的偏好会严重的影响其对模型安全性能的评估。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

细粒度的评价指标

为了解决mIoUD的问题，我们提出细粒度的评价指标。这些指标在每张照片上分别计算IoU，从而能有效的降低对大尺寸物体的偏好。

mIoUI

对每一个类别c，我们在每一张照片i上分别计算一个IoU：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

接着，对每一张照片i，我们把这张照片上出现过的所有类别进行平均：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

最后，我们把所有照片的数值再进行平均：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

mIoUC

类似的，在计算出每个类别c在每一张照片i上的IoU之后，我们可以把每一个类别c出现过的所有照片进行平均：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

最后，把所有类别的数值再进行平均：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

由于不是所有的类别都会出现在所有的照片上，所以对于一些类别和照片的组合，会出现NULL值，如下图所示。计算mIoUI时先对类别取平均再对照片取平均，而计算mIoUC时先对照片取平均再对类别取平均。

这样的结果是mIoUI可能会偏向那些出现得很频繁的类别（例如下图的C1），而这一般是不好的。但另一方面，在计算mIoUI时，因为每张照片都有一个IoU数值，这能帮助我们对模型和数据集进行一些审计和分析。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

最差情况的评价指标

对于一些很注重安全的应用场景，我们很多时候更关心的是最差情况的分割质量，而细粒度指标的一个好处就是能计算相应的最差情况指标。我们以mIoUC为例，类似的方法也可以计算mIoUI相应的最差情况指标。

对于每一个类别c，我们首先把其出现过的所有照片（假设有Ic个这样的照片）的IoU数值进行升序排序。接着，我们设q为一个很小的数字，例如1或者5。然后，我们仅用排序好的前Ic * q%张照片来计算最后的数值：

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

有了每个类c的数值之后，我们可以像之前那样按类别取平均，从而得到mIoUC的最差情况指标。

实验结果

我们在12个数据集上训练了15个模型，发现了如下的一些现象。

现象1：没有一个模型在所有的评价指标上都能取得最好的效果。每个评价指标都有着不同的侧重点，因此我们需要同时考虑多个评价指标来进行综合的评估。

现象2：一些数据集上存在部分照片使得几乎所有的模型都取得一个很低的IoU数值。这一方面是因为这些照片本身就很有挑战性，例如一些很小的物体和强烈的明暗对比，另一方面也是因为这些照片的标签存在问题。因此，细粒度的评价指标能帮助我们进行模型审计（发现模型会犯错的场景）和数据集审计（发现错误的标签）。

现象3：神经网络的结构对优化细粒度的评价指标有着至关重要的作用。一方面，由ASPP（被DeepLabV3和DeepLabV3+采用）等结构所带来的感受野的提升能帮助模型识别出大尺寸的物体，从而能有效提高mIoUD的数值；另一方面，encoder和decoder之间的长连接（被UNet和DeepLabV3+采用）能使模型识别出小尺寸的物体，从而提高细粒度评价指标的数值。

现象4：最差情况指标的数值远远低于相应的平均指标的数值。下表展示了DeepLabV3-ResNet101在多个数据集上的mIoUC和相应的最差情况指标的数值。一个值得以后考虑的问题是，我们应该如何设计神经网络结构和优化方法来提高模型在最差情况指标下的表现？

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

现象5：损失函数对优化细粒度的评价指标有着至关重要的作用。与Cross Entropy损失的基准相比，如下表的（0，0，0）所示，当评价指标变得细粒度，使用相应的损失函数能极大的提升模型在细粒度评价指标上的性能。例如，在ADE20K上，JML和Cross Entropy损失的mIoUC的差别会大于7%。

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法图片

未来工作

我们只考虑了JDT损失作为语义分割上的损失函数，但它们也可以应用在其他的任务上，例如传统的分类任务。

其次，JDT损失只被用在标签空间中，但我们认为它们能被用于最小化任意两个向量在特征空间上的距离，例如用来替代Lp模和cosine距离。

参考资料：

https://arxiv.org/pdf/2302.05666.pdf

https://arxiv.org/pdf/2303.16296.pdf

https://arxiv.org/pdf/2310.19252.pdf

以上就是三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法的详细内容，更多请关注其它相关文章！

# 中国 # 娄底seo优化找哪家 # 衡水百度营销推广专员 # 推广一个网站需要什么 # 医院网站优化照片 # 三门峡企业推广营销平台 # 桓台网站建设与维护 # 抖音seo搜索厂家排名 # 禄劝网站建设哪家不错 # 包河网络营销策划推广 # 文成网站建设推广 # 提出了 # 指标 # 这一 # 多个 # 细粒度 # 是一个 # 评价指标 # 三篇 # 清华 # 牛津 # deepl # 语义分割 # 损失函数

相关栏目：【 Google疑问12 】【 Facebook疑问10 】【优化推广96088 】【技术知识133117 】【 IDC资讯59369 】【网络运营7196 】【 IT资讯61894 】

2024-02-06

Notion AI怎么写笔记 Notion AI辅助写作及自动摘要生成技巧【教学】 AI一键生成高质量论文大纲 Claude帮你改写和润色文章 Claude写作风格优化技巧怎么用ai创作绘本 AI儿童故事与插画自动生成【秘籍】去哪旅行ai抢票助手怎么查看抢票历史_去哪旅行ai抢票助手历史记录查询与筛选【教程】如何用AI一键去除图片背景？AI自动抠图去底最强工具【实测】 DeepSeek数学建模应用指南 DeepSeek解决复杂问题技巧如何用AI一键扩图补全背景？Photoshop AI生成填充使用技巧【教程】 DeepSeek辅助撰写技术文档方法 DeepSeek开发者必备技巧文心一言官方网站在线入口文心一言在线版使用地址 Kimi国内访问入口_Kimi智能助手网页版链接直达如何用AI生成室内设计效果图？AI装修设计灵感生成指南【教程】 AI一键生成社交媒体自动回复蚂蚁阿福官网网页版入口_电脑端使用医保与健康服务如何用AI一键去视频水印 AI视频无痕去水印软件使用方法【教程】 Claude帮你解读晦涩的学术理论 Claude知识学习助手 Jasper AI怎么写社交媒体帖子 Jasper AI社媒内容创作【攻略】 DeepSeek长代码项目理解与分析 DeepSeek代码库学习方法 DeepSeek进行科学计算教程 DeepSeek物理建模与* AI一键生成短视频分镜头脚本

了解您产品搜索量及市场趋势，制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求，1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商，作为谷歌推广与Facebook广告全球合作伙伴，聚焦外贸企业出海痛点，以数字化营销为核心，提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持，打破传统外贸获客壁垒，助力企业高效开拓全球市场，成为中小企业出海的可靠合作伙伴。