您现在的位置是：首页 > 人工智能AI > 正文

人工智能AI

Meta发布AI基准测试工具FACET，用于评估AI模型的“公平性”

1987web2023-09-22人工智能AI237

该基准测试可用于探测不同人口统计属性下的分类，检测实例分割和视觉基础模型。

站长之家(ChinaZ.com) 9月1日消息:Meta今天发布了一个新的AI基准测试，名为FACET，旨在评估在照片和视频中对人和物体进行分类和检测的AI模型的公平性。

FACET由32，000张包含50，000个人标签的图像组成，这些标签由人类注释者标注。除了与职业和活动相关的类别，如篮球运动员、DJ和医生，还包括人口统计和身体属性，使Meta能够对针对这些类别的偏见进行深度评估。

Meta在一篇与TechCrunch共享的博客文章中写道:通过发布FACET，我们的目标是让研究人员和从业者能够进行类似的基准测试，以更好地理解他们自己的模型中存在的偏见，并监控所采取的缓解措施对这些偏见的影响。我们鼓励研究人员使用FACET来评估其他视觉和多模态任务的公平性。

打开凤凰新闻，查看更多高清图片

注:图片由midjourney生成

当然，探测计算机视觉算法偏见的基准测试并不是什么新鲜事。Meta自己几年前就发布过一个基准测试，用于揭示计算机视觉和音频机器学习模型中的年龄、性别和肤色歧视。许多研究已经对计算机视觉模型进行了评估，以确定它们是否存在针对某些人群的偏见。

此外，事实上，Meta 在负责任的人工智能方面并没有最好的记录。去年年底，Meta不得不撤下一款AI演示，因为它编写了种族主义和不准确的科学文献。有报道称，该公司的AI伦理团队基本没有作用，而它发布的反AI偏见工具被形容为完全不足够。同时，学术界指责Meta加剧了其广告服务算法中的社会经济不平等，并在其自动审查系统中表现出对黑人用户的偏见。

但Meta声称FACET比之前所有的计算机视觉偏见基准测试都要深入——能够回答这样的问题:当被感知的性别表现具有更多传统男性特征时，模型是否在将人们分类为滑板运动员方面做得更好?以及当头发卷曲程度与直发相比时，任何偏见都会放大吗?

为了创建FACET，Meta让上述注释者为32，000张图像中的每张人物图像标注人口统计属性（例如图片中人物的感知性别表现和年龄组）、额外的身体属性(例如肤色、光线、纹身、头饰和眼镜、发型和面部毛发等)以及类别。他们将这些标签与其他来自Segment Anything1Billion的关于人、头发和服装的标签结合。Segment Anything1Billion是Meta设计的用于训练计算机视觉模型从图像中分割或隔离物体和动物的数据集。

Meta告诉我，FACET图像的来源是Segment Anything1Billion，而这些图像则从照片提供商处购买。但目前还不清楚图片中所描绘的人是否知道他们的图片将被用于这个目的。此外——至少在博客文章中——还不清楚Meta是如何招募注释者团队的，以及他们得到了多少工资。

从历史上看，甚至在今天，许多为AI培训和基准测试标注数据集的注释者来自发展中国家，收入远低于美国的最低工资标准。就在本周，《华盛顿邮报》报道，规模最大、融资最充足的注释公司之一Scale AI向工人支付的工资极低，经常拖欠或扣发工资，并为工人提供寻求救济的渠道很少。

在描述FACET如何诞生的白皮书中，Meta表示注释者是经过培训的专家，他们来自包括北美（美国）、拉丁美洲(哥伦比亚)、中东(埃及)、非洲(肯尼亚)、东南亚(菲律宾)和东亚(台湾)等多个地理区域。Meta表示，它使用了来自第三方供应商的专有注释平台，并按照每个国家一小时的工资标准向注释者提供报酬。

撇开FACET可能存在问题的出处不谈，Meta表示该基准测试可用于探测不同人口统计属性下的分类、检测、实例分割和视觉基础模型。

作为测试用例，Meta将其自己的DINOv2计算机视觉算法应用于FACET，该算法已于本周开始商业使用。Meta表示，DINOv2发现了几种偏见，包括对某些性别表现的人的偏见以及对典型地将女性照片识别为护士的可能性的偏见。

在博客文章中，Meta写道:DINOv2预训练数据集的准备过程可能无意中复制了为策展选择的参考数据集中的偏见。我们计划在未来的工作中解决这些潜在的不足之处，并相信基于图像的策展也可以帮助避免因使用搜索引擎或文本监督而产生的潜在偏见。

没有完美的基准测试。值得称赞的是，Meta承认FACET可能无法充分捕捉现实世界的概念和人口群体。它还指出，由于自FACET创建以来，许多职业形象可能已经发生了变化。例如，在COVID-19大流行期间拍摄的FACET中的大多数医生和护士都佩戴了比大流行前更多的个人防护装备。

在白皮书中，Meta写道:目前我们不打算更新此数据集。我们将允许用户标记任何可能令人反感的内容，并在发现时删除这些内容。

除了数据集本身外，Meta还提供了一个基于网络的数据集浏览器工具。要使用该工具和数据集，开发人员必须同意不将其用于训练计算机视觉模型——而只用于评估、测试和基准测试。

工作三年多，每个月拿着五六千块钱的工资，而且职位晋升也相对比较难。加上赶上疫情期间，停产停工，不工作就等于没有工资，对于没有什么积蓄的张某来说，内心非常的慌张。

看到大学同学毕业后没有着急工作，而是换了行业，直接学了AI工程师，疫情期间在家也一样工作，年纪轻轻年薪都40W了。张某内心羡慕不已，但换一个自己不懂的行业等于从头再来，如果继续做这份工作就感觉未来很迷茫。

痛定思痛，决定转行，但对AI行业一无所知，自学完全不可能，在同学的推荐下，来炅灵科技报名学习AI算法工程师，虽然没有基础，但好在年轻，也是本科学历，学习起来很容易上手。

炅灵科技是专注于培养AI人才的一家企业，有专业的一线大咖作为技术讲师，在技术方面一对一辅导;在职业素养方面也有专业的老师授课;学完有就业老师跟随指导。

6个月张某除了掌握了扎实的AI理论知识，技术得到真正的落地;还学习了项目管理和实施、团队协作和沟通能力，同时体能训练也没有落下，有了健康的体魄，成为企业需要的高素养高技术的复合型AI算法工程师。

95后年薪40W+，炅灵科技带你转型深度学习AI算法工程师

95后的张某，专业是食品工程，毕业后在一家食品公司做质检员，质检员并不是想象的在实验室工作，而是去到食品车间，每道工序都要检查，从卫生到食品质量，每一项都不能马

下一篇

不知道去哪找短视频素材？盘点国内国外好用的免费视频素材网站

短视频是指以新媒体为传播渠道，时长在5分钟以内的视频内容，其是继文字、图片、传统视频之后新兴的又一种内容传播载体。相较于传统视频，短视频行业主要存在三

人工智能AI

Meta发布AI基准测试工具FACET，用于评估AI模型的“公平性”

95后年薪40W+，炅灵科技带你转型深度学习AI算法工程师

不知道去哪找短视频素材？盘点国内国外好用的免费视频素材网站

相关文章