1. 今日日报首页
  2. 今日话题

Syntherated推出了一个免费工具用于识别和删除有偏差的数据

人工智能初创公司Synthesized Ltd. 今天推出了一种工具,供公司检测和消除其用于AI项目的数据中的偏差。

Syntherated推出了一个免费工具用于识别和删除有偏差的数据

当涉及到AI模型时,数据偏差是一个大问题,通常使用大量数据集进行训练。它是一种错误,其中数据集的某些元素比其他元素具有更大的权重或表示能力。有偏见的数据集不能准确地表示模型的用例,从而导致结果偏斜,准确性水平较低和分析错误。

为了确保准确性,用于AI模型的训练数据必须更能代表现实世界。这很重要,因为这些数据实质上是机器学习如何完成其​​工作的方式。

Synthesized的新社区版偏见缓解工具旨在了解有关上下文偏见的各种法律和法规定义,这些偏见可能会导致性别,年龄,种族,宗教,性取向等属性的数据不准确。

该平台还能够通过其称为重新平衡的过程自动消除其发现的偏差。

Synthesized平台依赖于专有算法,该算法可以发现并消除数据中的偏差。一旦识别出偏差数据,它就会对原始的偏差数据集进行随机更改,以创建一个完全合成但没有偏差的数据集,可用于更准确地训练AI模型。

该公司表示:“随着合成数据的生成,Synthesized的平台使用户能够在数据集中平均分配所有属性,从而消除偏差并完全重新平衡数据集。” “用户还可以手动更改数据集内的单个数据属性(例如性别),从而提供对重新平衡过程的精细控制。”

要使用Synthesized的工具,所有用户要做的就是在其网站上注册并上传结构化数据文件(例如Excel电子表格)以开始分析过程。也可以将Synthesized的工具连接到托管在Amazon Web Services,Microsoft Azure,Oracle或Google Cloud Platform上的关系数据库服务,并构建用于分析的自定义数据集。完成分析后,Syntherated然后提供综合总公平性得分,该得分显示数据集中包含偏差数据的百分比,并突出显示检测到偏差的数据区域。

Syntherated表示,其工具能够分析几乎所有种类的数据集,包括用于创建信用等级的财务数据,用于评估索赔的保险数据以及人力资源数据,以便在招聘过程中识别偏见。

免费的Bias Mitigation工具是Synthesized更广泛的数据准备平台的一部分。该公司提供了一套完整的基于AI的工具,可自动执行数据供应和数据准备,同时还确保遵守法规。

Synthesized的创始人兼首席执行官Nicolai Baldin博士说:“由于数据偏颇,所有组织的声誉风险都受到威胁,我们已经看到这种容忍度将不再受到任何容忍。” “ Synthesized的缓解偏见社区版是专门为理解,调查和消除数据偏差而创建的首批产品之一。”

原创文章,作者:rmrbwx,如若转载,请注明出处:https://www.rmrbwx.cn/rmrbwx/35863.html

发表评论

电子邮件地址不会被公开。 必填项已用*标注