数据在负责任人工智能中的作用:塑造道德人工智能未来的数据决策

推特
推特
LinkedIn
分享
脸谱网
fb-share-icon

毫无疑问,人工智能(AI)将在未来几年继续快速发展,并日益与我们的日常生活联系在一起。现在,企业有责任用负责任的眼光看待人工智能,以最大限度地提高透明度,减少偏见,并指导该技术的道德应用。毕竟,运行良好的人工智能对每个人都是公平的。

现在,负责任的政策和协议的决定将决定人工智能的未来,进而决定人工智能将如何塑造我们的未来。数据在这些努力中发挥着基础性作用;它是所有直接影响模型性能的人工智能技术的核心。模型的好坏取决于用来训练它的数据,这就是为什么数据是AI实践者在决定治理实践时能够真正发挥作用的关键领域。

数据在负责任人工智能中的作用

一切都在数据中

在人工智能项目中,数据科学家将把大部分时间花在数据收集和注释上。在完成这些任务时,有三个最重要的领域:保护数据隐私,减少数据中的偏见,以及从道德上获取数据。

数据隐私

作为一名人工智能从业者,最关心的应该是数据隐私和安全。在这个领域已经有了相关的立法,您的组织的数据处理协议应该保持一致。例如,ISO标准(国际公认的)是围绕保护个人信息而存在的,GDPR(通用数据保护条例)涵盖了欧盟的数据管理,以及全球范围内存在的其他要求。您的业务必须遵循其所有客户所在地区的标准。

在全球某些地区,数据保护法规可能不一致或不存在;无论如何,致力于负责任的人工智能意味着采取数据安全管理措施来保护你的数据供应商。在使用个人资料前,您应征求个人同意,并采取保安措施,以保护任何个人身份资料不被不当使用。

如果你不清楚什么类型的安全协议应该纳入你的数据管理实践,你可以考虑与第三方数据提供者合作,他们已经有这些地方,并有专业知识指导你通过安全的数据处理。

数据偏差

有偏见的数据=有偏见的结果。这是AI开发的一个简单事实,但当你想象所有可能无意中引入偏见的方式时,情况就变得复杂多了。让我们举个例子:你正在构建一个语音识别模型,也许是用于汽车上。语言本身可以有不同的音调、口音、填充词和语法(更不用说不同的语言和方言)。假设您希望您的语音识别模型适用于不同人口特征和背景的驾驶员,那么您将需要代表每一个用例的数据。

如果你收集数据大多是男性的声音,语音识别模型通常会很难认识到女性的声音,事实上,这正是所发生的一些流行的基于语音的模型产品,因为没有接触到足够的培训期间的数据类型。因此,我们面临的挑战是如何规划一个完整而公平的数据集;它涵盖了所有用例和边缘用例。创建一个对每个用户都有效的人工智能产品,首先要确保所有这些用户都出现在培训数据中。bob体育手机下载

数据来源

在这种情况下,我们讨论的是关于提供和准备数据的人的治疗的道德数据来源。理想情况下,如果您提供了数据,那么您应该得到补偿(并且要意识到您正在提供它)。补偿可以是金钱或服务交换的形式。

事实是,很多数据是在我们不知道的情况下获取的,而且往往连谁拥有这些数据的界限都很模糊。例如,如果你正在为你的公司进行视频通话,谁将拥有该通话产生的语音数据?bob外围怎么样你的公司吗bob外围怎么样?视频通话提供商?单个扬声器?界限很快就会让人困惑。在任何情况下,致力于负责任的人工智能的公司都应该公开他们收集数据的对象、类型和时间,并努力适当地补偿个人的数据。

不过,获取数据并不总是问题所在。使数据处于可用状态常常是一个挑战。您需要许多人清理和过滤数据,以确保它对您的项目有价值,然后您将需要更多的人用准确的标签注释数据。这些人必须得到公平的待遇:包括公平的薪酬、开放的沟通渠道、保密和舒适的工作条件。这个领域的立法主要是关于禁止现代奴隶制的法律,但公司可以做更多来确保他们的数据注释者受到道德对待。例如,在Appen,我们依靠全球的员工群体来提供高质量的注释,并创建了一个人群道德规范以证明我们对他们幸福的承诺。

用数据塑造人工智能的未来

企业有责任在今天做出人工智能决策,这些决策将在未来为企业和社会带来积极的结果。数据治理特别是对任何人工智能努力的整体伦理都有重大影响,因为数据偏见和数据管理是负责任的技术应用的关键因素。作为一名人工智能从业者,您的目标应该是建立一个数据治理框架,反映负责任的人工智能的主要租户。通过这样做,你将为一个更公平的技术做出贡献,一个更好地反映我们社会的多样性的技术。

网站部署人工智能与世界级的训练数据bob体育手机下载
语言