Re·Will Wilson Q&A与Appen的首席技术官威尔逊庞

推特
鸣叫
LinkedIn
分享
Facebook
fb-share-icon

本周,Appen在RE•工作时展出财务峰会深入学习在伦敦。首脑会议帮助商业领袖,数据科学家和工程师发现AI和机器学习工具和世界领先创新者在金融部门的进步。RE•与Appen CTO Wilson Pang的工作谈到了学习他目前的工作,实施AI的挑战以及高质量的数据对于的重要性至关重要机器学习(这篇文章首先出现了重工)。

首席技术官Wilson Pang

1.给我们一些关于申请的背景和你的角色

Appen为机器学习和人工智能开发出高质量的人类注释数据集。我们与各种不同行业的领先公司合作,以扩展其机器学习计划,以及我们的bob体育手机下载帮助改进解决方案,如聊天机器人、语bob平台app下载音识别系统、搜索引擎、社交媒体平台等。我们的大多数客户选择与我们合作,是因为Appen是一家提供高质量人工智能数据的一站式商店。我们和我们的客户一起设计数据采集和特定于其需求的注释程序,我们的项目经理确保数据符合客户的质量标准。我们可以快速扩展,因为我们拥有超过100万承包商的全球人群,在130个国家和180种语言中工作,我们可以处理许多数据类型 - 包括敏感数据 - 具体取决于我们的客户的需求。

我的角色是首席技术官,负责产品和工程。我的团队由数据科学家、工程师和产品经理组成。我们正在建设世界领先数据标签平台,包括AI辅助工具系统,使数据标记更快。该平台还包括一个劳动力管理系统,使其很容易聘用和发展我们的人群社区 - 以及提供数据洞察力,数据质量保证和工具,使我们的项目经理超高效。


2.您是如何在机器学习中开始工作的?

我的职业生涯始于搜索领域的机器学习,这是机器学习被广泛应用的第一个领域。10年前,我有幸成为eBay搜索科学团队的创始人之一。我们从零开始建立了搜索科学团队,并通过应用和优化机器学习算法,推动了巨大的收入增长。一旦你看到了数据和机器学习的力量,你很难停下来。从那时起,我还在eBay建立了一个数据科学团队,负责零售科学(库存价格设定、供应与缺口分析、趋势与季节性检测等)、实验和产品体验优化。

后来,我加入了中国最大的在线旅行社携程(CTrip),担任首席数据官,领导该公司的大部分机器学习和数据项目。bob外围怎么样我的团队为公司带来了数亿美元的收入增长,同时也大大降低了客户支持成本。根据我的经验,机器学习可以用来解决实际的行业问题,而数据是构建伟大的人工智能解决方案的最重要因素之一。获取高质量的训练数据非常困难。bob体育手机下载解决人工智能数据问题是一个巨大的挑战,而Appen很好地为我们的客户解决了这个问题。


3.作为一名首席技术官,你的日常工作是怎样的?

作为首席技术官,我负责定义技术愿景和战略,在我们的组织内部和合作伙伴中清楚地进行沟通,吸引和培育伟大的人才,并建立一个伟大的执行和创新文化。典型的一天可以触摸其中一个或多个这些区域。此外,我还经常提供规划和决策,满足指导与外部客户,研究机器学习技术的最新演进,并确保我们的平台是在我们的行业领先优势。


4.您目前在工作中面临哪些挑战,深度学习是如何帮助您解决这些挑战的?

人工智能需要大量的数据,数据质量需要很高。我们都知道“垃圾输入,垃圾输出”。在全球范围内,Appen是为数不多的几家能够轻易扩大规模、提供大量高质量数据的公司之一,但仅依靠人力可能成本高昂。此外,优化数据收集和注释的质量和输出并不是一件容易的工作。我们正在使用深度学习,在不损害数据质量的情况下,为客户降低单位成本。我们的人工智能辅助注释服务可以在适当的地方预注释数据。

例如,我们使用深度学习对图像进行预注释,然后让我们的员工对不准确的结果进行调整。它使我们的工作人员在标注图像时速度快了10倍。同样的思想也适用于语音到文本的转录、命名实体提取和其他相关任务。


5.在应用人工智能时,模型的偏差一直是一个关键问题,企业在使用人工智能时应如何减少偏差?

模型或机器偏见的偏差确实是一个很大的问题。这些问题通常是由培训数据中的问题引起的。bob体育手机下载例如,如果我们正在构建培训数据的图像分类模型,具有大多数图像,具有狗的大多数图像,并且很少有猫的图像,模型很可能将新图像作为狗分类bob体育手机下载。

因此,偏差的缓解也应该重点关注培训数据中的减轻偏差:bob体育手机下载

  1. 公司应具有各种技术团队成员,负责建筑模型和创建培训数据。bob体育手机下载
  2. 如果培训数据来bob体育手机下载自内部系统,请尝试找到最全面的数据,并尝试使用不同的数据集和指标。
  3. 如果培bob体育手机下载训数据是由外部合作伙伴收集或处理的,那么重要的是要招募多样化的人群,以便使数据更具代表性。
    此外,正确设计任务和指令是超级重要的,以便在提供数据时,人群没有偏见。通常,公司不自主地完成这一目标。
  4. 一旦创建了训练数据bob体育手机下载,检查数据是否有任何偏差是很重要的。有时,很难可视化高维训练数据和检查平衡。bob体育手机下载我们正在构建强大的培训数据可视化和洞察工具,这肯定bob体育手机下载会有帮助。
  5. 由我们决定了路径机学习算法。作为工程师和数据科学家,我们应该仔细考虑我们在创建这些技术时固有的偏见 - 并对他们进行纠正。


6.您最兴奋的其他行业是在未来5年内实施积极影响的艾美?

制造业中的人工智能将成为人工智能与物联网的最佳结合点。它将节省大量人力,提高生产率、效率和盈利能力。


7.在此次金融深度学习峰会上,您最期待的是什么?

金融业内的机器学习利用大量的个人数据,包括交易历史,信用记录,用户行为等。但是,非结构化数据如图像,视频和文本等。我真的很期待看到利用这种类型的数据的用例,这将使行业在欺诈和客户体验等领域进行下一级别。

- - - - - -
Appen将在3月19日至20日举行的深度学习金融峰会(Deep Learning in Finance Summit)上展出,所以一定要参加现在在这里获得门票来和我们聊聊帮助你扩展机器学习程序。

使用世界级培训数据部署AI的网站bob体育手机下载