人群的集体智慧与专家:谁让IBM Watson更聪明?

推特
鸣叫
linkedin
分享
Facebook
fb-share-icon

了解自然语言是人工智能的伟大愿望之一。虽然解决它可能对社会产生令人兴奋的影响,但它将采取前所未有的培训数据,以使其发生。bob体育手机下载在从看似无限的消息来源解释健康数据的解释尤其如此 - 以及我们这么兴奋地看到的大原因CrowdTruth.org利用众人,现在申请训练IBM华生

沃森代表了计算机语言学和计算机视觉的最新进展。它利用自己从未见过的对语言和图像的理解来梳理大量的数据集,挖掘有用的信息,并做出预测(如提示疾病诊断).根据Lora aroyo.普朗森的主要调查人员,Watson作为“延长专家决策​​能力的认知假肢,例如医生,他们将作为一个工具使用它建议书如何最好地分析病人的病情。

与此同时,数据充实平台已经成为数据科学家寻求自动化和规模化清理的宝贵资源,数据标签以及使用人类智能进行机器学习的数据丰富数据 - 即,培训数据创建。bob体育手机下载虽然沃森不断融入主动学习,它的智慧得到了培训数据的质量加强,它来自人群贡献者在诸如Appen等数据丰富平台上。bob体育手机下载

IBM华生

几年前,沃森赢得了《危险边缘》(jeopardy)的奖项,并因此声名大噪。图像通过原子炸玉米饼

什么是数据丰富和沃森的下一步?

阿姆斯特丹自由大学的劳拉·阿罗约,克里斯Welty来自IBM Watson研究中心Robert-Jan SipsIBM荷兰的挤压队领先。他们的工作重点是标签bob体育手机下载将主题专家和人群贡献者结合在加强Watson的机器学习算法中。他们发现的是开创性的。

Crowdtruth团队

Crowdtruth团队

CrowdTruth发现,从事数据创建培训的高薪医疗专业人士、专家注释者的赞同率仅为30%。bob体育手机下载而“流行人群投票”占95%专家协议。为什么?专家不关注语言表达中的粒度。人群贡献者做。这意味着,是,无偏见的人群的集体智能是一样好,如果不是更好,而不是坐在房间里的昂贵专家。他们的注释的多样性有助于Watson了解专家培训师的细节。

我最近与Lora Aroyo发表过讲述Crowdtruth培训数据创作的方法:bob体育手机下载

“这群匿名工作者,通常来自可能的领域专家,没有偏见,从纯语言的角度处理文本例子,并通过这种方式捕捉专家注释者提供的解释的多样性。”

多年来,清洁训练数据的唯一途径是一个艰苦的拨款过程,并在昂贵,耗时,远离可扩bob体育手机下载展的承包商军队中是一个艰苦的补助流程。但今天,研究人员可以简单地切换Appen巨大,按需员工从大量的医学文本、图像和视频中构建和提取知识。CrowdTruth正在证明,这些外行的数据标签在解释语义内容方面比付费的专业人员更有效。原因是,专家们用预先形成的偏见来解释数据。而人群贡献者,特别是如果你问他们每个数据点,就像CrowdTruth,解释数据时要考虑可能的解释范围。因此,沃森在计算预测时吸收了一个更广泛、更可靠的载体。

CrowdTruth的培训bob体育手机下载数据补充了医疗专家的输入,其主要目的是从医疗文件中提取见解。通过在沃森的机器学习工作流中引入以人为动力的数据丰富,该系统可以补充对专家培训师的需求,更快地提取至关重要的知识来自Wikipedia文章,患者案例报告和超越的。

Crowdtruth Research的含义是什么?

该框架将有助于Watson执行医疗文本分析的能力,这些框架能够以前所未有的方式推进临床研究和医疗保健的个性化。

想象一下,沃森能够解释患者目前的症状,并帮助在炽热的快速速度下规定正确的治疗。怎么会这样做?通过综合医生的投入以及对患者数十年的历史医疗记录,地区的季节性流感数据以及在Watson的大脑中积累的其他医学知识的宇宙的自动分析。那是什么意思?病人受到更快,更好的待遇。

在临床方面,制药公司可以加快毒品的发展,研究人员可以深入了解他们对疾病和遗传学的研究。简而言之,药品更好,更有效的临床结果。

通过结合医学专业人员的专业知识和人工智能的力量,我们可以很好地看到这些进步在我们的有生之年实现。这是一个令人兴奋的前景,我们很高兴Appen处于前沿。

深入挖掘:

如果你想深入了解Crowdtruth.,看看下面的幻灯片,看看他们的GitHub,浏览Crowdtruth的团队论文介绍或花一些时间阅读Crowdtruth的三面,最近在就职问题上发表了人体计算杂志

网站部署人工智能与世界级的训练数据bob体育手机下载
语言