人群的集体智慧与专家:谁让IBM Watson更聪明?

推特
鸣叫
linkedin
分享
Facebook
fb-share-icon

了解自然语言是人工智能的伟大愿望之一。虽然解决它可能对社会产生令人兴奋的影响,但它将采取前所未有的培训数据,以使其发生。bob体育手机下载在从看似无限的消息来源解释健康数据的解释尤其如此 - 以及我们这么兴奋地看到的大原因CrowdTruth.org利用众人,现在申请训练IBM华生

沃森代表了计算语言学和计算机视觉付诸行动的先进水平。它利用其对语言和图像前所未有的理解来梳理大量数据集,挖掘有用的信息并做出预测(比如疾病诊断).根据Lora aroyo.普朗森的主要调查人员,Watson作为“延长专家决策​​能力的认知假肢,例如医生,他们将作为一个工具使用它建议书关于如何最好地分析病人的病情。

与此同时,数据丰富平台已经成为数据科学家的宝贵资源,他们希望将清理工作自动化和规模化,数据标签以及使用人类智能进行机器学习的数据丰富数据 - 即,培训数据创建。bob体育手机下载虽然沃森不断融入主动学习,它的智慧得到了培训数据的质量加强,它来自人群贡献者在诸如Appen等数据丰富平台上。bob体育手机下载

IBM华生

沃森在几年前赢得jeopardy的时候就产生了错误。图像通过原子炸玉米饼

什么是数据丰富和沃森的下一步?

阿姆斯特丹自由大学的劳拉·阿罗约说,克里斯Welty来自IBM Watson研究中心Robert-Jan SipsIBM荷兰的挤压队领先。他们的工作重点是标签bob体育手机下载将主题专家和人群贡献者结合在加强Watson的机器学习算法中。他们发现的是开创性的。

Crowdtruth团队

Crowdtruth团队

CrowdTruth发现,专家注释者(从事培训数据创建的高薪健康专业人士)只有30%的时间表示赞同。bob体育手机下载而“流行人群投票”占95%专家协议。为什么?专家不关注语言表达中的粒度。人群贡献者做。这意味着,是,无偏见的人群的集体智能是一样好,如果不是更好,而不是坐在房间里的昂贵专家。他们的注释的多样性有助于Watson了解专家培训师的细节。

我最近与Lora Aroyo发表过讲述Crowdtruth培训数据创作的方法:bob体育手机下载

“这群匿名工作者,通常对可能的领域专业知识没有偏见,正在从纯语言学的角度处理文本示例,并以这种方式捕获专家注释提供的解释的多样性。”

多年来,清洁训练数据的唯一途径是一个艰苦的拨款过程,并在昂贵,耗时,远离可扩bob体育手机下载展的承包商军队中是一个艰苦的补助流程。但今天,研究人员可以简单地切换Appen巨大,按需员工从大量医学文本、图像和视频中分分合合地构建和提取知识。因此,CrowdTruth正在证明,这些外行数据标签在解释语义内容方面比付费专业人士更有效。原因是,专家们用预先形成的偏见来解释数据。而群体贡献者,特别是像CrowdTruth那样,如果你在每个数据点上询问他们,他们会根据可能的解释范围来解释数据。因此,沃森在计算预测时吸收了更广泛、更可靠的矢量。

CrowdTruth的培训bob体育手机下载数据补充了医疗专家的输入,主要目的是从医疗文档中提取见解。通过在沃森的机器学习工作流程中引入人为数据丰富,该系统可以补充对专家培训师的需求,更快地提取至关重要的知识来自Wikipedia文章,患者案例报告和超越的。

Crowdtruth Research的含义是什么?

该框架将有助于Watson执行医疗文本分析的能力,这些框架能够以前所未有的方式推进临床研究和医疗保健的个性化。

想象一下,沃森能够解释患者目前的症状,并帮助在炽热的快速速度下规定正确的治疗。怎么会这样做?通过综合医生的投入以及对患者数十年的历史医疗记录,地区的季节性流感数据以及在Watson的大脑中积累的其他医学知识的宇宙的自动分析。这意味着什么?病人受到更快,更好的待遇。

在临床方面,制药公司可以加快毒品的发展,研究人员可以深入了解他们对疾病和遗传学的研究。简而言之,药品更好,更有效的临床结果。

通过将医学专家的专业知识与人工智能的力量相结合,我们很可能在我们的有生之年看到这些进步的实现。这是一个令人兴奋的前景,我们很高兴阿彭处在最前沿。

深入挖掘:

如果你想深入调查Crowdtruth.,看看下面的幻灯片,看看他们的GitHub,浏览Crowdtruth的团队论文介绍或花一些时间阅读Crowdtruth的三面,最近在就职问题上发表了人体计算杂志

使用世界级的训练数据部署人工智能的网站bob体育手机下载
语言