7推动计算机愿景界限的进展

2014年9月17日

在我们批判性地思考计算机愿景之前，我们需要花点时间欣赏自己的人类视觉系统。只是想想我们在我们的生活中可以做的是用眼球的人！我们分析了，排序，在任意情况下进行了任意的对象，毫不费力地追踪了事物的运动，召回完美的3D模型的图像，读取（书面，键入，甚至说明）字母，数字和单词，并且自从我们是出生，认可成千上万的面孔。我们每天组织和理解我们眼睛群众的信息的能力就是令人惊叹的。

然而，对于计算机来说，它们的相机镜头和其他传感器(即人工智能)背后的生活并不令人惊奇，而是充满了困惑。然而，这一切现在都在向好的方向改变。举个例子，直到2006年，机器人还不能独立拿起杯子，但到了2011年，就变得很容易了，现在我们的机器人非常协调，它们可以Juggle 5球一次！！

为什么等待？好吧，电脑愿景并不小挑战。为了使其对所有潜在应用有用，计算机科学家需要改变他们如何教他们的软件;简而言之，他们需要喂食大量数量bob体育手机下载．幸运的是，多亏了数据科学，机器学习在过去的几年中，计算机视觉领域的进步不断涌现。bob体育手机下载

以下7项最新进展应该引起你的注意:

1.机器人的Mega知识图成为现实

由人类内置的内置在线提供直接反馈，并由不断搜索互联网的机器学习算法内部提供直接反馈，罗莫大脑是计算机愿景研究人员可以进入的在线信息图书馆，使他们的机器人真正了解他们周围的世界。通过结构化的深度学习，人工智能学习事物背后的多层含义(比如，不仅仅是咖啡杯的外观，还有人类用它做什么)，这个图书馆将允许机器人根据数据提供的3D知识图做出最佳选择。《机器人大脑》并不是这一领域的唯一项目，但它对机器学习的力量有着令人印象深刻的见解，再加上一点众包，网站的访问者可以帮助更正和添加图书馆。

2.亚当项目展示了深度学习在图像识别中的力量

在机器学习中使用大量高质量的训练数据的价值再怎么强调也不为过。bob体育手机下载从微软项目亚当通过其计算机视觉计划使这一充分清晰，这是如此先进，它可以讲述Pembroke和Cargigan Corgi（狗品种）的图片之间的区别，即使为一个人也很难的任务。将自己建模为神经网络，项目亚当的算法已经看到超过1400万只图像分为22,000个类别Imagenet数据库．这就是为什么它的机器学习算法能够如此熟练地识别图像，即使在不同的环境中。

但是狗的物种鉴定仅仅是个开始。“亚当计划”可以为有健康意识的消费者以及盲人和残疾人社区带来真正的希望。来看看微软研究员Trishul Chilimbi在地平线上看到了什么。

3.显示A.I.它是如何完成的，人类控制机器人

当软件和机器人不能或不能做你想做的事情时，创建基于浏览器的软件让人类来控制手头的工作是有意义的。除此之外，机器学习算法还可以通过观察工作中的人类对手学到很多东西。以下是三个值得一看的例子:

使用人群计数神经元和火车算法来检测细胞的边缘，Appen与哈佛大学合作，帮助他们的研究人员找到一种更快的方式来分析他们在蜂窝图像上的视觉数据。这是一个算法无法削减它的举例，并且需要介入的人群。（对于类似的例子，您可以作为志愿者参与其中：eyewire.）
2012年，Willow Garage建立了希菲项目(hephy Project)，该项目将许多任务交给在线工人，这些工人通过指导PR2机器人完成特定的家务和任务获得报酬。在工作过程中，机器人能够观察和学习。观看娱乐视频来全面了解这个项目的进展。
告诉我戴夫是另一个例子．然而，它向在线志愿者学习的方式是通过虚拟环境中的模拟机器人。像电子游戏一样，志愿者可以移动虚拟机器人在一个模拟空间中，并教它如何做一些事情，比如为聚会准备房间(拿出薯片和蘸酱等)，或者是否用炉子或微波炉烧水。绝对值得尝试如果你想看看当机器人的霸王是什么感觉(目前;)。该项目旨在为PR2和其他机器人建立一个众包的指令库，以便最终能够训练它们灵活推理、决策和理解自然语言。

4.卫星图像和大数据一样有很大的帮助

除了著名的马航失踪航班搜索在美国，卫星图像+众包已经被用来解决许多问题，包括评估洪水的损失，找到间接的方法来绘制贫困地图，喜欢计数金属与茅草屋顶来自卫星照片。

5.扶手椅考古学家揭开古代雅典的历史

虽然戴软呢帽的印第人仍然是我们想象中遥远的考古学家的原型，但这个领域近年来已经发生了显著的变化。

新边疆找到了我们的英雄狩猎失落的埃及城市Tanis从阿拉巴马州的办公室或区分一支扶手椅考古学家梳理卫星图像寻找Genghis Khan的坟墓．在这两种情况下，结合专家和编程图像分析，可以实现更快、更便宜和更有效的探索。

努力在巴塞罗那的一群研究人员持续解决这些公民科学挑战电脑视觉中心开发了一个众包平台，叫做Knowxel通过允许用户利用全球移动劳动力，对文本和图像分析方面的算法进行培训和补充。

一种引起了我注意的这样的人的任务是古代雅典陶器的分析。为了确定特定船只的起源和时间框架，研究人员需要揭开线索。为实现这一目标，要求人群工人在船上的跳跃者的头盔周围绘制边界框。然后编程地分析这些裁剪图像以确定关于每个部件的历史的确定。

有趣的是想象隐藏的过去将显示出这些新技术变得更广泛采用的新发现！

6.图像标签成功作为服务

有时候，软件服务很像我们，它们需要知道自己在看什么，然后才能伸出援手。其中一个例子就是发现新的葡萄酒来喝，或者回忆起你曾经喜欢过的葡萄酒。的应用程序这完全解决了这一点。通过数百万葡萄酒标签的数据库，他们使用机器学习来帮助人们完全清理他们正在寻找的葡萄酒并了解更多信息。为了培训和改进该算法，当App用户拍摄Dexectable无法识别的图片时，可以将AppOn的员工分类，匹配和转录瓶子分类。