图像处理用户案例

推特
鸣叫
LinkedIn
分享
Facebook
fb-share-icon

计算机愿景的大多数业务应用涉及识别图像内部的内容。由于视觉信息与信息如此密集,因此有很多工作要做。然而,而不是更换人类,而是计算机视觉能力最常见的人类。要另一种方式:计算机愿景项目通常是关于创建工作流程,其中人们在机器处理其余的时处理复杂或创意或唯一的人类任务。但是这里的最终目标是什么?实际上是什么?我们如何在高水平思考它们?虽然您可以通过行业或实际的注释工具本身来打破它们,但它可能更有趣地将它们分开。

你可以把绝大多数的图像处理任务放在以下四个桶中:

  • 用户创造力
  • 社会联系
  • 整体效率
  • 安全

让我们从创造力开始。

创造力

我们常认为商业计算机愿景的目标与帮助人们做更多的事情或更快地做出更多东西。但在某些情况下,组织实际上对鼓励客户或引发他们的想象力更感兴趣。

例如,在实践层面上,Shutterstock.帮助人们从他们庞大的数据库中找到正确的图片,但他们也会根据客户选择的照片提供特定类型的编辑建议。这是因为人们想要做不同的事情,比如,人像和风景。因此,虽然我们可以说图像搜索有一个用例,但最好还是专注于搜索的目的,因为知道图像的内容可以让它们更具体地帮助用户做什么。

一个相邻的用例利用用户行为来揭示意图并激发创造力。比如,那些上传很多厨房照片的人Pinterest可能正在计划改造。事实上,Lowe一直探索如何采取一个人的整个引脚,将其与Lowe目录相匹配,以查找类似的物体,然后在视觉上将所有这些作品组装在一起。业务意图是出售全新的厨房,但它的成功与Lowe的梦想有关,并将这些梦想变为现实。

标题:计算机愿景让您识别用户可以在社交媒体上发布的商品,并在您的目录中找到类似的东西;在这里,Lowe有助于使用Microsoft Hololens组装厨房

留在Pinterest中,他们的“店铺装备”能力可以放在创意和社会桶中 - 人们想要看起来不错,所以他们点击一件衣服并找到各种各样的版本。

计算机在一系列坐标轴上找出相似点的能力可以为各种推荐提供动力。也就是说:能够识别是什么使蓝色hightop成为蓝色hightop的模型可以使用该信息来推荐视觉上相似的产品。

相似性的翻转侧是不寻常的 - 例如,Edvard Munch的“尖叫”是完全不同于它之前的事情但也预示了接下来可能发生的事情。在商业领域,这是挑出突出的图像或新颖的风格的能力。在产品地图或视觉空间中,一些不寻常的东西经常出现在一些奇怪的地方,这可能会告诉你一些关于客户的新的和重要的东西,甚至会随着这些不寻常的东西随着时间的推移变得越来越流行或越来越不寻常,从而开始识别出趋势。

联系

人类是社会动物,所以很多似乎是关于搜索/检索的项目都是关于我们如何与他人联系。

这是最明显的Facebook的面部识别,发现并建议在他们中有朋友和家人的照片。同时,苹果使用高级计算机模型来帮助搜索您的照片,例如狗。即使您没有在Facebook上的任何图像注释任何图像,也将有助于在专辑中找到您最喜欢的狗。

现在,自分享是在为什么人们正在寻找照片的核心,你想制作分享产品设计的突出和轻松一部分。随着时间的推移,您还可以学习用户单独和共同分享的照片的品质。也就是说,您可以在反馈循环中构建,使用户操作的一部分bob体育手机下载因此,您的系统随着时间的推移变得更聪明。

在这个紧要关头,三角洲日志多久人们看各种待售房屋的照片在他们的应用程序,他们使用这种直觉用户喜欢什么以及了解远程跨用户主题,瓷釉的水平和完成关联与注意力和房屋销售最好的。这是一个特别好的地方:个人用户行为在较长时间内在更高、更普遍的级别上丰富数据。

监控内部照片的内容也让公司在社交媒体中识别产品。虽然相对简单的文本分析可以告诉您人员如何提及您的产品,但Vision模型可以帮助您知道产品在Instagram或任何其他平台中出现的频率。了解一个人的服装和汽车的风格也可以帮助他们针对相关产品。您也可以匹配与地方的人 - 如果您正在访问一个新城市,那么那些看起来像你去的人在哪里?正如您可以想象的那样,很多电脑视觉应用程序需要仔细的道德反思,了解他们对隐私和社会隔离所做的事情。

标题:如果你是一个品牌,右下角的情感远比左下角更受欢迎

最后,还有一些公司喜欢影响该研究致力于从照片和视频中识别情绪。在零售连锁店中,微笑或皱眉的情况有多少?或者考虑一下与客服人员进行视频聊天。当代理处理客户的特殊需求时,计算机视觉应用程序可以通过交互观察客户脸上有多少沮丧和宽慰。了解人们在商店或求助电话中的感受可以帮助品牌与客户建立联系,最终提供更好的产品和体验。

效率

计算机视觉最简单的商业应用来自于帮助人们提高效率;与其解决问题,不如帮助人们知道去哪里寻找。例如,在内容审核方面,你可以训练一个模型去寻找冒犯性的图像,而不必用发布在网站上的更令人不安的东西去伤害一群人类内容评论员。

效率也是很多计算机视觉的医疗/保健应用背后的原因。其目标不是取代诊断医生,而是指导他们的工作。而不是看数百个,比如说,没有任何异常的放射扫描,只向专家展示模型发现有问题的图像或算法不太确定的图像。

如果有水配给规定,但你在比佛利山庄看到一堆翠绿的草坪,你可以确信这是违规的。一台机器处理大量卫星照片要比人类简单得多——或者挨家挨户地去做。但是像他创造的模型全天候可用于区分卫星照片中的池塘和池。

有多种用于空中和卫星照片的用途,也许最宽阔的是涉及砍伐森林和城市化。麻省理工学院媒体实验室已致力于找到城市中更安全或更不安全的地方以及理解是什么让城市茁壮成长.同样,使用航拍照片来探测砍伐道路,这是雨林砍伐的前兆,这使得执法更加有效。

标题:也许这对干旱来说太绿了?

安全

在某些情况下,像处理干旱一样,监视是公众的好处。大多数人还考虑到安全检查站面部识别的情况。

但是在什么时候这会变得过于侵扰?例如,我们什么时候呢?只是走在街上?或如何面部扫描获取卫生纸在公共洗手间?

这里有个《黑镜》和《少数派报告》的场景面部识别用来对没做错事的人进行分类。虽然有工作来保持人们的隐私,当摄像机盯着-面漆服装这可能最终导致一些真棒的时尚陈述除了隐私 - 这是一个日益增长的问题,我们将在未来几年内听到越来越多的问题。

包起来

GPU的可用性,在规模上注释和评分图像的能力,以及模型的稳定改善都将使电脑视觉更加可行,而不是他们在现在到达的任何时间。虽然上面的列表并不完全详尽的,但通常,您可以将大量的计算机视觉项目突破到上面的桶中。

如果您错过了我们以前的博客文章有关范围和设计计算机视觉项目,请确认一下.我们将在下周四结束本系列,其中三个在我们的计算机视觉三部曲中。目前?谢谢阅读。

使用世界级培训数据部署AI的网站bob体育手机下载