如何大规模构建成功的计算机视觉应用

推特
推特
LinkedIn
分享
脸谱网
fb-share-icon

从原型到生产的导航计算机视觉项目

电脑愿景在几个行业中迅速获得牵引,因为图像数据的可用性增长,而人工智能(AI)对全球的公司变得越来越达到最重要的。计算机视觉它是机器学习(ML)的一种形式,帮助计算机像人眼一样看到和解释图像。通过对图像和其中的对象进行分类,计算机可以对它们看到的内容作出反应,并根据用例提供增强的预测、客户体验和安全性。

说到人工智能,有很多计算机视觉应用,它的使用预计会随着时间呈指数增长。简历在医疗保健例如,预计到2025年底,美国的销售额将从2019年的约4亿美元增长到13亿美元,而30%的零售商将在未来12个月配备最新的CV技术。到2025年,个人简历市场的整体价值预计将达到182.4亿美元,是全球人工智能市场的一大块(到2026年将达到令人印象深刻的680亿美元)。

尽管计算机视觉项目的快速增长,但许多公司仍然努力找到信心部署这主要是因为缺乏高质量的数据和对构建自动化AI管道的理解有限。释放业务价值需要克服这些挑战,并以一种可扩展的方式来实现。

有哪些成功的计算机视觉应用?

许多组织已经在计算机视觉应用方面取得了成功,释放了业务价值。这些案例研究突出了不同行业的成功案例:

电子商务

Shotzr为营销专业人员提供包含超过7000万图像的营销专业人士的图像数据库。他们向我们寻找了高质量的培训数据,以帮助为营销人员创造更个性化的和本地化bob体育手机下载的搜索体验。利用图像分类CV,Shotzr使用各种人群来标记具有相关类别的众多图像,例如时尚,自然和生活方式。然后将这些图像馈入其平台的搜索算法,提高了推荐和搜索体验。订婚增加了20%,因为营销人员能够找到更多相关的图像和内容。

零售

机器人是一个令人兴奋的AI领域,依赖于CV。在零售在美国,很多公司都将机器人放置在商店地板上,以跟踪库存,并识别哪些商品库存不足或缺货。考虑到缺货商品每年在全球造成的收入损失高达4,480亿美元,这对大型零售商来说有巨大的节约成本的潜力。

机器人除了使用光学字符识别(使用图像转录扫描条形码并输出产品名称和价格),还使用物体检测(使用图像注释来识别产品是否脱销)。

农业

约翰迪尔正在通过应用计算机视觉算法来识别农场上的杂草来决定杀虫剂的使用。通过像素级图像分割,人工智能被训练来区分图像的哪一部分是作物,哪一部分是杂草。这样,农民就可以使用无人机只在杂草上喷洒杀虫剂,潜在地减少90%的杀虫剂成本。

汽车

这里是一家利用bob外围怎么样视频、图像和文本数据为许多行业创建精确地图的公司。他们的街道标识检测算法具有ml辅助的视频目标跟踪功能,他们的平台可以使用带有商业标识框的光学字符识别算法来识别企业。这里使用卫星图像上的像素级语义分割来注释建筑物的行人入口、楼层数等。

该公司还bob外围怎么样使用视频注释来跟踪汽车、车辆和行人。我们的工具提供了更高的机器辅助,模型能够跟踪每个对象的运动,使人类对该对象的注释更易于管理。

这些例子展示了简历在为重要行业的公司节省关键成本方面的能力,同时也强调了培训数据在它们成功中的价值。bob体育手机下载

如何接近计算机视觉项目

计算机视觉的项目

接近的关键计算机视觉项目正在构建一个可伸缩的、自动化的模型管道。以下步骤将以自动驾驶汽车为例,指导您完成整个过程。

1.业务问题

定义一个清晰的业务问题,它将为您的组织提供价值。确认参与执行解决方案的关键干系人,并接受他们的签字和对项目的理解。一定要评估你的努力的优先级和你的组织愿意做的投资水平。

在开发自动驾驶汽车的情况下,商业价值可能是更大的收入或获得竞争优势的愿望。

2.数据

准备bob体育手机下载涉及许多步骤,包括收集、清理、分割,注释,处理和分析。您还需要数据治理过程来监视安全问题。(请在下一节中查看关于培训数据重要性的更多信息。)bob体育手机下载

在我们的自动驾驶汽车例子中,来自摄像头、激光雷达和雷达的同步传感器数据从汽车上收集,并移植到中央存储单元。汽车制造商也可以选择利用从开源或现成的数据集。可以使用各种方法对数据进行注释;例如,点云视频对象跟踪是一种CV注释技术,可以跟踪3D空间中的对象(可能有助于查看汽车如何与其他物品交互)。

3.模型构建

模型构建阶段需要使用准备好的数据和超参数训练算法,优化特征提取,分析输出,并重新训练,直到模型达到所需的精度阈值。您可以使用champion-challenger模型进行测试,其中您有一个初始模型作为要击败的对象。你提出另一个模型挑战者,并对两者进行A/B测试;谁表现得比谁好就成为冠军模特。在得到您想要的模型之前,您可能需要对这个过程进行成百上千次的迭代。

对于一辆自动驾驶汽车,您可能需要训练一到五个不同的模型,这些模型需要不同的数据收集或注释处理,然后将它们融合在一起,创建最终的模型。当您测试模型时,您通过迭代增加了复杂性(例如,温度,天际线上发生了什么,或者其他与驱动相关的因素)。自动驾驶汽车还需要在真实环境中进行现场测试,以确保车辆能够在不同的条件下运行。

4.部署

一旦您有了一个冠军模型,评估您的解决方案是否解决了您在开始时定义的业务问题,以及它是否将提供预期的业务价值。如果没有,那么就从头再来调整一下。如果您的模型准备好了,请将其与现有业务流程集成,并进行部署。在部署后使用工具继续度量模型的性能。

部署意味着很多事情。自动驾驶汽车有一个物理部件,很可能是一个需要安装在汽车上的可穿戴技术部件。

5.主动学习和调优

在部署了模型之后,您还没有完成。现在您已经进入了模型维护模式,这需要持续的更新和监视。使用一个human-in-the-loop提供地面真相和成功监测的方法,目的是减轻模型漂移。此外,继续检查模型预测中的偏差,并在需要时向模型提供反馈。

随着道路状况在全球发展,需要更新,以便在自动驾驶汽车中持续到AI。

bob体育手机下载培训数据:计算机视觉项目的核心

同样准确的头部可以说训练数据是核心bob体育手机下载所有机器学习项目。如果没有高质量的培训数据,AI模bob体育手机下载型将很难做出准确、高可信度的预测,从而很好地服务于终端用户。在构建AI时,这是你获得成功所必须具备的要素。那么,对于数据,应该考虑哪些因素呢?以下问题将帮助您创建有效的数据管理策略:

目标和项目优先级

你的质量目标是什么?

您如何计划培训和调整您的模型?

您的数据要求是什么?

数据收集

你需要多少数据?

你在哪里采购您的数据?

你的数据是否足够多样化以避免过度拟合?

您将如何移动数据?

部署后如何继续收集它?

数据标签

什么类型的数据标签你需要什么?

什么标签工具最适合您的需求?

谁在标记您的数据?您需要特定的技能,语言吗?

数据流水线和缩放

您如何计划使用AI数据管道自动执行?

你会加入一个人在圈子里吗?

你将如何为你的模型提供持续的培训?

虽然这些问题绝不是详尽无遗的,但他们将帮助您探索准备高质量培训数据和建筑和维护成功模型的所需途径。bob体育手机下载

优化未来

建立高效,高性能的CV型号是优化数据和模型管道的问题,避免常见错误。您需要通过构建连续学习循环来解决数据漂移和陈旧型号的问题,以继续培训和挑战您的冠军模型。您将希望通过设置可重复的自动工作流程来设计模型来扩展。您还想创建一个全面的数据治理框架,以促进高质量的培训数据准备。bob体育手机下载这些行动将共同帮助您推出试点阶段并进入部署,生产和超越。

我们如何提供帮助

在Appen,我们拥有超过20年的专业知识,包括收集和注释必要的数据,为计算机视觉构建深度学习系统和神经网络。这种高质量的图像注释数据是为计算机视觉项目的特定培训需求量身定制的。

了解更多关于我们的注释功能支持广泛的计算机视觉工具,包括对象跟踪、像素级语义分割和图像转录。

使用世界级培训数据部署AI的网站bob体育手机下载
语言