澳鹏机器学习常见问题解答

推特
鸣叫
LinkedIn
分享
脸谱网
FB-共享图标

探索这个机器学习的常见问题解答机器学习和人工智能,包括有关不同的方法,以及如何可以投资细节的概述。

什么是机器学习?

机器学习是通过提供指导来教会机器如何学习的过程,这些指导帮助机器自己发展逻辑,并让它们访问你想让它探索的数据集。其结果就是某种形式的人工智能(AI)。

“尽管它的名字,还有关于这项技术没有什么‘人为’ - 它是由人类制造,意在表现得像人类和人类的影响。因此,如果我们希望它发挥明天的世界产生积极作用,就必须通过人文关怀的指导“。

  • 李飞飞谈“以人为本的人工智能”,纽约时报

如何机器学习工作的?

计算机遵循规则。这些规则也被称为算法。当他们第一次开始学习时,他们会得到一组初始的数据来进行探索。这些数据被称为训练数据。bob体育手机下载

计算机开始识别模式,并根据算法和训练数据做出决定。bob体育手机下载根据使用的机器学习的类型,他们也会被给予目标,或者当他们做出正确的决定或朝着最终目标迈出积极的一步时,他们会得到奖励。当他们建立这种理解或“学习”时,他们通过一系列步骤将新的输入转换为输出,这些输出可能包括全新的数据集、标签数据、决策甚至行动。

这个想法是,机器学习不够没有任何人为干预操作。就这样,他们开始发展和展示我们所说的人工智能。机器学习是人工智能创建的主要方式之一。

人工智能的其他例子包括机器人、语音识别和自然语言生成,所有这些都需要机器学习的一些元素。实现机器学习有许多不同的原因和方法。还有各种机器学习算法和训练数据的类型和来源。bob体育手机下载

为什么机器学习发展得这么快?

近年来,有三件事促成了人们对机器学习的广泛兴趣。

  1. 所有类型的数据增长
  2. 存储的成本下降
  3. 计算能力的巨大改进

与其他任何事情一样,有证据表明还有其他促成因素和商业驱动力,但在为加速使用机器学习和人工智能的新创新应用铺平道路方面,这三项进步显然占据了主导地位。

为什么要投资机器学习?

在公共和私营部门的组织都在机器学习进行投资,因为它允许他们在以下方面改善:

  • 速度。获取答案,并执行复杂的计算速度更快。
  • 功率。处理更多的数据,进行更复杂的分析。
  • 情报。通过挖掘以前无法解读的真实数据来揭示新的见解。
  • 效率。用更少的人力资源进行更多的分析。

不管你是在什么行业,你可能会发现机器学习了坚实的使用情况,并能够证明通过预期回报顶线和/或底线收入数字的投资。

机器学习已被证明可以减少和甚至消除手工数据录入,检测垃圾邮件,打击欺诈,并推荐产品。它可以用来预测何时需要对设备和基础设施的维护,它可以告诉你更多关于你的客户比你以前见过的,并提高客户满意度。

如果你还没有在机器学习上投资,你需要问问自己:为什么不呢?

什么是机器学习用?

机器学习的用例是巨大的,多样的,并且仍在探索中,所以我们将强调机器学习在五个常见领域中的应用。

零售和电子商务

人工智能和机器学习正被用于提高转化率、改善客户体验、提供个性化服务等等

  • 相关搜索。在线购物者没有问销售人员,他们可以找到一个产品的奢侈品。您现场搜索引擎履行这个角色。通过解释搜索查询,评估用户意图,并使用这些信息来训练你的搜索算法,结果变得更加相关,从而导致更高的购买转化率。
  • 个性化。根据购物者过去的行为向他们提供建议或搜索结果,可以帮助创造更强的用户参与度和留存率。
  • 加强客户服务聊天机器人充当虚拟购物助手。像员工一样,他们需要接受培训,不仅要知道你在卖什么,还要知道人们在你的网站上使用的许多产品的术语。

技术

搜索引擎和其他领先的技术公司利用机器学习,明确编写他们的AI提供创新的产品和完善的用户体验

  • 相关搜索。搜索引擎算法使用机器学习驾驶更强的用户参与度。通过解读查询和评估用户的意图,搜索结果更加相关,从而产生更高的用户满意度。
  • 个性化。分析数据的活动和偏好可以帮助搜索引擎和社交媒体供应商个性化内容的饲料和建议,提高在线客户体验。
  • 自然语言处理(NLP)。NLP可以分析的语言模式,以了解可能使用俗语或其他自然形态的社交媒体,例如文本。该技术可用于跟踪客户情绪并制定参与战略。
  • bob网页版。在金融服务领导者使用机bob网页版器学习和人工智能技术来提高客户获得,保持和整体体验
  • 风险管理。反洗钱(AML)、了解客户(KYC)和欺诈检测程序需要复杂的工具来发现潜在的威胁。仅仅依靠人类员工来发现财务记录中的模式既费时又昂贵。机器学习和人工智能使金融机构能够快速筛选数据并发现异常情况,防止非法活动,挽救公司潜在的损失。bob外围怎么样
  • 创收。如今,金融机构正利用机器学习算法来制定投资策略,从而解放了金融顾问,让他们可以更多地与客户打交道。
  • 增强客户体验。随着今天的期望按需客户服务,聊天机器人具有至关重要的作用,以填补。聊天机器人的帮助,以取悦客户提供实时反馈和高效的体验。

汽车

加快机器学习与训练数据的自动驾驶汽车,并提升语音识别系统,车载用更bob体育手机下载精确的现场测试导航和用户体验

  • 自主车辆。虽然自动驾驶汽车是极其复杂的机器,但它们的神经网络是由机器学习驱动的。当汽车向前行驶时,它会处理大量的视觉数据——就像司机看挡风玻璃时所做的那样。车辆需要为大量图像数据赋予意义,比如识别一棵树或行人,然后将这些信息反馈到汽车的人工智能中进行教学。
  • 语音识别。传统的仪表盘和移动设备需要驾驶员的手和眼睛离开路面。语音接口不。连接轿厢需要获得大规模的语音数据的集合训练语音接口,世界各地的消费者提供最佳的用户体验。
  • 预测行为。在语音识别进展和摄像头,可以帮助跟踪驱动器情绪在人机界面下一个重要步骤,赋予汽车以识别说话者的情绪以及他们的话,那么他们可以告诉如果用户得到相应的沮丧和反应能力。

政府

完善突发事件应急响应,防御措施,并与安全的数据服务执法

  • 国防。使用社交媒体监控,计算机视觉和数据注解,政府部门现在都能够提取的信息与恐怖分子监视援助,监督国家安全的威胁,等等。
  • 国家紧急情况。如自然灾害或协同攻击紧急情况可能发生没有片刻的通知。当生命安全受到威胁,立即响应,并与协调是关键。使用翻译,语音识别和文本数据的收集,世界各地的紧急救援人员可以有效地利用机器与伤害的方式沟通。
  • 执法。安全转录允许执法来实现许多目标,其中包括来自体佩视频,官方记录保存和归档解决方案记录捕捉文件。bob平台app下载

医疗保健

人工智能(AI)和机器学习在医疗保健中的令人兴奋的应用正在改变病人护理

  • 预测分析。评估趋势,预测疫情,并预测患者的需求。
  • 聊天机器人和虚拟医疗。提供更快,更好的客户服务。
  • 保险业的发展。使用机器学习基于各种各样的数据点来建立更强大的包销机型。

大多数人类和动物的学习是无监督的学习。如果智力是一块蛋糕,那么无监督学习就是这块蛋糕,监督学习就是蛋糕上的糖霜,而强化学习就是蛋糕上的樱桃。我们知道如何做糖霜和樱桃,但我们不知道如何做蛋糕。我们需要先解决无监督学习问题,然后才能考虑实现真正的人工智能。”

  • 闫肋蹲,人工智能研究中心主任,脸谱

最常用的机器学习方法有哪些?

监督式学习

监督学习算法的目的是确定基于实例,或训练数据预测模型。bob体育手机下载这些数据集包含有正确的输出变量配对的输入变量。该算法然后用分析数据,并产生所述输入准确映射到它们相应的输出的功能负责。经过培训后,该算法可以继续预测任何新的数据,它给出的结果。

  • 分类- 分类是最容易理解的。数据被评估,以确定它属于哪个类。一个例子可能是机器学习模型,询问机来确定是否一个画面是马与否。这是一个简单的是/否应答和二元分类的一个例子。提供训练数据与马和非马机器可以学bob体育手机下载习一匹马的区别特征的足够的照片后,机器将能够看到在自己的照片,并告诉你,如果它是马与否。
  • 回归不是分离数据并分配它到一个类,机器被要求预测一个响应或输出基于它从最初的训练数据得到的响应。bob体育手机下载一个简单的例子是,如果初始输入3和5的目标是8,学习的逻辑就是将两个输入相加。最终,该模型将使用回归分析来预测输入4和6的目标为10。监督式学习是任务导向的;例如:“给我找XYZ目标。”

半监督学习

半监督学习是一种混合模式。使用半监督深学习算法被训练在标记和未标记的数据的组合。这种方法可以更加实用,因为它可以是昂贵的有一个数据科学家或工程师的数据标签数据。其他时候,这种方法是采取,因为数据的规模如此巨大的标签这将是艰巨的任务。另一个原因团队采取一种混合的方法是避免任何形式的人为偏差,可以在发生的数据标签

“这是一个资本的错误理论化一个具有数据之前。不知不觉,一个开始扭曲事实,以适应理论,而不是理论,诉讼的事实“。夏洛克·福尔摩斯

With semi-supervised learning, your model may benefit and be able to work faster by having some targets or labeled data, and the work it does to make sense of the unlabeled data may reveal insights and provide you with outputs you hadn’t discovered yet. It is a win-win in many scenarios and an often used approach.

强化学习

强化学习是最抽象的方法和完全的机器,通常被称为“学习剂”在基于,通过试验和错误中学习。该机决定采取的行动,其以基于它已被赋予了奖励的定义给定的环境,最大限度地发挥其性能。那种试错活动被称为探索。它获得从了解哪些行为获得奖励的知识被称为剥削。

通过勘探和环境,学习代理,通过先进的机器学习算法推波助澜的开发,最终获得足够的知识,开始表现出几乎类似人类的人工智能水平。

机器人为强化学习提供了最好的例子。它们在工厂的使用很大程度上依赖于它们使用强化学习的能力,根据需要适应环境,完成类似人类的任务和行为,并且错误率不断提高。

你需要为机器学习的是什么样的数据?

“机器学习的好坏取决于你用来训练它的数据。”

  • 丹尼尔·唐克兰,在Endeca的,谷歌,LinkedIn带领的机器学习项目

有没有结束,要确保你有足够正确的数据来支持你的机器学习项目的重要性讲的物品的数量。

正如上面引用的Tunkelang在文章中继续解释的那样机器学习:10分的事实每个人都需要理解他说,“没有复杂的算法也可以进行机器学习,但没有良好的数据就不行。”

那么您需要什么样的数据呢?视情况而定。

结构化数据与非结构化数据

  • 结构化数据- 结构化数据在逻辑上为计算机阅读和理解井井有条,方便。这可能是从ERP或CRM系统或约来自传感器的操作简单的时间标记的数据拉机器产生的交易数据。它也可能是人为产生的数据输入到电子表格中。这种类型的数据是最常见的监督学习使用,它通常可以非常快速地处理,即使有令人难以置信的大量。
  • 非组织性数据-根据行业领袖的说法,世界上超过80%的数据是非结构化的,而且数据量呈指数级增长。非结构化数据无处不在。人类生成的非结构化数据包括MS word和其他文本文件、演示文稿、视频、图像、音频、社交媒体帖子等等。机器生成的非结构化数据包括监控录像、卫星图像和科学数据。监督和强化学习是一种难以置信的工具,可以用来获得洞察力,并对非结构化数据做比以往任何时候都多的事情。

机器学习需要多少数据?

简单的答案是:很多。在世界上最好的算法将难以产生具有数据不足,正确的结果。

“AI技术需要车型重新接受训练,以配合潜在变化的条件,所以训练数据必须经常刷新。bob体育手机下载在三分之一的情况下,需要在模型中至少每月更新一次,几乎四分之一的情况下,需要每天刷新。”

为什么?更大的容量驱动更大的精度。

有许多理由。其中一个原因是,对于大多数机器学习模型,你试图得到一台电脑到数据集的有意义,变异数量惊人。

例如,考虑语音识别应用程序和由于性别、年龄、方言等方面的差异而引起的语音变化。一些专家表示,一个模型需要至少10,000小时的音频才能以适度的精度输出。另一些人说,虽然所需的数据总量取决于模型或问题的复杂性,100000个实例是最低要求对于大多数的模型。

“质量”有关系吗?

是的!可能比数量还要多。

“更多的数据胜过聪明的算法,但更好的数据胜过更多的数据。”

是什么让数据“坏?”这可能是无关紧要的,您的问题,不准确注释,误导性或不完整。在这种情况下,这将需要一些数据清洗或准备。

如果您的模型的任务是对数据进行分类,那么您的训练数据可能必须首先被正确地标记。bob体育手机下载有时格式是一个问题。例如,如果您正在处理图像数据,可能需要调整这些图像的大小,以便模型分析相同长度的向量。

您使用的任何数据都需要进行一些清理。专家报告说,需要做的工作并没有结束于数据的提取、转换和加载(ETL)。即使在此之后,使其适合于数据科学所需的清理工作通常也只是平均值总工作负载的80%在任何机器学习项目。

机器学习常见问题解答其他资源

用例继续扩大,你会想熬夜速度上可以提高你的模型,并为客户创造更好的产品的所有方式。

机器学习术语表

  • 人工智能(AI) -机器的能力,独立运营执行任务和活动,通常需要人类的智慧。
  • 聊天机器人,一个聊天机器人是通过模拟典型的对话线程与人类通信的虚拟助理。它通常是通过互联网传送,并嵌入到网站或移动应用。
  • 数据分类 -数据可以由人或机器进行分类,并且是特定的类别分配给表现出相同的特性的数据的过程中,例如日期,来源,类型等的目标是使数据更容易理解和分析或使用。
  • 数据标签-数据标签是由人工执行的,它是将提供与监督的机器学习模型中使用的目标机标签的过程。
  • 机器学习 -机器学习是教学设备如何为他们提供指导,帮助他们发展自己,并获得你想要他们去探索数据逻辑学的过程。
  • 强化学习 -当机器或代理人给出的数据集,一组关于如何探索数据的规则,当它会得到回报它的性能有清晰的认识。因为它探讨的数据和它的“环境”机器获悉经过反复试验赚取回报和实现其目标的最有效和最有效的方法。
  • 结构化数据,在世界上的数据只有20%被认为是“结构化”。结构化数据的方式,可以很容易让计算机分析和解读组织。它通常在关系数据库,电子表格和企业系统,如CRM,ERP和财务应用中。
  • 监督学习,监督学习模型是当今使用的机器学习中最简单和最准确的实例。通过监督学习,机器被提供一组结构化的数据,其中包括输入和标记为“目标”数据或期望输出的数据。机器从这些例子中学习了将输入转换为输出的逻辑,因此最终它只需要输入就可以独立地创建目标输出。
  • bob体育手机下载训练数据,bob体育手机下载训练数据是机器学习项目中用来开始向机器传授该项目的逻辑、行为或其他智能形式的数据。一旦模型已经使用了足够的数据来工作,它就会被给予测试数据,并且在项目宣告成功之前,它会使用验证数据来运行。
  • 非结构化数据 -世界上80%的数据并没有以一种容易解释或分析的方式组织起来。例子包括文本和聊天信息、录制的音频、视频和社交媒体帖子。
  • 无监督学习,机器给出的数据没有标记。机器和模型的工作是寻找数据之间的相关性、模式或关系,并将这些洞察作为输出交付。
网站与世界一流的训练数据部署AIbob体育手机下载
语言