5分钟了解机器学习及其应用

文章讲的是5分钟了解机器学习及其应用，什么是机器学习?我遇到过最简单的定义是：机器学习是AI的分支，是探索如何依据以往经验提升计算机性能的技术。更复杂的解释可能是：

　　AI分支：人工智能(Artificial Intelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，而机器学习是人工智能的一个分支，是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。

　　探索方法：机器学习目前用于训练计算机的一些模型已经被识别和使用，预期将随时间的推移衍生出更多模型。因为在训练计算机时可能需要使用不同的模型，而不同的业务问题也需要不同的模型。

　　提高计算机性能：对于使用计算机来完成AI任务，还需要一些实践和适应。机器学习模型需要使用数据进行训练，在大多数情况下，需要一点人工帮助。

　　基于经验：经验的另一种说法是提供数据。随着更多的数据被送到系统中，计算机可以更准确地对其进行响应并且预测未来的行为，更准确地理解数据意味着可以更好的完成给定任务或增加预测洞察的准确性。

　　简单步骤示例：

　　1. 选择并准备入口数据以及输入条件(例如，信用卡交易)。

　　2. 建立和训练机器学习算法以完成特定任务(例如，检测欺诈性交易)。

　　3. 训练数据以获得期望的输出信息(例如，哪些交易是欺诈的，哪些不是)。

　　机器学习如何用?

　　机器学习通常被称为魔术或黑盒：

　　插入数据→魔术黑盒→任务完成。

　　让我们来看看训练过程本身，以更好地了解机器学习如何通过数据创造价值。

　　1、收集：机器学习取决于数据。第一步是确保有解决问题所规定的正确的数据。考虑收集能力，就要考虑数据的来源，所需格式等。

　　2、清理：数据可以有不同的来源，不同的方式生成，不同的文件格式，并用不同的语言表示。可能需要从数据集中添加或删除信息，因为某些实例可能缺少信息，而其他实例可能包含不需要的或不相关的条目。其准备阶段将影响其可用性和结果的可靠性，要学会清理错误数据。

　　3、分割：根据数据集的大小，抽取需要的一部分，这个过程通常被称为抽样。将所选样本中的数据分为两组：一组训练算法，另一组进行评估。

　　4、训练：这个阶段的目的主要是找到可以准确完成所选目标的数学函数。训练采用不同的形式，这取决于使用的模型类型。在简单的线性回归模型中拟合可以被看作训练，生成随机算法的决策树的过程也是训练，这个过程可以通过有效地调整模型参数来改变训练结果。基本上，算法尝试处理数据时，会测量其自身的性能并自动调整参数(也称为反向传播)，直到它能可靠地持续产生所需结果。

　　5、评估：一旦算法在训练数据上表现良好，就用其他数据再次测量其性能，需要时可以进行额外调整，此过程可以防止过度拟合。

　　6、优化：该模型针对目标应用程序中的集成进行优化，以确保尽可能地轻量和快速。

　　机器学习的类型

　　有许多不同的模型可以在机器学习中使用，通常分为三种：监督，无监督和强化。根据所需完成的任务，选取最合适的模型。

　　监督学习：在这种类型的学习中，每个数据点的正确结果在训练模型的过程中都有明确标记，即在机械学习过程中提供对错指示。这意味着学习算法在读取数据时已经给出了答案。它不是找答案，而是旨在找到关系，以便在引入未分配的数据点时，可以正确地分类或预测。

　　这类学习主要应用于分类和预测，比如，在信用卡交易中，它将学习各分类之间的关系，然后根据分类参数(例如，购买位置，交易之间的时间等)适当地标记新交易。

　　在数据点相对于彼此是连续的(如股票的价格)的上下文中，回归学习算法可以用于预测数据点。

　　非监督学习：在这种情况下，学习算法在训练期间没有给出答案，其目的是找到数据点之间的关系。它的价值在于发现相关性。例如，聚类是推荐系统中非监督学习的常见用法(例如，喜欢这瓶葡萄酒的人，也喜欢这种系统)。

　　强化学习：是监督学习和非监督学习的混合。它通常用于解决更复杂的问题，并需要与环境交互。数据由环境提供，并允许代理响应和学习。实践中，主要应用于机器导航等场景，其中碰撞行为可以通过碰撞障碍物的方式负反馈学习。逻辑游戏也非常适合强化学习，比如扑克纸牌，西洋棋和最近的AlphaGo等。

　　机器学习三大阶段

　　机器学习发展的三个阶段及其在企业中的应用被认为是：描述性的，预测性的和规范性的。

　　描述指通过记录和分析历史数据以提高商业智能程度。向管理人员提供描述性信息，这已经在全世界大多数大型企业中得以应用，例如，审查销售记录和匹配促销活动，以了解投资回报率。

　　应用机器学习的第二阶段是预测。收集数据并使用它来预测结果，更快速和更准确地做出决定，这个阶段目前已经被大多数企业所接受。然而，在寻求高效的商业实践时，仅预测行为是不够的。理解原因，动机和语境是最佳决策的先决条件。

　　此外，机器学习的另一大重要应用是：过程自动化。以下是其在各领域的实践：

　　物流和生产

　　1、Rethink机器人使用机器学习来训练机器人手臂，提高生产速度；

　　2、JaybridgeRobotics自动化工业级车辆，实现更高效的运营；

　　3、Nanotronics自动化光学显微镜改进检查；

　　4、Netflix和Amazon根据用户需求优化资源分配；

　　5、其他例子包括：预测ERP / ERM需求，预测资产故障和维护，提高质量保证，提高生产线性能。

　　销售和营销

　　1、6sense预测应该在什么时候买入哪种铅；

　　2、Salesforce Einstein有助于预测销售机会和自动化任务；

　　3、机器自动化销售任务与AI助手；

　　4、AirPR提高公关绩效；

　　5、Retention Science建议多渠道行动以推动参与；

　　6、客户的生命周期价值，提高客户细分的准确性，检测客户购物模式，以及优化用户的应用内体验。

　　人力资源

　　1、Etelo帮助招聘者识别和筛选候选人；

　　2、hiQ协助管理人员进行人才管理。

　　金融

　　1、Cerebellum Capital和Sentient通过机器学习软件改进投资管理决策；

　　2、Dataminr可以通过提供关于社交趋势和突发新闻的早期警报来协助实时财务决策；

　　3、其他示例包括：检测欺诈行为和预测股价。

　　卫生保健

　　1、使用预测模型减少药物生产时间；

　　2、Deep6分析识别符合条件的患者进行临床试验；

　　3、其他例子包括：更准确地诊断疾病，改善个性化护理和评估健康风险。

　　最后请记住，协作是关键。AI和机器学习可能创造的价值是迷人的，如果你想在AI领域发展，你最好和相应的专家交谈一下，以确保有一个好的开端。

作者：zyy

来源：IT168

原文链接:5分钟了解机器学习及其应用

时间： 2024-11-03 02:44:40

5分钟了解机器学习及其应用

5分钟了解机器学习及其应用的相关文章

教程 | 看看大神的思路！机器学习界网红 7 分钟教你如何搭建 Chatbot？（中文版）

阿里巴巴机器学习系列课程

Hans Uszkoreit：机器学习在商务智能中的创新应用

CCAI 2017 日本理化学研究所先进智能研究中心主任杉山将：弱监督机器学习的研究进展

CCAI 2017 | 病人是否有生命危险？机器学习来告诉你——专访南加州大学终身教授刘燕

零距离观察蚂蚁+阿里中的大规模机器学习框架

Raúl Garreta大神教你5步搭建机器学习文本分类器：MonkeyLearn

独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机（附安装教程&代码）

阅览5分钟教你快速成为数据分析师