5分钟了解机器学习及其应用

文章讲的是5分钟了解机器学习及其应用什么是机器学习?我遇到过最简单的定义是:机器学习是AI的分支,是探索如何依据以往经验提升计算机性能的技术。更复杂的解释可能是:

  AI分支:人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,而机器学习是人工智能的一个分支,是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

  探索方法:机器学习目前用于训练计算机的一些模型已经被识别和使用,预期将随时间的推移衍生出更多模型。因为在训练计算机时可能需要使用不同的模型,而不同的业务问题也需要不同的模型。

  提高计算机性能:对于使用计算机来完成AI任务,还需要一些实践和适应。机器学习模型需要使用数据进行训练,在大多数情况下,需要一点人工帮助。

  基于经验:经验的另一种说法是提供数据。随着更多的数据被送到系统中,计算机可以更准确地对其进行响应并且预测未来的行为,更准确地理解数据意味着可以更好的完成给定任务或增加预测洞察的准确性。

  简单步骤示例:

  1. 选择并准备入口数据以及输入条件(例如,信用卡交易)。

  2. 建立和训练机器学习算法以完成特定任务(例如,检测欺诈性交易)。

  3. 训练数据以获得期望的输出信息(例如,哪些交易是欺诈的,哪些不是)。

  机器学习如何用?

  机器学习通常被称为魔术或黑盒:

  插入数据→魔术黑盒→任务完成。

  让我们来看看训练过程本身,以更好地了解机器学习如何通过数据创造价值。

  1、收集:机器学习取决于数据。 第一步是确保有解决问题所规定的正确的数据。考虑收集能力,就要考虑数据的来源,所需格式等。

  2、清理:数据可以有不同的来源,不同的方式生成,不同的文件格式,并用不同的语言表示。可能需要从数据集中添加或删除信息,因为某些实例可能缺少信息,而其他实例可能包含不需要的或不相关的条目。 其准备阶段将影响其可用性和结果的可靠性,要学会清理错误数据。

  3、分割:根据数据集的大小,抽取需要的一部分,这个过程通常被称为抽样。将所选样本中的数据分为两组:一组训练算法,另一组进行评估。

  4、训练:这个阶段的目的主要是找到可以准确完成所选目标的数学函数。训练采用不同的形式,这取决于使用的模型类型。在简单的线性回归模型中拟合可以被看作训练,生成随机算法的决策树的过程也是训练,这个过程可以通过有效地调整模型参数来改变训练结果。基本上,算法尝试处理数据时,会测量其自身的性能并自动调整参数(也称为反向传播),直到它能可靠地持续产生所需结果。

  5、评估:一旦算法在训练数据上表现良好,就用其他数据再次测量其性能,需要时可以进行额外调整,此过程可以防止过度拟合。

  6、优化:该模型针对目标应用程序中的集成进行优化,以确保尽可能地轻量和快速。

  机器学习的类型

  有许多不同的模型可以在机器学习中使用,通常分为三种:监督,无监督和强化。根据所需完成的任务,选取最合适的模型。

  监督学习:在这种类型的学习中,每个数据点的正确结果在训练模型的过程中都有明确标记,即在机械学习过程中提供对错指示。这意味着学习算法在读取数据时已经给出了答案。它不是找答案,而是旨在找到关系,以便在引入未分配的数据点时,可以正确地分类或预测。

  这类学习主要应用于分类和预测,比如,在信用卡交易中,它将学习各分类之间的关系,然后根据分类参数(例如,购买位置,交易之间的时间等)适当地标记新交易。

  在数据点相对于彼此是连续的(如股票的价格)的上下文中,回归学习算法可以用于预测数据点。

  非监督学习:在这种情况下,学习算法在训练期间没有给出答案,其目的是找到数据点之间的关系。它的价值在于发现相关性。例如,聚类是推荐系统中非监督学习的常见用法(例如,喜欢这瓶葡萄酒的人,也喜欢这种系统)。

  强化学习:是监督学习和非监督学习的混合。它通常用于解决更复杂的问题,并需要与环境交互。数据由环境提供,并允许代理响应和学习。实践中,主要应用于机器导航等场景,其中碰撞行为可以通过碰撞障碍物的方式负反馈学习。逻辑游戏也非常适合强化学习,比如扑克纸牌,西洋棋和最近的AlphaGo等。

  机器学习三大阶段

  机器学习发展的三个阶段及其在企业中的应用被认为是:描述性的,预测性的和规范性的

  描述指通过记录和分析历史数据以提高商业智能程度。向管理人员提供描述性信息,这已经在全世界大多数大型企业中得以应用,例如,审查销售记录和匹配促销活动,以了解投资回报率。

  应用机器学习的第二阶段是预测。收集数据并使用它来预测结果,更快速和更准确地做出决定,这个阶段目前已经被大多数企业所接受。然而,在寻求高效的商业实践时,仅预测行为是不够的。理解原因,动机和语境是最佳决策的先决条件。

  此外,机器学习的另一大重要应用是:过程自动化。以下是其在各领域的实践:

  物流和生产

  1、Rethink机器人使用机器学习来训练机器人手臂,提高生产速度;

  2、JaybridgeRobotics自动化工业级车辆,实现更高效的运营;

  3、Nanotronics自动化光学显微镜改进检查;

  4、Netflix和Amazon根据用户需求优化资源分配;

  5、其他例子包括:预测ERP / ERM需求,预测资产故障和维护,提高质量保证,提高生产线性能。

  销售和营销

  1、6sense预测应该在什么时候买入哪种铅;

  2、Salesforce Einstein有助于预测销售机会和自动化任务;

  3、机器自动化销售任务与AI助手;

  4、AirPR提高公关绩效;

  5、Retention Science建议多渠道行动以推动参与;

  6、客户的生命周期价值,提高客户细分的准确性,检测客户购物模式,以及优化用户的应用内体验。

  人力资源

  1、Etelo帮助招聘者识别和筛选候选人;

  2、hiQ协助管理人员进行人才管理。

  金融

  1、Cerebellum Capital和Sentient通过机器学习软件改进投资管理决策;

  2、Dataminr可以通过提供关于社交趋势和突发新闻的早期警报来协助实时财务决策;

  3、其他示例包括:检测欺诈行为和预测股价。

  卫生保健

  1、使用预测模型减少药物生产时间;

  2、Deep6分析识别符合条件的患者进行临床试验;

  3、其他例子包括:更准确地诊断疾病,改善个性化护理和评估健康风险。

  最后请记住,协作是关键。AI和机器学习可能创造的价值是迷人的,如果你想在AI领域发展,你最好和相应的专家交谈一下,以确保有一个好的开端。

作者:zyy

来源:IT168

原文链接:5分钟了解机器学习及其应用

时间: 2024-11-03 02:44:40

5分钟了解机器学习及其应用的相关文章

教程 | 看看大神的思路!机器学习界网红 7 分钟教你如何搭建 Chatbot?(中文版)

Siraj Raval 作为深度学习领域的自媒体人在欧美可以说是无人不知.无人不晓. 凭借在 Youtube 上的指导视频,Siraj Raval  在全世界吸粉无数,堪称是机器学习界的网红.说他是全球范围内影响力最大的 ML 自媒体人,怕也无异议. 因此,雷锋网 AI 研习社联系到了Siraj 本人,并获得授权将他最精华的 Youtube 视频进行字幕汉化,免费推送给大家.我们将不定期更新,敬请关注! 今天 Siraj 就带领大家做一个自己的 Chatbot! (建议在Wi-Fi环境下观看视频

阿里巴巴机器学习系列课程

亲爱的同学们,福利来临!随着机器学习领域的发展越来越火,阿里云机器学习PAI为广大机器学习爱好的学生提供免费的一站式算法平台,该平台提供上百种算法,并且兼容TensorFlow.Caffe.MXNET等深度学习框架,学生们还可以免费使用M40 GPU卡,这么好的福利到哪里去领呢? 点击开通机器学习PAI:https://data.aliyun.com/product/learn [新手必读,请务必要开通OSS和MaxCompute]https://tianchi.aliyun.com/compe

Hans Uszkoreit:机器学习在商务智能中的创新应用

大会第二天,德国人工智能研究中心(DFKI)科技总监.北京人工智能技术中心(AITC)总监兼首席科学家Hans Uszkoreit发表了主题为<机器学习在商务智能中的创新应用>的演讲. Hans Uszkoreit介绍了如何分析各种来源的数据,用于执行众多的商务智能任务,如供应链监控.市场调研和产品管理等.其所讨论的方法包含了不同类型的机器学习和基于知识的自然语言理解技术,充分利用知识图谱和各种其他结构化数据源,实现信息的互为补充. 以下是Hans Uszkoreit的演讲全文,AI科技大本营

CCAI 2017 日本理化学研究所先进智能研究中心主任杉山将:弱监督机器学习的研究进展

在本次大会上,日本人工智能和机器学习领域新一代的代表性人物--日本理化学研究所先进智能研究中心主任Masashi Sugiyama(中文名:杉山将)为参会者带来了<弱监督机器学习的研究进展>的演讲.杉山将在机器学习领域发表过很多重要的理论,是这个领域最知名的学者之一,出版了机器学习相关书籍<图说机器学习>(中文版). 以下内容根据杉山将本次主题演讲整理,略有删减: 大家早上好,我叫杉山将,非常高兴能够参加今天的大会,也很高兴和这么多中国的研究人员见面,我也特别喜欢杭州的文化和当地的

CCAI 2017 | 病人是否有生命危险?机器学习来告诉你——专访南加州大学终身教授刘燕

从早前的语音识别到后来围棋中的人机大战,人工智能技术早已不是"天边的云彩",遥不可及,而是更多的落地于生活,解决很多具体的问题.机器学习作为实现人工智能的方法,使用机器学习训练的模型广泛应用于复杂系统的预测问题,股市的涨跌,是否会发生自然灾害等这些通常凭借"经验"判断的问题统统可以使用机器学习来达到更加准确的预测.而这一切,都绕不开对于数据的分析研究. CCAI大会前夕,CSDN专访了南加州大学计算机系终身教授.机器学习中心主任刘燕,她的主要研究项目是时间序列和时空

零距离观察蚂蚁+阿里中的大规模机器学习框架

本文根据蚂蚁金服的资深技术专家周俊在蚂蚁金服&阿里云在线金融技术峰会上<大规模机器学习在蚂蚁+阿里的应用>的分享整理而成.在分享中,周俊详细介绍了阿里巴巴大规模机器学习框架--参数服务器的设计理念以及优化方法,并结合支付宝.阿里妈妈直通车搜索广告等具体场景详解了参数服务器在蚂蚁金服和阿里内的应用:分享最后,他对大规模机器学习的未来发展做了展望. 直播视频:点击此处观看 幻灯片下载:点击进入 以下为整理内容. ---------------------------------------

Raúl Garreta大神教你5步搭建机器学习文本分类器:MonkeyLearn

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud       用机器学习构建一个好的文本分类器是一项很有挑战性的工作.你需要构造训练集.调参.校正模型及其他事情.本文将会描述如何使用MonkeyLearn训练一个文本分类器,具体分为如下5步: 1. 定义类别树 2. 数据收集 3. 数据标记 4. 训练分类器 5. 测试&提升分类器 1.定义类别树 在训练文本分类器之前,首先要确定你要把你的文本数据分成哪些类或者打上哪些标签. 选择类别 假如你要把来自不同网

独家 | 手把手教你用Python 3创建用于机器学习开发的Linux虚拟机(附安装教程&amp;代码)

Linux是使用Python进行机器学习开发的极佳环境.这些工具能够被简便快捷地安装,并且您可以直接开发和运行大型模型. 在本教程中,您将了解如何使用Python创建和安装用于机器学习的Linux虚拟机.完成本教程后,您将知道: 如何下载和安装VirtualBox来管理虚拟机如何下载和安装Fedora Linux如何在Python 3中为机器学习安装一个SciPy环境 如果您的电脑操作系统是Windows.Mac OS X和Linux.那么本教程是适合您的. Linux虚拟机的好处 您可能有很多

阅览5分钟 教你快速成为数据分析师

文章讲的是阅览5分钟 教你快速成为数据分析师,2016年可以说是大数据市场热火朝天的一年,无论是大型企业.中小型企业纷纷伸长了脖子想要和大数据这个互联网因素浓郁的技术挂钩.许多的企业也走在开始尝试用大数据技术进行转型的路上- 然而"大数据切实利用起来"还是需要落实落地,与几年前我们刚开始接触的Hadoop相比,数据分析变得更重要. 先来看2017大数据行业的五大趋势 物联网(IoT)和大数据是同一枚硬币的两面;数十亿与互联网连接的"物件"将生产大量数据;深度学习是一