AI说人“画” | 什么?咱俩说的是一个“模型”嘛!

Hello大家好,我是Vicky,今天我们来讲一些关于“模型“的事儿。

模型是对事物的抽象,是发现规律模拟真实世界用的。

在数据里呢,基本上模型有两类,解释性和预测性,今天来着重来说预测性的。

所以怎么评价模型的好坏呢? 当然就是预测的多准了

机器学习模型呢,就是看学习能力如何,也就是看举一反三的能力。

一般常用的机器学习模型包括:分类,回归和聚类

今天就以分类模型为例,谈谈怎么评价一个“模型”好不好。

检验一个机器学习模型时要做的第一件事就是看误差有多大,

这里的误差有偏差和方差两类:

高偏差的意思就是你从一开始就跑偏了,没学习到真正的规律,也叫欠拟合。

比如这张图,把眼罩当成bra,买家确实没有把“肩带”当作特征,“形状”也确实有点类似,不过她居然忽略了size!(惊)

高方差的意思就是你入戏太深了,虽然你的模型完美的解释了现有的数据,换一组新的就不行了。这也就是过拟合,量身定做过了头儿,好比你查视力的时候,把视力表背下来了,然后查视力的结果左右眼都是5.3,完美!

然而实际情况是,换一张顺序不一样的视力表,你连医生指的第几行都看不见,甚至你连医生都看不见。这就是没什么泛化能力,模型过于复杂,训练过度了。

那怎样才能知道自己的模型是否存在高偏差或是高方差呢?

一种直接了当的方法就是把数据一分为二:训练集和测试集。例如把模型在 70% 的数据上做训练,然后用剩下的 30% 数据来测量失误率。

举个接地气的例子!就好比谈恋爱,暖男就是既不会让你觉得太粘人,也不会让你觉得被疏远,而且不止对你一个人这样,对谁都这样,这个撩妹模型就训练的恰到好处...

(促进一下理解)

回到正题,衡量分类模型好坏的话只看错误率的话肯定是不够的。

咱们就说算命的,比如问一个算命大师 明年会不会生七胞胎,大家都心知肚明,这个特定时间怀孕这个事儿本来就没那么高,况且七胞胎就更不多了,姑且就认为七胞胎在人群中的概率是0.1%,于是乎呢,不管是谁问大师这个问题,他都说没有的话,那么他的准确率也是99.9%的,你能说他算的准么?

所以说,我们不只关心他算对了多少,更关心怀了七胞胎的人他算出来了多少。

假定有一个二分类问题,比如有几个男的和几个女扮男装的人站在一起 系统想把真男人挑出来。

给系统一个人,系统会判断这人是“真” 也就是男(Predicted positive),或是“假” 也就是女(Predicted Negative)。

如果你是男的,系统也判你是男的,就是真正TP(True Positive),

原本你是男的系统判定你是女的,就是假负FN(False Negative),

原本女的判成男的,就是假正FP(False Positive),

原本女的,系统判你是女的,就是真负TN(True Negative)。

这几个值可以组成一个混淆矩阵,很多指标都是基于这个混淆矩阵算出来的。

比如我们会关心系统判定是男人的人里面到底多少是真的男人 这个也叫查准率,TP/(TP+FP)。

我们还关心这些男人里,有多少男人被找出来了 这个也叫查全率,TP/(TP+FN)。

所以大家可以看出来,这两个量其实是相互矛盾的,一个高的时候,另一个可能就低点儿,比如我想把所有男人都挑出来,那最保险的方式就是把所有人都选上..那也没什么意义了,如果说希望选出来的人里面男人的比例尽可能的多,那就找出最有把握是男人的人,但是这样可能会漏掉一些长的没那么man的人,这样查全率就低了。

大部分情况下呢,我们是根据预测结果对这些样本排序,越靠前的就是越有可能是正例的样本,按照这个顺序预测,所以每次就可以得到当前的查准率和查全率,然后呢以查准率为纵轴,查全率为横轴画图,就能得到一个曲线,也就是P-R曲线。

有的时候呢,输出的结果是正例还是负例取决于设定的概率阀值概率阈值,这种阈值的选取也一定程度上反映了分类器的分类能力。我们当然希望无论选取多大的阈值,分类都能尽可能地正确。

所以呢我们再引入两个指标

真正率tpr 和假正率fpr

真正率呢和 查全率一样

假正率,就是预测为正样本但是预测错了的可能性FPR=FP/TN+FP

以真正率为纵轴,假正率为横轴我们可以得到一个曲线叫ROC曲线

ROC曲线一定程度上可以反映分类器的分类效果,但是不够直观,我们希望有这么一个指标,如果这个指标越大越好,越小越差,于是,就有了AUC。AUC实际上就是ROC曲线下的面积。AUC直观地反映了ROC曲线表达的分类能力。基本上,曲线下的面积(AUC)越大,或者说曲线更接近左上角(true positive rate=1, false positive rate=0),那么模型就越理想,越好。

混淆矩阵还可以组合出好几种指标,比如F1 score,以及macro-F1 ,方法不同思想类似,这儿就不赘述了

当然,不同的场景下呢,不同失误的代价不一样,关注的点也不一样,

做商品推荐,把不相关的东西给顾客推荐了,这也没什么太大的损失,运气好的话顾客兴许也就一起买了。

给罪犯定罪,只要是有罪的话,立刻死刑的这种情况下,如果无罪的判了有罪,这后果就很严重了

所以说 中心思想是什么呢:

第一,光看指标本身意义不大,要结合实际情况

第二,别走极端,差不多最完美

原文发布时间为:2017-11-11

本文作者:搭建模型的

时间: 2024-10-03 14:38:53

AI说人“画” | 什么?咱俩说的是一个“模型”嘛!的相关文章

AI说人“画” | Heart Broken, 游戏中被AI碾压的我们都中了哪些套路?

hello大家好我是vicky,今天呢咱们来说说AI玩游戏的事儿(准确来说,是游戏中的人类是如何被AI碾压的)-- 不久前alphago赢了围棋,openai又赢了dota,太拽了简直!虽然我本人除了狼人杀以外,几本大脑一片空白(别问为啥,那还不是前半生都奉献给了学习?我爱学习,学习是我本命!)-- 咳咳,跑偏了,今天不是讨论小姐姐我是怎么玩游戏的,而是分析一下我们是怎么被AI套路的! 以下将以围棋为主题展开!不知道围棋的小伙伴别着急,你就记着--咱们俩依次放棋子,一直到最后无处可下了,谁占的地

在java做的画图板中,如何选中一个已经画好的图形,把它放大、缩小、移动???

问题描述 在java做的画图板中,如何选中一个已经画好的图形,把它放大.缩小.移动???类似windows的画图板功能,急呀,大牛们帮帮忙 解决方案 解决方案二:你要做图形处理的话,在画这个图形的时候就要把图形的数据保存起来,例如:直线就要保存两个端点的坐标,圆就要保存圆心坐标和半径.然后根据操作,对保存的数据进行相应的处理,再重画图形.建议看下图形学的一些知识.解决方案三:可是我只是个菜鸟,不会那些呀,怎么能选中图形呢?解决方案四:packageaa;importjavax.swing.*;i

C#下如何编写一个GUI,使其可以根据串口传输的数据实时的画出曲线,并模拟一个物体的动态?

问题描述 C#下如何编写一个GUI,使其可以根据串口传输的数据实时的画出曲线,并模拟一个物体的动态? 比如我检测的一个物体转动了1°,我想使用C#编写一个GUI,模拟这个物体运动的状态.需要使用哪些控件?? 解决方案 用chart控件就可以了.http://blog.sina.com.cn/s/blog_621e24e20101cp64.html

请人帮忙给我的女友编写一个人事管理信息系统程序,明天上午要交

问题描述 请人帮忙给我的女友编写一个人事管理信息系统程序,明天上午要交 1.①建立员工信息,包括:员工编号.姓名.性别.年龄.民族.出生日期.联系电话.婚姻状况.家庭住址.归属部门.备注: ②建立员工工资,包括:员工编号.工资编号.基本工资.加班工资.奖金.补贴.备注: ③建立员工就职,包括:员工编号.部门编号.部门名称.就职时间.离时间.手机号码.就职职位.备注: ④建立公司部门,包括:部门编号.部门名称.主管领导.员工人数.部门电话.备注: ⑤建立用户表,包括:用户名.密码.用户权限: 2.

20%的美国人曾在同一个社交网络上玩一个游戏

社交游戏已经成为一种社会现象,其渗透力惊人,社会影响不可低估.对此,各人可能裹贬不一,其实游戏本是人的天性,只要不影响工作生活,借此减轻压力舒缓身心,也算获得一种价值. oBizMedia 制作的这幅信息图通过各种数据,展示了社交游戏对网络生活,甚至是现实生活的巨大影响. •    20 % 的美国人曾在一个社交网络上玩过一个游戏,这些人中,35% 的人没有玩过任何视频游戏. •   在 Facebook上,排名前十位的社交游戏是:CityVille,FarmVille,Texas HoldEm

android studio不会画界面,求帮忙花一个,急要

问题描述 android studio不会画界面,求帮忙花一个,急要 我是android新手,现在急需要一个界面,可是我不会画,弄了几个小时了.现在很急用,赶着交差.求各位帮忙 解决方案 <?xml version="1.0" encoding="utf-8"?> android:layout_width="match_parent" android:layout_height="match_parent" >

人的思想的成长过程是一个潜意识不断成长并替代思维完成细节工作的过程

人的思想的成长过程是一个潜意识不断成长并替代思维完成细节工作的过程 太阳火神的美丽人生 (http://blog.csdn.net/opengl_es) 本文禁止转载 本文禁止转载. 潜意识和思维,是人的两个脑,首先了解这个之后,再继续下面的探索过程. ... 最终要论述的一个要点是:潜意识的野指针(学过 C 语言的应该了解野指针,即一块分配出来的内存,其变量或地址指针指向其它新分配的内存了,这块内存再也访问不到了,确被一直占据着)无目地的工作(有些像梦,但这种活动是在清醒的时侯,楞神儿是一种,

专访宜远智能:高举科研合作大旗,在AI医疗界「画圆」的初生犊

在阿里天池医疗AI大赛第一赛季的榜单上,宜远智能以0.806的分数排名第二,加州大学成绩0.815占据鳌头,北京大学以0.780的成绩排名老三,清华.复旦.浙大.上交等国内高校以及GE.联影等医疗器械商均参加了这项比赛. 意料之外Number 2的成绩,让CEO吴博信心大增,"我们原来以为肺结节智能筛查领域没机会了,参与进来才知道,我们这些新兵还是有机会的."对于今年4月份刚刚成立的宜远智能来说,"这算是一次算法上的肯定,最主要的当然是算法实用性的体现"他说道.此外

OpenAI发布“宇宙”平台,用1000+训练环境赋予AI“类人智力”

当人工智能领域大牛在西班牙NIPS会议酒店吃早餐的时候,Open AI 宣布开源了其新平台"宇宙"(Universe).这家由伊隆·马斯克资助的非赢利性AI开源组织,在周一的上午搞了个大新闻,相信NIPS的餐桌上一定热闹非凡.当然,Open AI后续也在NIPS的会场展示了自己的成果. Open AI 联合创始人Greg Brockman 在Twitter上说道,"这个AI 训练架构,是我们从Open AI建立之初就在计划着的".可见Open AI对这个平台的重视.