机器学习之Validation（验证，模型选择）

　　对于机器学习的模型选择来说，即使只是对于二元分类，我们已经学习了很多方法，比如PLA，LR等；很多学习算法都是可迭代的，需要决定迭代次数；你可能还需要决定每一次迭代走多大，例如梯度下降；或者有很多的转换可以选择，例如线性、二次等；同时规则化又有很多的选择L1，L2；再来规则化到底要加多强的λ。况且这些选择是组合起来的，某种程度上来说是组合爆炸的，那么我们怎么做出正确的选择？

　　那么对于以上两个模型，你会选择哪一个模型呢？也许你会说，可以根据自己视觉上的判断来选择模型，但是我们必须注意到，当选择的模型不是二元的，而是多元的时候，我们就不能通过视觉上的判断来选择了。还有一点，如果通过视觉上的判断来选择，我们就必须考虑到自己脑袋里那个强大的VC维模型，那么我们就不见得有多大的好处。

　　如果以上方法不行的话，那我们是不是可以选一个Ein最小的方法呢？

　　我们可以把待选择的模型跑在我们的资料上，那么我们就可以通过选择Ein最小的模型来完成机器学习。

　　那么，这么做有什么问题呢？

　　首先，我们可以想象，在这样的设定之下，我们肯定会选择复杂度很高的模型，以减小Ein，就会可能造成overfitting（过拟合）。

　　其次，这样选择模型，相当于在1班中选择一个最好的学生s1，在2班中选择一个最好的学生s2，然后再选择出s1和s2中相对较好的学生。这无疑增加了模型复杂度。

　　那我们可不可以通过选一个Etest最小的方法呢？通过一个测试集来判断Etest的大小，从而选出较好的模型？

　　看起来这是一个很好的方法。但是问题是我们能找到测试资料吗？这就好像测试考试，在正式考试之前，你会得到考卷吗？

　　我们今天是要找到一个中间方式，就是把一部分资料先拿出来当作测试资料，以保证测试资料不被污染，当要进行验证时，再把这部分资料拿出来进行测试！

　　我们选出K个数据用来进行验证，这K个数据的误差记作Eval，称为验证误差，那么剩下的N-K个数据用来训练模型，记作Dtrain；

　　一般来说，K的值大约为整个数据集数量的五分之一。

K=N5

机器学习系列之机器学习之Logistic回归(逻辑蒂斯回归）

时间： 2025-01-31 09:59:07

机器学习之Validation（验证，模型选择）的相关文章

模型选择、特征选择及贝叶斯正则化

1 问题模型选择问题:对于一个学习问题,可以有多种模型选择.比如要拟合一组样本点,可以使用线性回归,也可以用多项式回归.那么使用哪种模型好呢(能够在偏差和方差之间达到平衡最优)? 还有一类参数选择问题:如果我们想使用带权值的回归模型,那么怎么选择权重w公式里的参数? 形式化定义:假设可选的模型集合是,比如我们想分类,那么SVM.logistic回归.神经网络等模型都包含在M中. 2 交叉验证(Cross validation) 我们的第一个任务就是要从M中选择最好

jQuery插件学习教程之SlidesJs轮播+Validation验证_jquery

SlidesJs(轮播支持触屏)--官网(http://slidesjs.com) 1.简介 SlidesJs是基于Jquery(1.7.1+)的响应幻灯片插件.支持键盘,触摸,css3转换. 2.代码 <!doctype html> <head> <style> /* Prevents slides from flashing */ #slides { display:none; } </style> <script src="http:/

云计算中用户行为习惯验证模型研究

云计算中用户行为习惯验证模型研究郭福亮周钢崔良中在分析云计算安全现状的基础上针对云计算服务模式的特征建立了一种基于随机网模型的用户行为验证模型引入用户访问资源或调用服务的行为习惯度主要包括选择概率偏离度和服务占用时间两个度量此模型利用用户访问习惯度进行身份验证以此来访问用户资源并调用服务行为是一种有效的云计算用户行为验证技术且实例分析表明其具有很好的实用性. 云计算中用户行为习惯验证模型研究

在系统中使用Bean Validation验证参数

为什么要使用Bean Validation? 当我们实现某个接口时,都需要对入参数进行校验.例如下面的代码 public String queryValueByKey(String parmTemplateCode, String conditionName, String conditionKey, String resultName) { checkNotNull(parmTemplateCode, "parmTemplateCode not null"); checkNotNu

struts1-struts2项目 validation验证

问题描述 struts2项目 validation验证在struts2项目中可以用struts1的验证框架来验证表单吗

Silverlight实例教程 - Validation验证系列汇总

转自http://www.cnblogs.com/jv9/archive/2010/09/27/1836394.html Silverlight Validation验证系列教程,详细讲解Silverlight Validation验证机制,结合实际例程解释其原理和用法. 该系列适合开发Silverlight企业级项目开发人员参考阅读. 如果您在阅读中有不明之处,欢迎留言,一起探讨学习. 为了方便大家阅读Silverlight实例教程Validation验证系列,这里列出其文章列表. Sil

ASP.NET中Validation验证控件正则表达式特殊符号的说明_实用技巧

RegularExpressionValidator控件表达式说明: 方括号"[ ]"用与定义可接受的字符.[abc123] 表示控件只能接受 a,b,c,1,2,3 这6个字符: 反集合符号 " ^ "用于定义不可以接受的字符.[^a-h] 表示控件除了 a 到 h 8个字符外,都可以接受: 花括号"{ }"定义必须输入的字符个数.{6}表示只能输入6个字符 : {6,}表示必须输入6个以上,无上限 : {2,6} 表示必须输入2至6个字符:但

struts2 validation验证框架建立的步骤。

问题描述比如一个注册页面.对用户输入的姓名密码等数据的类型和长度进行验证.环境struts2我只知道要新建一个validation.xml并在里面书写代码有前辈知道建立一个完整的validation验证框架步骤是怎么的呢?需要在什么地方(jspjava类web.xmlstruts.xml)书写什么代码?只用写出每个地方的关键代码久可以了谢啦.. 解决方案解决方案二:有个简单的办法,可以直接在action中添加一个validate方法就可以进行验证了,在并在jsp页面弄一个错误提示区域就可以了

《计算复杂性：现代方法》——第一部分基本复杂性类第1章计算模型——为什么模型选择无关紧要 1.1 计算的建模：你真正需要了解的内容

第一部分基本复杂性类第1章计算模型--为什么模型选择无关紧要初看起来,为计算建立数学模型可谓难上加难.这是由于,历史上人类在解决各种计算任务的过程中用尽了各种各样的方法--从直觉和灵感到算盘或计算尺,再到现代的计算机.此外,自然界中其他生物或系统也时刻需要处理各种计算任务,而它们的解决之道也是纷乱繁杂.怎样才能找出一个能抓住这些计算方法共性的简洁的数学模型呢?如果再考虑到本书要关注的计算效率问题,则建模问题就更加无从下手了.考虑计算效率问题似乎必须小心地选择计算模型,因为即便是孩童也知道

猜你喜欢

Photoshop制作剔透梦幻的玻璃字

用图层样式制作玻璃字是非常快的.过程:先制作较暗的背景,输入想要的文字,其它图形也可以;然后用图层样式做出浮雕及发光效果,可以把文字多复制几层,填充都改为零,分别用不同的样式增加更多细节就更好看. ...

三个重庆青年开设“翻唱网”价值5000万

要是愿意,明天就可以变成千万富翁!对于普通人来说这可能是个天方夜谭,但对于"爱上网"创始人龚兆玮.高祥和黎粒3人来说,这并非不可能. 2个月前,几个美国人走进龚兆玮.高祥和黎粒的办 ...

搜房网无线主管王峰：互联网生存四原则

搜房网无线主管.网络运营专家王峰先生(山东济南人)于27号晚8点半于百忙之中抽出时间做客山东站长网.站长QQ群,与山东的198位站长共同讨论了大家比较关心的话体.我稍加整理.提取精华献给大家,希望能给 ...

接触效果按钮的制作

按钮首先请大家看看按钮的效果,请将鼠标点击按钮,去另一页看效果通过上面的示例效果,我们可以清楚的感觉到按钮被按触时凹陷的效果,如何才能制作出这样一款逼真的按触按钮呢?请和我一起来: 1.打开FW, ...

游戏分段加载用户体验设计更有利于推广

公司网游在推广的时候遇到了一个问题: "你那客户端太大了,啥都没看到,就让我下载这么半天." 其实仔细想想,这个问题是可以解决的. 很多游戏中的地图,新手都用不到.如果仅提供新手区 ...

PowerPoint问题：您试图打开的文件类型被注册表策略设置阻止

用户打开客户发来的PPT时收到此错误信息:您试图打开的文件类型被注册表策略设置阻止. 此问题是兼容性问题.按照KB操作: 其实改其中一个注册表项就成功,没必要两项都改. 1. 退出 PowerPoin ...

QQ空间音乐不能播放的解决方法

QQ空间里的歌曲为什么不能听? 1.请先确定您的音乐链接是否有效.操作方法:将您贴到音乐盒中的音乐链接,粘贴到IE浏览器的地址栏中打开,查看是否能够收听; 2.请确定您添加的音乐链接最后三个字母为mp ...

Java云计算的两种方法

最近,人们在思考如何使用Java来实现云计算,我看到了两种趋势性的方法.它们存在交叉重叠处而并非互相排斥,但总体而言它们在项目方面有着非常不同的表现: 重面向UI(Heavy UI oriented) ...

photoshop画竹子技巧

在这个教程"童学们"将学习到如何绘制竹子,先来看下效果图,感觉好好吃的样子,(呵呵,不过我不是熊猫哟.最近迷上手绘,于是专门找些教程来看,希望大家也喜欢.) 1.新建一个文档大小为 ...

Win8 Apps生态的成长轨迹

Windows 8,这个系统的诞生印证了微软这个软件巨头的转身,然而这个转身华不华丽,这取决于Win8的新生态能不能够像以往桌面平台一样繁荣,也就是Win8 Apps体系能不能带起新一轮的革命. ...

IE11地址栏一栏多用的强大功能详解

你还以为浏览器的地址栏只是输入网址用的吗?那你就大错特错啦!它没你想的那么简单!全新 IE11 的地址栏集输入网址.获取建议.搜索信息多种功能于一身,使用起来更方便更强大.现在,它有一个洋气的新名 ...

阿里旺旺停用群方法

停用群后,您群中的成员就被全部踢出,所有数据将被清空,且无法恢复.操作步骤如下: 进入群列表,右键点击群,选择"停用群": 注意:只有群主和管理员才有停用群的权限. 在弹出的提示框 ...

win7中保存的cf游戏截图在哪里？

win7中保存的cf游戏截图在哪里?下面就和小编一起来看看吧! 1.首先,咱们直接返回到win7旗舰版电脑的桌面位置,找到桌面的计算机图标,然后咱们双击打开计算机图标,就可以打开win7旗舰版电脑 ...

用asp。net做一个可视化的摊位示意图

问题描述用asp.net做一个可视化的摊位示意图我要做一个广场中的摊位基本信息, 我希望把摊位按在广场中的具体位置显示在一张图上每块摊位就是一个按钮,给提供一个思路解决方案这个用html来弄 ...

mysql 数据库-求帮助：mysql 按用户id分组，按照start时间升序排列，取每组前两条条记录

问题描述求帮助:mysql 按用户id分组,按照start时间升序排列,取每组前两条条记录 BDM_UserID BDM_ListenStartTime BDM_ListenEndTime BDM_ ...

Spark-Yarn架构介绍

1.简介 MapReduct框架从hadoop-0.23版本以后发生了重大的变革, 新的计算框架我们称为MapReudce 2.0 或者 YARN(Yet-Another-Resource-Negot ...

Java Core系列之TreeMap实现详解

因为看EHCache中溢出文件的管理代码,它用到了AA-Tree作为文件中的磁盘管理,因而决定先复习以下红黑树(RBT, Red Black Tree),顺便看看TreeMap的代码.关于红黑树,网上 ...

Dynamic Linq 的Like扩展

在上几节Linq动态组合查询时,在肖坤的Linq动态查询与模糊查询(带源码示例)时看到了微软的<Linq to SQL Dynamic 动态查询>,但是楼主说"可惜Dy ...

查询关键词-hql语句如何查询字段包含关键词

问题描述 hql语句如何查询字段包含关键词举个列子比如Topic实体,content字段是一个大文本.查询content 包含关键词(中国,台湾,香港)的记录.我想用下面这个语句.可是没有查到这种用 ...

asp.net-jquery 联动下拉框，动态添加dropdownlist option项后遇到问题

问题描述 jquery 联动下拉框,动态添加dropdownlist option项后遇到问题这是一个联动的案例选择一级菜单二级菜单随之改变, 现在选择二级菜单也就是成员那个下拉框的选项之后,点 ...

脑洞科技 | 私人订制流星雨

当你仰望星空许下诺言,一定会期待着看到流星雨. 人们非常希望看到有自然魔力的流星雨,而现在有一家日本公司可以让你圆梦,这就是私人定制流星雨. 这家公司可以在指点的时间和指定的地点交待问题 -- 双规, ...

隐私的背后

腾讯和360关于指控对方http://www.aliyun.com/zixun/aggregation/3585.html">侵犯用户隐私的口水仗越演越烈了,动用水军有之,制作专题有之 ...

android-Android弹幕的实现评论的内容怎么从下往上滚动

问题描述 Android弹幕的实现评论的内容怎么从下往上滚动解决方案 android 弹幕评论效果解决方案二: 就是位移 + 透明度动画..

泰捷视频的上云之路

泰捷创立于2010年,是一家提供家庭视频推送服务的网站视频资源聚合公司.泰捷2011年推出了一个比较重要的产品,就是泰捷的视频软件,内置在泰捷的盒子里给用户提供包括点播.直播在内的视频服务. 下文是泰 ...

c语言-杨辉三角结果全部出来

问题描述杨辉三角结果全部出来可不可以只用c语言写一下啊,结合数据结构解决方案 http://baike.baidu.com/view/7804.htm 自己去查一下就知道啊解决方案二: 杨辉三 ...

iPhone5北美市场前景光明

8月4日,美国投资银行派杰公司发布市场调查报告,认为iPhone5有可能导致苹果在北美尤其是美国市场的份额增加一倍,达到60%.如果是这样的话,iPhone 5将对android.黑莓等手机产品形成致 ...

jbpm4.4 集成spring mvc 怎么配置?

问题描述 jbpm4.4 集成spring mvc 怎么配置? 如题感谢回答~大神帮我看下如题感谢回答~大神帮我看下如题感谢回答~大神帮我看下解决方案 https://github.com/s ...

c# datatable用法总结_实用技巧

一.DataTable简介 (1)构造函数 DataTable() 不带参数初始化DataTable 类的新实例. DataTable(string tableName) 用指定的表名初始化DataT ...

三星智能电视ES8000上市

三星在CES展会上展示的智能电视EShttp://www.aliyun.com/zixun/aggregation/37392.html">8000正式上市,46英寸型号售价3千美元( ...

android开发ViewPager按比例显示图片（显示下一张图片的一部分）

重写PageAdapter的方法: public float getPageWidth(int position) { if (position == 0 || position == 2) { ...

热搜

© 2025 iVAN | info#iamivan.net | 12 q. 0.024 s.