神经网络CNN训练心得--调参经验

1.样本要随机化，防止大数据淹没小数据

2.样本要做归一化。关于归一化的好处请参考：为何需要归一化处理
3.激活函数要视样本输入选择(多层神经网络一般使用relu)
4.mini batch很重要，几百是比较合适的(很大数据量的情况下)
5.学习速率(learning rate)很重要，比如一开始可以lr设置为0.01，然后运行到loss不怎么降的时候，学习速率除以10，接着训练
6.权重初始化，可用高斯分布乘上一个很小的数，这个可以看：权值初始化

7.Adam收敛速度的确要快一些，可结果往往没有sgd + momentum的解好（如果模型比较复杂的话，sgd是比较难训练的，这时候adam的威力就体现出来了）

8.Dropout的放置位置以及大小非常重要

9.early stop，发现val_loss没更新，就尽早停止

另：心得体会
深度学习真是一门实验科学，很多地方解释不了为什么好，为什么不好。

网络层数、卷积核大小、滑动步长，学习速率这些参数的设置大多是通过已有的架构来做一些微调

参考：知乎讨论 https://www.zhihu.com/question/41631631

时间： 2024-09-29 11:59:51

神经网络CNN训练心得--调参经验的相关文章

【直观梳理深度学习关键概念】优化算法、调参基本思路、正则化方式等

引言深度学习目前已成为发展最快.最令人兴奋的机器学习领域之一,许多卓有建树的论文已经发表,而且已有很多高质量的开源深度学习框架可供使用.然而,论文通常非常简明扼要并假设读者已对深度学习有相当的理解,这使得初学者经常卡在一些概念的理解上,读论文似懂非懂,十分吃力.另一方面,即使有了简单易用的深度学习框架,如果对深度学习常见概念和基本思路不了解,面对现实任务时不知道如何设计.诊断及调试网络,最终仍会束手无策. 本系列文章旨在直观系统地梳理深度学习各领域常见概念与基本思想,使读者对深度学习的重要概念

DeepMind提出快速调参新算法PBT，适用GAN训练（附论文）

从围棋到Atari游戏到图像识别和语言翻译,神经网络在各个领域都取得了巨大的成功.但是经常容易被忽视的是,神经网络在某个特定应用中的成功通常取决于在研究初始时所做的一系列选择,包括选择要使用的网络类型以及用于训练的数据和方法.目前,这些选择(被称作超参数)是通过经验.随机搜索或计算密集型的搜索过程来实现的. DeepMind在最近的一篇论文<基于群体的神经网络训练>(Population Based Training of Neural Networks)中,提出了一种新的训练神经网络的方法,

卷积神经网络CNN总结

从神经网络到卷积神经网络(CNN) 我们知道神经网络的结构是这样的: 那卷积神经网络跟它是什么关系呢? 其实卷积神经网络依旧是层级网络,只是层的功能和形式做了变化,可以说是传统神经网络的一个改进.比如下图中就多了许多传统神经网络没有的层次. 卷积神经网络的层级结构数据输入层/ Input layer 卷积计算层/ CONV layer ReLU激励层 / ReLU layer 池化层 / Pooling layer 全连接层 / FC layer 1.数据输入层该层要做的处理主要是对原始图

Fregata 机器学习算法库开源：快速，无需调参

一. 大规模机器学习的挑战随着互联网,移动互联网的兴起,可以获取的数据变得越来越多,也越来越丰富.数据资源的丰富,给机器学习带来了越来越多,越来越大创造价值的机会. 机器学习在计算广告,推荐系统这些价值上千亿美元的应用中起到的作用越来越大,创造的价值也越来越大.但是越来越大的数据规模也给机器学习带来了很多挑战. 最大的挑战就是庞大的数据量使得对计算资源的需求也急剧增长.首先经典的机器学习算法其计算量基本上都是与训练数据条数或者特征数量呈二次方甚至是三次方关系的[1].即是说数据量或者特征数每翻

轻量级大规模机器学习算法库Fregata开源：快速，无需调参

一. 大规模机器学习的挑战随着互联网,移动互联网的兴起,可以获取的数据变得越来越多,也越来越丰富.数据资源的丰富,给机器学习带来了越来越多,越来越大创造价值的机会. 机器学习在计算广告,推荐系统这些价值上千亿美元的应用中起到的作用越来越大,创造的价值也越来越大.但是越来越大的数据规模也给机器学习带来了很多挑战. 最大的挑战就是庞大的数据量使得对计算资源的需求也急剧增长.首先经典的机器学习算法其计算量基本上都是与训练数据条数或者特征数量呈二次方甚至是三次方关系的[1].即是说数据量或者特征数每翻

Top100论文导读：深入理解卷积神经网络CNN（Part Ⅰ）

更多深度文章,请关注:https://yq.aliyun.com/cloud 作者信息 Adrian Colyer:morning paper编辑.Accel Partners投资合伙人.SpringSource首席技术官.VMware技术总监. 领英:http://www.linkedin.com/in/adriancolyer/ Twitter:https://twitter.com/adriancolyer 本文介绍清单" Top100深度学习论文" 中几篇文章,现在将从&quo

matlab bp 神经网络-matlab实现BP神经网络，训练结果不好，附源代码

问题描述 matlab实现BP神经网络,训练结果不好,附源代码希望大家看看,谢谢了!自己看了一整天都不知道哪里出现了问题,编程思想按照经典的机器学习的书 lr=0.05; %lr为学习速率:err_goal=0.1; %err_goal为期望误差最小值max_epoch=15000; %max_epoch为训练的最大次数:a=0.9; %a为惯性系数Oi=0;Ok=0; %置隐含层和输出层各神经元输出初值为0%提供两组训练集和目标值(3输入神经元,2输出)%X=[1 1;-1 -1;1 1];

Top100论文导读：深入理解卷积神经网络CNN（Part Ⅱ）

更多深度文章,请关注:https://yq.aliyun.com/cloud 作者信息 Adrian Colyer:morning paper编辑.Accel Partners投资合伙人.SpringSource首席技术官.VMware技术总监. 领英:http://www.linkedin.com/in/adriancolyer/ Twitter:https://twitter.com/adriancolyer 这篇文章介绍" top100深度学习论文"列表中卷积神经网络的第二部分,

一文读懂卷积神经网络CNN（学习笔记）

首先文章的提纲为: CNN栗子镇楼What is CNN 什么是卷积什么是池化 Why CNN对CNN的其他一些理解CNN实现(接口) 1.CNN栗子(A Beginning Glimpse of CNN) Modern CNN since Yann LeCun 2. 上面是最经典和开始的两篇CNN的结构图 2.What is CNN? 神经网络?卷积? 2.1 什么是卷积? 卷积的定义其连续的定义为: 特点: 2.2 离散卷积的栗子: 丢骰子时加起来要等于4的概率是多少? 二维离散的卷积

猜你喜欢

C#体验Microsoft.NET平台基础构造

microsoft 抛开Microsoft.NET平台去谈C#是没有意义的,C#之"Sharp"也正在其后端强大的平台.仅仅拘泥于语法层面是体验不了C#的锐利之处的,C#程序很多诡 ...

07年个人站出路之一，建垂直行业网站

垂直行业网站是针对某一个行业兴建的,并对这一行业发生的资讯.交易等进行深度整合配置的网站.这类网站无需普通娱乐站那样的巨大流量,也可以实现教大的盈利. 鄙人最近对数十个比较熟悉的娱乐站和行业站进 ...

用Dreamweaver实现ASP动态网站建设

dreamweaver|动态|网站建设 Macromedia Dreamweaver MX 是一款专业的 HTML 编辑器,用于对 Web 站点.Web 页和 Web 应用程序进行设计.编码和开发.无 ...

自动化安装让Vista安装变得简单

Vista系统状态图像管家(SIM)是一个图形界面程序,它能使用户为无人值守安装创建"回答文件". 回答文件就像早先在Windows 2000/XP上的"unattend ...

确定一个应用程序是否没有响应

今天在MSN的核心讨论组上看到两篇文章.讨论的乃是应用程序是否没有响应.原文如下: > How is it possible to determine a process is "no ...

C#反射命名空间浅析

学习C#反射命名空间之前我们来看看C#反射的概念,反射是一个运行库类型发现的过程. 通过反射可以得到一个给定程序集所包含的所有类型的列表,这个列表包括给定类型中定义的方法.字段.属性和事件.也可以 ...

Photoshop给风景图片加上大气的霞光

Photoshop给风景图片加上大气的霞光素材图片非常有气势,只是天空泛白,影响整体效果.处理的时候,先给天空部分换上霞光素材;然后把主色转为暖色,局部再渲染高光模拟出霞光效果 ...

php实现的IMEI限制的短信验证码发送类

php实现的IMEI限制的短信验证码发送类 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 ...

Excel提示“#NAME”提示

在使用Excel的过程中,出现了"#NAME"的错误信息提示. 这种情况一般是由于在公式使用了无法识别的文本.解决这种情况,选择"插入"→"名称& ...

阿里旺旺网页版官网登陆页面地址在哪里？

旺旺网友提问: 淘宝网友提问: 阿里旺旺网页版官网登陆入口地址在哪里? 热心网友回答: 1.您必须具有一个旺旺帐号,直接点此http://webwwtb.im.alisoft.com/wangwang ...

硬盘发生错误怎么办，磁盘修复方法

磁盘错误对电脑的损伤自不用多言,这里介绍一种人人都可操作的最简便的的修复方法. 步骤方法 1.打开我的电脑,点击任何一个磁盘,右键"属性"→点击"工具"选项卡→ ...

在Word2003中使用查找替换功能

在Word2003中完成文字输入和格式设置工作后,一篇Word文档并不能马上交工.因为在录入文字或撰写文章的过程中,难免会存在一些纰漏,甚至会出现大量的错别字.逐字查找和修改绝对不切合实际,而Wo ...

Windows 8 Windows update 更新报错80244fff的解决思路

故障现象: Windows 8 Windows update 更新报错80244fff. 原因分析: 没有设置更新Windows体验指数. 解决方案: 第一步:更新Windows体验指数 1. 右 ...

Dropbox无法连接怎么办

Dropbox无法连接怎么办?dropbox无法登陆有什么解决办法呢?同步共享服务Dropbox从6月18日开始再次遭到封锁,原因是DNS污染.Dropbox上次在2010年5月曾遭到IP封锁和网 ...

mtk6753参数怎么样？

mtk6753参数怎么样?大家可以通过下文来了解关于mtk6753参数性能方面的内容,MTK6753将会在2015年与大家见面,那么这款处理器如何呢?大家可以一起来了解哦. MediaTek MT ...

禁止随意更改系统字体大小

设置禁止随意更改系统字体大小后,阻止用户更改显示在屏幕上的窗口和按钮的字体大小.如果启用此设置,显示属性的"外观"选项卡的"字体大小"下拉列表会被禁用.如果 ...

JQuery防止退格键网页后退的实现代码_jquery

下面是Js片段在IE9,Firebox 10.0.2 中测试过 : 复制代码代码如下: $(document).keydown(function (e) { var doPrevent; if (e ...

kvproxy配置文件之集群设置

简介 kvproxy中集群分为三种.默认集群,读集群和备份集群.读集群和备份集群都是可选项.如果没有设置读集群,将会从默认集群读取数据.如果没有设置备份集群,将不会做数据同步操作.更多kvproxy的 ...

分页-infinitescroll手动加载下一页不成功

问题描述 infinitescroll手动加载下一页不成功代码大体上是这样的 $(".lists").infinitescroll({ navSelector : "# ...

新闻出版总署下发《关于进一步规范出版物文字使用的通知》

摘要: 12月21日消息,今天,新闻出版总署下发了<关于进一步规范出版物文字使用的通知>.通知规定,纸.期刊.图书.音像制品和电子书.互联网等各类出版物禁止出现随意夹带使用英文 12月21 ...

Android零基础入门第6节：配置优化SDK Manager，正式约会女神

原文:Android零基础入门第6节:配置优化SDK Manager,正式约会女神在前几期中总结分享了Android的前世今生.Android 系统架构和应用组件那些事.带你一起来聊一聊Androi ...

doctrine2到底是个什么玩意

之前和最近一个项目用到了Doctrine,由于是别人搭建的,自己没有很了解,最近又开始做的时候发现拙荆见肘,于是看了一下doctrine教程,本文就是加上自己理解的doctrine教程文档笔记了. D ...

2017年直播群雄逐鹿：社交直播会否收割行业未来？

2016年已经过去.在过去一年,直播行业的火热程度自不必多说.据不完全的公开数据统计,目前已有31家直播公司完成36起融资,造就108.32亿元神话.超过200多家直播平台如雨后春笋般拔地而起,而网络 ...

未来的社会企业家面孔

--阿拉善之思文/丁杰静古老的"木桶定理"告诉我们,组成木桶最短的那块板,决定了它的容量.据"社会企业家"权威代言人戴维所言,名副其实的社会企业家,以下六要 ...

derby数据库的操作

问题描述最近采用IBM的derby数据库做软件,发现很多操作不能用.包括建表以后不能修改列,还有rand(),newid()函数也不能用,求高手帮帮忙想一下解决方案,我想在数据库表中查出随机的id, ...

为什么hadoop对你大数据处理的意义重大

Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取.变形和加载(ETL)方面上的天然优势.Hadoop的分布式架构,将大数据处理引擎尽可能的靠近存储,对例如像ETL这样的批处理操作相对合 ...

原创内容给力营销注重用户效果更佳

中介交易 SEO诊断淘宝客云主机技术大厅这是一个鼓励创新的时代,但是并没有适宜原创的土壤.其中有诸多法律意识淡薄,也有更多是灰色心态使然.面对善于模仿和山寨的伪创新,有学者甚至一语见地的指出& ...

在 ASP.NET2.0 中使用计时器（Timer）

我在实验中发现在 ASP.NET 中可以使用计时器(Timer)完成一些定时动作.这一点可能会对我们的一些 Web 程序有益. 注: 原文里只有VB.NET的代码, 为了方便大家, 我写了C#版 ...

求个正则，2个符号内的匹配

问题描述 3月28日16:34分左右,小明和小王一起外出游玩.其上公交的时,因小明无意把携带的可乐弄撒了小王一身.小王很生气的回家了.在这段话中做2次的匹配.. 从头开始每出现一个标点(,.?!) ...

基于物联网的医疗健康：一个价值1630亿美元的巨额潜力市场

基于物联网的医疗健康众所周知,医疗健康是一个备受争议但价值创造能力较强的行业.越来越高的医疗成本.颇为复杂的保险制度.过度工作的医生和护士,以及尚未解决的公共卫生问题,都在不同程度上对病患和专业医护 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.019 s.