《数学建模:基于R》一一2.3 判别分析

lda.sol <- lda(train, sp)计算待测样本的预测值和训练样本的回代值:> predict(lda.sol, tst)$class
[1]No
Levels:Have No

table(sp,predict(lda.sol)$class)

sp   Have No
 Have  5 1
 No   0 8预测结果是无春旱,回代计算中,本有6个有春旱的年份,只判对了5个.使用table()函数是为了以表格形式列出.
再看二次判别的计算结果:> qda.sol<-qda(train, sp); predict(qda.sol, tst)$class

[1]Have
Levels:Have No
>table(sp,predict(qda.sol)$class)
sp   Have No
 Have60

No08这次得到的结果是有春旱.到底是有春旱还是无春旱呢?从回代结果来看,可能有春旱更合理一些,因为二次判别的回代正确率是100%.
例2.16(Fisher Iris数据) Iris数据有4个属性,萼片的长度、萼片的宽度、花瓣长度和花瓣的宽度(单位:cm).数据共150个样本,分为三类,前50个数据为第一类——Setosa,中间的50个数据为第二类——Versicolor,最后50个数据为第三类——Virginica.数据格式如表2.13所示.试用lda()函数(或qda()函数)对Iris数据作判别分析.
表2.13 Fisher Iris数据序号萼片长度萼片宽度花瓣长度花瓣宽度种类15.13.51.40.2setosa24.93.01.40.2setosa(续)
序号萼片长度萼片宽度花瓣长度花瓣宽度种类505.03.31.40.2setosa517.03.24.71.4versicolor526.43.24.51.5versicolor1005.72.84.11.3versicolor1016.33.36.02.5virginica1025.82.75.11.9virginica1505.93.05.11.8virginica
解 R软件中提供了Iris数据(数据框iris),数据的前4列是数据的4个属性,第5列标明数据属于哪一类.
用lda()函数作判别分析,读者可仿照本例完成qda()函数的判别分析.在150个样本中随机选取100个作为训练样本,余下的50个作为待测样本,先验概率各为1/3.程序(程序名:exam0216.R)为train <- sample(1:150, 100)
z <- lda(Species ~ ., iris, prior = c(1,1,1)/3,
     subset = train)
(class<-predict(z, iris[-train, ])$class)程序中sample()函数为抽取样本,subset = train表示选择抽取的样本作为训练子集,iris[-train, ]表示在预测函数中使用其余的样本.计算结果略.看一下预测结果的准确性:> sum(class==iris$Species[-train])
[1] 50全部正确.

时间: 2024-09-13 22:03:40

《数学建模:基于R》一一2.3 判别分析的相关文章

《数学建模:基于R》一一第2章 多元分析模型

第2章 多元分析模型 本章介绍数学建模常用的多元分析模型,包括线性回归.方差分析和判别分析,以及如何使用R中的函数求解这三种多元分析模型.

《数学建模:基于R》一一1.7 数学建模案例分析——食品质量安全抽检数据分析

1.7 数学建模案例分析--食品质量安全抽检数据分析 1.7.1 问题的提出 该题选自2013年"深圳杯"数学建模夏令营A题. "民以食为天",食品安全关系到千家万户的生活与健康.随着人们对生活质量的追求和安全意识的提高,食品安全已成为社会关注的热点,也是政府民生工程的一个主题.城市食品的来源越来越广泛,人们消费加工好的食品的比例也越来越高,因此除食材的生产收获外,食品的运输.加工.包装.贮存.销售以及餐饮等每一个环节皆可能影响食品的质量与安全.另一方面,食品质

《数学建模:基于R》——导读

前 言 R是一款免费软件,主要用于统计分析.绘图和数据挖掘等.但随着R的广泛使用,R软件的求解能力已不仅仅局限于统计计算的内容,特别是R扩展程序包的下载和安装,大大地增强了R软件的计算与求解能力,例如,能够完成优化.图论与网络.数值分析等方面的计算. 本书之所以命名为<数学建模:基于R>,是因为除介绍数学建模常用的统计方法外,还着重介绍了如何从CRAN(Comprehensive R Archive Network)社区下载相关的扩展程序包,如何使用这些程序包中的函数求解线性规划.最优化.图论

《数学建模:基于R》——2.4 数学建模案例分析——气象观察站的优化

2.4 数学建模案例分析--气象观察站的优化 2.4.1 问题的提出 某地区内有12个气象观测站,为了节省开支,计划减少气象观测站的数目.已知该地区12个气象观测站的位置,以及10年来各站测得的年降水量(见表2.14,为便于计算,将表中的数据保存在文本文件rainfall.data中).减少哪些观测站可以使所得到的降水量的信息足够大?观察站分布如图2.7所示. 2.4.2 假设 2.4.3 分析 题目要求减少一些观测站,但获得的降水量的信息足够大,如何做到这一点呢?首先要考虑降水量的信息问题.对

《数学建模:基于R》——1.7 数学建模案例分析——食品质量安全抽检数据分析

1.7 数学建模案例分析--食品质量安全抽检数据分析 1.7.1 问题的提出 1.7.2 问题1:三年各主要食品领域安全情况的变化趋势 1.7.3 问题2:找出某些规律性的东西 1.7.4 问题3:如何改进食品的抽检办法 1.7.5 结论 (1) 深圳市2010年至2012年三年来的食品安全状况逐年变好; (2) 食品的餐饮.储存等各环节与食品质量有关; (3) 食品产地与食品质量有关,而且是负相关; (4) 食品的抽检地点与食品质量有关; (5) 饮品和水产类食品的质量与季节无关,果蔬.粮食.

数学建模十大算法

作者:July  二零一一年一月二十九日   一.蒙特卡罗算法1946年,美国拉斯阿莫斯国家实验室的三位科学家John von Neumann,Stan Ulam 和 Nick Metropolis 共同发明了,蒙特卡罗方法. 此算法被评为20世纪最伟大的十大算法之一,详情,请参见我的博文:http://blog.csdn.net/v_JULY_v/archive/2011/01/10/6127953.aspx   蒙特卡罗方法(Monte Carlo method),又称随机抽样或统计模拟方法

信道估计-有一个数学建模问题用Matlab绘图后不是期望的图,是我选择的点数太多还是……

问题描述 有一个数学建模问题用Matlab绘图后不是期望的图,是我选择的点数太多还是-- n=82*2201; a=zeros(1,n); x=[real.txt]; X=x(1:2200:end); a(1:2201:n)=X; l=length(a);1*180482 x=x(:);9*2000->1*180000 x=x'; x=[x,zeros(1,482)];1*180482 x=x-a; x(x==0)=[];1*179999 x=x';179999*1 xk-用excel抽样的 Y

数学建模实录(4)

作者:孤剑     这几天一直担心数学建模的问题,虽然自己过生日的时候,我认为的几个朋友没有打电话给我,很伤心,但是生活不容许你有太多的伤心,还是得学习.     眼看马上就要到了数学建模考试的时间了,自己还有很多的东西需要学习,今天看了看微分方程的求解,不时很明白. [t,x]=solver('function',ts,x0,options) 说明: 1.t为由solver返回的函数的自变量: 2.x为由solver返回的函数值: 3.solver为微分方程的解决函数,ode23,ode45,

基于R树索引的点面关系判断以及效率优化统计

文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景 在之前的博客中,我分别介绍了基于网格的空间索引(http://www.cnblogs.com/naaoveGIS/p/5148185.html)以及四叉树和网格结合的联合索引(http://www.cnblogs.com/naaoveGIS/p/6641449.html),要解决的问题均是判断一个点落在了面图层中的哪个面要素中.单从算法层面上分析,以上两种索引

ASP在数学建模中的基础应用

    曾编了一个程序,应用于数学建模的数据提取阶段.现归纳如下,思路写得比较详细,看起来像教程-_-. 目的是做一个BBS的流量统计,需要分析的数据是每一分钟之内,有哪些ID在线,这些ID的IP是多少,并且要求ID与IP一一对应,不能有重复ID和重复IP,并要求每一分钟生成一个矩阵,分别是ID IPA段 IPB段 IPC段 IPD段, 并存成文本文件, 文件名为hh:mm格式. 然后把这些文本文件导入MatLab进行分析处理,现讨论前面的数据获得阶段的实现方法. 数据源从http://bbs.