正当时......

学术咨询服务

当前位置：职称论文发表咨询网》电子信息职称》职称论文发表网基于Matlab的考试数据

职称论文发表网基于Matlab的考试数据

来源：职称论文发表咨询网作者：职称论文时间：2015-05-06 14:57

　　摘要：介绍了统计分析方法中的主成分分析法，对考生考试成绩数据利用matlab软件进行了主成分分析，得出了数据的主成分和综合评价函数，并结合学生成绩进行分析，了解到了每个考生在数学学科学习上有哪些优势和不足，从而为改善学习方法和提高学习成绩方面的提供重要参考。

　　关键词：主成分分析;考生考试数据;matlab软件　电子期刊

　　1 概述

　　考试是用来教学评价和检查考生学习情况的基本手段，但每一次考试带给我们的信息，绝不仅仅是每个考生的具体得了多少分数。其实我们还可以了解到更多考生的学习情况，那么我们就需要对批改试卷产生的数据进行统计分析，根据分析结果得到的结论，能够为教学和学习提供参考，从而能不断改进我们教学和学习工作。

　　对试卷进行统计分析时，我们会发现试卷各试题之问往往存在一定的相关性，即有些题目考察了相似的知识点和考点，对得到的数据不进行任何处理就进行分析，势必会把试卷分析的变得复杂化.就不容易抓住数据的主要规律并对事物的性质做出准确的评价。因此，我们需要把原来的指标转化为一个或少数几个互相独立的综合指标来达到分析的目的。该文讲的主成分分析法就是能达到这种目的的统计分析方法。

　　2 主成分分析的基本原理

　　2.1 主成分分析的基本思想[1]

　　主成分分析首先是Hotelling于1933年时提出的。主成分分析是一种利用数学思想达到降低维数的统计方法，即通过找出几个综合指标来代替众多的原始指标，并尽可能多的反映原始数据所提供的信息量，而且彼此之间相互独立。主成分分析所要做的内容就是要设法把原来具有一定相关性的众多变量，重新组合成一组新的相互独立的综合变量来代替原来变量，通常数学上的处理方法就是将原来的变量做线性组合，作为新的综合变量，但这种组合如果不加以限制，就会有很多情况，那么我们如何选择呢?如果将选取的第一个线性组合作为第一个综合变量记为[F1]，那么我们自然希望它能尽可能地反应原来变量的信息，这里我们把包含“信息”的多少用方差来测量，即[Var(F1)]越大，表示[Y1]包含的信息越多。

　　因此所选取的[F1]应该是所有的线性组合中方差最大的，我们把[F1称为]第一主成分。如果第一主成分不能够代表原来多个变量的基本信息，那么就再选取第二个线性组合[F2]，为了有效的反应原来信息，[F1]已有的信息就不需要再出现在[F2]中，用数学语言表达就是要求[CovF1，F2=0]，我们把[F2称]为第二主成分，依此类推，可以得到出第三、第四……第[p]个主成分。

　　2.2 主成分分析的基本理论[2]

　　设研究某一事物时涉及到[p]个变量，我们分别用[X1，X2，…，XP]表示，[X=(X1，X2，…，XP)T为]这[p]个指标构成的[p]维随机向量。设随机向量[X]均值[EX]和协方差阵[DX]分别为[μ]和Σ。对[X]进行线性变换，即可得到新的综合变量，它可由原来的变量线性表示，即满足下式：

　　[Yi=μTiX=μ1iX1+μ2iX21+…+μpiXpi=1，2，…，p ] (1)

　　易见 [VarYi=μTiμi，CovYi，Yj=μTiμj，(i，j=1，2，…，p)]

　　定义1 设[X=X1，X2，…，XPT] 为[P]维随机向量。称[Yi=μTiX] 为[X] 的第[i]主成分[i=1，2，…，p，如果：]

　　[μTiμi]=[μ21i+μ21i+…+μ21i=1，i=1，2，…，p] (2)

　　[CovYi，Yj=0]，[i≠j， i，j=1，2，…，p，即Yi与Yj不相关] (3)

　　[VarY1?VarY2?…?VarYp] (4)

　　从这个定义1，我们可以知道主成分是原来[p]个原始变量进行特殊线性组合构成的. 那么，我们如何来求主成分呢? 一般地，我们有：

　　定理 2 设[X=X1，X2，…，XPT] 为[P]维随机向量。且[D(X)=Σ]， [Σ] 的特征值为 [λ1≥λ2?…≥λp>0，] [α1，α2，…，αp]为相应的单位正交特征向量，

　　则[X]的第[i]主成分为[Fi=αTiX i=1，2，…，p]

　　从这个定义2，我们了解到要求[X]的第[i]主成分，必须首先求出[X]方差的第[i]大特征值和相应的单位正交特征向量。

　　2.3 主成分分析的分析步骤[3]

　　设研究某一事物涉及[到p]个变量，每个变量都有[n]个数据。那么我们就可以得到一个[n×p]阶的矩阵，将其记为

　　[X=xijnm=x11…x1p???xn1…xnp]=[X1，X2，...，Xp]

　　1)对矩阵[X]进行标准化处理

　　[xij=xij-xjσj]，[i=1，2，...，n;j=1，2，...，p]，

　　其中[xj=1ni=1nxij]，[σj=1ni=1nxij-xij2] ，

　　得到标准化矩阵仍记为

　　[X=xijnm=x11…x1m???xn1…xnm]

　　[Xi=x1i，xni，...xniT，i=1，2，...，p]

　　2) 求标准化后矩阵的相关系数矩阵：

　　[R=r11…r1n???rp1…rpn]=[1nXTX]

　　其中，[rij=1ni=1nxijxik=1nXiTXk]，[j，k=1，2，...，p]

　　3) 求相关系数矩阵[R]的特征值[λi]和相应的特征向量[αi]

　　4) 确定要选取的主成分个数，我们称[λkk=1pλk]为第[k]个主成分的贡献率，记为[ρk]，称[k=1mλkk=1pλk]为前[m]个主成分的累积贡献率。当前[m]个主成分累积贡献率超过[83%]时，取前[m]个主成分代替原来的[p]个指标。

　　5) 求各主成分载荷[βi=λiαi]以及主成分载荷矩阵，再计算各主成分的得分函数[Fi=αiXi，i=1，2，...，m]

　　6) 把各变量的原始数据标准化后代入各主成分方程中，求得综合评价值[F=ρ1F1+ρ2F2+...+ρmFm]进行分析评价。

　　3 应用主成分分析法分析考生成绩[4-5]

　　3.1 选取主成分和构造综合评价函数

　　以贵阳某中学的一个班在高三模拟考试中的数学选择题的得分情况的数据为例.运用主成分分析法对考生数学学习情况进行分析。该班一共有50名考生。高中数学选择题共12题，每题5分，将数学选择题每个题目分别用[X1]、[X2]、[…]、[X12]。来表示，用[xij]表示第i个考生在数学选择题第j题上的得分，则这样就得到了一个[X=(xij)50×12]的矩阵，因此我们可以借助matlab主成分分析程序对这个矩阵进行主成分分析，得到下列结果：

　　根据主成分分析的相关理论，在选取主成分时，只需要将特征值从小到大排列，选取前[m]个累计贡献率超过83%的主成分即可，通过上面表格和图形的显示的累计贡献率可知，我们只需要选取5个主成分，从上面累积贡献率情况可知我们选取的这5个主成分是可以反映全部指标的基本信息，所以可以用这5个新变量来代替原来的12个变量。根据前面讲到的定理2我们可以得到选择题的5个主成分公式，如下所示：

　　[F1=0.1932X1+0.1359X2+0.3402X3+0.2662X4+0.1254X5+0.2944X6 +0.2828X7+0.2454X8+0.5176X9+0.4098X10+0.2061X11+0.1915X12]

　　[F2=0.5196X1+0.5343X2+0.4956X3+0.2918X4-0.3985X5-0.4281X6 +0.3391X7-0.1558X8-0.1008X9+0.3771X10-0.3291X11-0.1933X12]

　　[F3=-0.0117X1-0.1687X2+0.1733X3-0.2693X4-0.3008X5+0.0588X6 +0.3456X7+0.5041X8-0.2919X9-0.2080X10-0.1174X11+0.5090X12]

　　[F4=-0.0802X1-0.0883X2+0.3429X3-0.0951X4-0.4928X5+0.5271X6 +0.0005X7-0.1161X8+0.1591X9-0.1941X10-0.2019X11-0.2702X12][F5=0.0993X1+0.1617X2+0.2707X3-0.0251X4+0.1000X5+0.1639X6 -0.3226X7-0.4542X8+0.0146X9+0.0011X10-0.4819X11+0.5571X12]

　　根据主成分分析的分析步骤的第6步可得到选择题综合评价函数：

　　[F=0.1894X1+0.1578X2+0.3443X3+0.0904X4-0.1792X5+0.0873X6 +0.1840X7+0.0356X8+0.1024X9+0.1524X10-0.1397X11+0.1210X12]

　　3.2 选择题主成分分析

　　3.2.1 各题目重要性比较

　　通过图1，我们可以知道变量[X1]、[X2]、[X3]、[X7]、[X8]、 [X9]、[X12]所对应的题目要高于平均重要性，而变量[X4]、[X5]、[X6]、[X8]、[X11]所对应的题目重要性要低于平均重要性(0.0955)。

《职称论文发表网基于Matlab的考试数据》

上一篇：电子工程师浅析基于可信相似度的过滤算法

下一篇：电子职称论文刊发浅析对计算机实践操作