最新厦门大学《应用多元统计分析》第10章_多维标度法PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《最新厦门大学《应用多元统计分析》第10章_多维标度法PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新厦门大学《应用多元统计分析》第10章_多维标度法PPT课件.ppt(61页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。
1、第一节第一节 引引 言言n在实际中我们会经常遇到这些的问题,给你一组城市,你总在实际中我们会经常遇到这些的问题,给你一组城市,你总能从地图上测出任何一对城市之间的距离。但若给你若干城能从地图上测出任何一对城市之间的距离。但若给你若干城市的距离,你能否确定这些城市之间的相对位置呢?假定你市的距离,你能否确定这些城市之间的相对位置呢?假定你知道只是哪两个城市最近,哪两个城市次近等等,你是否还知道只是哪两个城市最近,哪两个城市次近等等,你是否还能确定它们之间的相对位置呢?假定通过调查了解了能确定它们之间的相对位置呢?假定通过调查了解了10种饮种饮料产品在消费者心中的相似程度,你能否确定这些产品在消料
2、产品在消费者心中的相似程度,你能否确定这些产品在消费者心理空间中的相对位置呢?在实际中我们常常会遇到类费者心理空间中的相对位置呢?在实际中我们常常会遇到类似这样的问题。似这样的问题。n多维标度法(多维标度法(Multidimensional Scaling)就是解决这类问题)就是解决这类问题的一种方法,它是一种在低维空间展示的一种方法,它是一种在低维空间展示“距离距离”数据结构的数据结构的多元数据分析技术,简称多元数据分析技术,简称MDS。n多维标度法起源于心理测度学,用于理解人们判断的相似性。多维标度法起源于心理测度学,用于理解人们判断的相似性。Torgerson拓展了拓展了Richards
3、on及及Klingberg等人在三、四十年等人在三、四十年代的研究,具有突破性地提出了多维标度法,后经代的研究,具有突破性地提出了多维标度法,后经 n在进行多维标度分析时,如果数据是多个分析变量的原始数在进行多维标度分析时,如果数据是多个分析变量的原始数据,则要根据聚类分析中介绍的方法,计算分析对象间的相据,则要根据聚类分析中介绍的方法,计算分析对象间的相似测度;如果数据不是广义距离阵,要通过一定的方法将其似测度;如果数据不是广义距离阵,要通过一定的方法将其转换成广义距离阵才能进行多维标度分析。转换成广义距离阵才能进行多维标度分析。 二、古典多维标度分析的思想及方二、古典多维标度分析的思想及方
4、 法法n n n n n n n这里需要特别注意,并非所有的距离阵都存在一个这里需要特别注意,并非所有的距离阵都存在一个r维的欧维的欧氏空间和氏空间和n个点,使得个点,使得n个点之间的距离等于个点之间的距离等于D。因而,并不。因而,并不是所有的距离阵都是欧氏距离阵,还存在非欧氏距离阵。是所有的距离阵都是欧氏距离阵,还存在非欧氏距离阵。n当距离阵为欧氏时,可求得一个当距离阵为欧氏时,可求得一个D的构图的构图X,当距离阵不是,当距离阵不是欧氏时,只能求得欧氏时,只能求得D的拟合构图。在实际应用中,即使的拟合构图。在实际应用中,即使D为为欧氏,一般也只求欧氏,一般也只求r =2或或3的低维拟合构图。
5、的低维拟合构图。n值得注意的是,由于多维标度法求解的值得注意的是,由于多维标度法求解的n个点仅仅要求它们个点仅仅要求它们的相对欧氏距离与的相对欧氏距离与D相近,也就是说,只与相对位置相近而相近,也就是说,只与相对位置相近而与绝对位置无关,根据欧氏距离在正交变换和平移变换下的与绝对位置无关,根据欧氏距离在正交变换和平移变换下的不变性,显然所求得解并不唯一。不变性,显然所求得解并不唯一。 三、度量三、度量MDS的古典解的古典解n (4)根据()根据(10.7)式计算)式计算 ,得到,得到r维拟合构图(简称古典维拟合构图(简称古典解)。解)。 这里需要注意,如果这里需要注意,如果i i中有负值,表明
6、中有负值,表明D是非欧氏是非欧氏型的。型的。(一)已知距离矩阵的(一)已知距离矩阵的CMDS计算计算n以前述美国以前述美国10城市间的飞行距离数据来说明古典度量多维标城市间的飞行距离数据来说明古典度量多维标度法的计算过程。度法的计算过程。n表表10.1美国美国10城市间的飞行距离为比率测度。数值越大表明城市间的飞行距离为比率测度。数值越大表明距离越远,数值越小表明距离越短,符合广义距离阵的定义,距离越远,数值越小表明距离越短,符合广义距离阵的定义,又只涉及一个距离阵,因此为度量又只涉及一个距离阵,因此为度量CMDS。n根据上述度量古典根据上述度量古典CMDS的计算方法,首先可求得内积矩阵,的计
7、算方法,首先可求得内积矩阵,结果见表结果见表10.2。 表表10.2 美国美国10城市内积矩阵城市内积矩阵B n n10个城市的坐标分别为:个城市的坐标分别为: (-718.759,142.9942),(),(-382.056,-340.84),),(481.602,-25.285),(),(-161.466,572.77),(),(1203.738,390.100),(),(-1133.53,581.907),(),(1072.24,-519.024),),(1420.603,112.589),(),(1341.723,-579.739),(),(-979.622,-335.473)。)。n
8、计算结果表明,较大的特征值有两个,说明在二维平面上表计算结果表明,较大的特征值有两个,说明在二维平面上表示示10城市间的相对位置是合适的。由于有特征值小于零,表城市间的相对位置是合适的。由于有特征值小于零,表明距离阵不是欧氏型,其结果为拟合构图。在此,城市是明距离阵不是欧氏型,其结果为拟合构图。在此,城市是“对象对象”,飞行里程是,飞行里程是“相似性相似性”。图。图10.1给出了给出了MDS反映反映美国美国10座城市相对位置的感知图。图中的座城市相对位置的感知图。图中的10个点,每个点代个点,每个点代表一个城市,相近的点代表飞行距离短的城市,相距较远的表一个城市,相近的点代表飞行距离短的城市,
9、相距较远的点代表飞行距离远的城市。点代表飞行距离远的城市。 图图10.1 10城市坐标感知图城市坐标感知图 n n n相关系数的值越大,表示课程越相似,相关系数值越小,表相关系数的值越大,表示课程越相似,相关系数值越小,表明课程越不相似,显而易见,相关系数矩阵为相似系数矩阵,明课程越不相似,显而易见,相关系数矩阵为相似系数矩阵,记为记为C。 表表10.3 6门课程相关系数阵门课程相关系数阵 n根据变换(根据变换(10.8)式可得到距离阵)式可得到距离阵D,见表,见表10.4。在此基础。在此基础上,根据(上,根据(10.5)式得到内积矩阵)式得到内积矩阵B,具体结果见表,具体结果见表10.5。
10、表表10.4 距离阵距离阵D n 表表10.5 内积矩阵内积矩阵 n从结果知距离阵从结果知距离阵D不是欧氏型,我们取不是欧氏型,我们取r=2,由(,由(10.7)式求)式求得得D的古典解,结果如下:的古典解,结果如下:n图图10.2大体反映了这六门课程的基本结构,从图中可以直观大体反映了这六门课程的基本结构,从图中可以直观的看出,算术、代数、几何较为相近,英语和盖尔语较为相的看出,算术、代数、几何较为相近,英语和盖尔语较为相近,而历史课程与其他课程的差异性较大。近,而历史课程与其他课程的差异性较大。图图10.2 六门课程的古典解感知图六门课程的古典解感知图 四、非度量四、非度量MDS的古典解的
11、古典解 (nonmetric MDS)n在实际问题中,我们涉及更多的是不易量化的相似性测度,在实际问题中,我们涉及更多的是不易量化的相似性测度,如两种颜色的相似性,虽然我们可以用如两种颜色的相似性,虽然我们可以用1表示颜色非常相似,表示颜色非常相似,10表示颜色非常不相似,但是这里的数字只表示颜色之间的表示颜色非常不相似,但是这里的数字只表示颜色之间的相似或不相似程度,并不表示实际的数值大小,因而是定序相似或不相似程度,并不表示实际的数值大小,因而是定序尺度,这时是由两两颜色间的不相似数据尺度,这时是由两两颜色间的不相似数据 ij形成形成“距离距离”矩矩阵。对于非度量的不相似性矩阵,我们如何进
12、行多维标度分阵。对于非度量的不相似性矩阵,我们如何进行多维标度分析呢?假定有一个析呢?假定有一个n个对象的不相似矩阵个对象的不相似矩阵( ij)n n ,要寻找,要寻找n个对象的一个个对象的一个r维拟合构造点维拟合构造点X。下面介绍。下面介绍Kruskal的非度量的非度量MDS分析方法。分析方法。 n为了寻找一个较好的拟合构造点,我们可以从某一个拟合构为了寻找一个较好的拟合构造点,我们可以从某一个拟合构造点开始,即先将造点开始,即先将n个对象随意放置在个对象随意放置在r维空间,形成一个感维空间,形成一个感知图,用知图,用Xi =(Xi 1,Xi 2,Xir) 表示表示i对象在对象在r维空间的坐
13、标,维空间的坐标,对象对象i与与j在在r维空间的距离为维空间的距离为 :n n n n也就是说,也就是说,S应力是将(应力是将(10.9)式中的)式中的dij和和 用它们的平方代用它们的平方代表后所得到的量度。表后所得到的量度。S应力的值介于应力的值介于0和和1之间。典型的情况之间。典型的情况是:此值小于是:此值小于0.1意味着感知图是意味着感知图是n个对象的一个好的几何表个对象的一个好的几何表示。示。n在非度量在非度量MDS分析过程中,另一个需要解决的问题是感知图分析过程中,另一个需要解决的问题是感知图空间维数空间维数r的确定。我们可以制作应力的确定。我们可以制作应力-r图确定感知图的维数图
14、确定感知图的维数r 。从前述可知,对每一个。从前述可知,对每一个r ,可以找到使应力达到最小的点,可以找到使应力达到最小的点结构。随着结构。随着r的增加,最小应力将在运算误差的范围内逐渐的增加,最小应力将在运算误差的范围内逐渐下下降,且当降,且当r =n-1时达到零。从时达到零。从r 1开始,可将应力开始,可将应力S( r )对)对r作图。这些点随作图。这些点随r的增加而呈下降排列。若找到一个的增加而呈下降排列。若找到一个r ,上,上述述下降趋势到这一点开始接近水平状态,即形成一个下降趋势到这一点开始接近水平状态,即形成一个“肘肘”形形曲曲线,这个线,这个r便是便是“最佳最佳”维数。维数。n非
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用多元统计分析 最新 厦门大学 应用 多元 统计分析 10 多维 标度 PPT 课件
![提示](https://www.deliwenku.com/images/bang_tan.gif)
限制150内