主身分剖析法步骤,spss主身分剖析效果解读,宅男宅女网赚项目

想象一下,你是一个营养学家试图探索食物的营养身分。那么什么是区分食物的最佳方式?通过维生素含量?卵白水平?或者两者的组合?

想知道这个问题,你需要这个——主身分剖析

主身分剖析法教程
主身分剖析法教程

以下内容译自Algobeans

区分识别一个整体里有什么身分,最直观的就是可视化以及展现集群,例如,在食物中,我们可以识别普遍的种别,如肉类和蔬菜,以及子种别,如蔬菜类型。

主身分剖析法教程

然则若何找出这些身分呢?

主身分剖析界说

主身分剖析(PCA)是在大型数据集中找出少量基础变量(被称为“主成本”)的手艺。主要思想为降维,把多指标转化为几个综合指标。

主身分剖析法教程

主身分可以由一个或多个现有变量示意。

举例来说:

我们可以用单一变量维生素C」来区分食物,由于维生素C只在蔬菜中但不存在于肉类中。 然则用这样的变量,肉类将所有群集在一起(由于所有肉类对维生素C的反映都为0,无法离开)(图一最左所示)

主身分剖析法教程

图一:用变量分类

为了把肉类的子类也示意出来,我们可以用多个变量「维生素C-脂肪」来示意,由于差别的肉类脂肪含量差别,而且蔬菜中不含有脂肪,这样我们就把蔬菜和肉类以及所含有的子类也分别开来了。(图一中心)

若是想要获得更精致的分类,我们可以用「维生素C+纤维-脂肪」这样的变量来把蔬菜的子类更好的睁开。(图一最右)

主身分剖析法教程

以上就是我们用重复的实验和脑子获得主身分,但这用来应付「天朝食物」还远远不够。然则你另有壮大的电脑啊!

ui设计学习需要用到哪些软件,ui零基础入学教程

主身分剖析法教程
主身分剖析法教程

接下来就厉害了,我们可以通过主身分剖析法来剖析一个随机的食物样品

ps:样本来自美国农业部数据,以100g生食物为尺度测试,剖析四个营养变量:维生素C、脂肪、纤维、卵白质。

数据发现,某些营养素的存在似乎相关。脂肪和卵白质似乎在一同增进,而纤维和维生素C一同增进。

主身分剖析法教程
主身分剖析法教程

为了证实我们的假设,我们可以用相关性剖析检查营养变量之间的相关性。正如所料,脂肪和卵白质水平(r = -0.56)之间以及纤维和维生素C水平之间存在大的正相关(r = 0.57)。

在发现了这样的关系之后,我们可以把高度相关的变量看作一个变量,我们就可以把四个维度降维成两个维度来思量。那么对食物集做主身分剖析就可得以下效果:

主身分剖析法教程

数字示意用于组合变量以导出主身分的权重。例如,为了获得特定食物的最高主身分(PC1)值,我们加上它包罗的纤维和维生素C的量,稍微强调纤维,然后从中减去脂肪和它含有的卵白质,与卵白质抵消的水平较大。

我们观察到,主要身分(PC1)总结了我们的目前为止的研究效果 – 它已配对脂肪与卵白质和纤维与维生素C.它还思量到对之间的反向关系。因此,PC1可能用于区分肉类和蔬菜。第二主身分(PC2)是两个不相关的营养变量 – 脂肪和维生素C的组合。它用于进一步区分肉(使用脂肪)和蔬菜(使用维生素C)中的子种别。

用这样两个变量在做食物分组的话,将获得最为详细的分类:

主身分剖析法教程

肉类项目(蓝色)具有低PC1值,因此集中在图的左侧,与蔬菜项目(橙色)相对的一侧。在肉类中,海产品(深蓝色)具有较低的脂肪含量,因此它们具有较低的PC2值,而且位于图的底部。几种具有较低维生素C含量的非叶状素食物(深橙色)也具有较低的PC2值,并出现在底部。

主身分剖析法教程

(在坚持一会 快下课了!)

主身分剖析法教程

主身分剖析似乎很厉害的样子,然则,是个算法就有他的局限性,

PCA就有不少局限:

最大化流传:PCA的主要假设是,显示数据点之间最大差异的维度是最有用的。然则,这可能不是真的。例如,识别手艺堆中数据点的个数。为了盘算数目,沿纵轴将每个数据点离开,然则若是客栈很短,PCA会错误地识别水平轴为义务的有效身分,由于这是具有最大扩展的维度。

注释组件:PCA需要用详细的变量组合来示意组件,然则通常在现实中是很难实现的。

正交变量:PCA的一个主要瑕玷是其天生的主分量必须不在空间中重叠,否则称为正交分量。这意味着组件总是相互以90度定位。为了解决这个问题,我们可以使用一种称为自力分量剖析(ICA)的替换手艺。

本文来源于自互联网,不代表n5网立场,侵删。发布者:虚拟资源中心,转载请注明出处:https://www.n5w.com/45113.html

(0)
打赏 微信扫一扫 微信扫一扫
虚拟资源中心虚拟资源中心网络小白
上一篇 2020年6月20日 23:00
下一篇 2020年6月20日 23:00

相关推荐

联系我们

电话:

在线咨询:点击这里给我发消息

邮件:@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

公众号