机器学习基础

多标签分类介绍

典型相关分析

#问题由来

典型相关分析,又称之为典型关联分析,英文叫做Canonical Correlation Analysis(CCA)。

假设有两組变量时,一组为p个变量,另一组为q个变量,欲研究这两组变量之间的相关性。

1 若这两组分别只有一个变量时,则其相关称为简单(线性)相关(又称做皮尔森相关,Pearson Correlation)。

2 若其中一组只有一个变量,另一组有很多变量,则此两组的相关称为复相关(multiple Correlation), 可以利用复回归分析来计算这个系数。

3 如果这两组变量都是一个变量以上的,那量测这两组变量间的相关称为典型相关(Canonical Correlation)例如:

  • 教育研究者想了解 3 个学术能力指标与 5 个在校成绩表现之间的相关性。

  • 社会学家想研究2个先前访问而得的个人社会地位指标与后继测量的4个不同社会地位指标之前的关系。

上述这两种情形,研究者所感兴趣的都是两组变数之间的关系。