LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）-web3资讯-ODAILY

书接上回，关于《用多因子模型构建强大的加密资产投资组合》系列文章中，我们已经发布了四篇：《理论基础篇》、《数据预处理篇》、《因子有效性检验篇》、《大类因子分析：因子合成篇》。

在上一篇中，我们具体解释了因子共线性（因子之间相关性较高）的问题，在进行大类因子合成前，需要进行因子正交化来消除共线性。

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）

一、因子正交化的数学推导

从多因子截面回归角度，建立因子正交化体系。

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）

所以，

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）

二、三种正交方法的具体实现

1.施密特正交

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）

施密特正交是一种顺序正交方法，因此需要确定因子正交的顺序，常见的正交顺序有固定顺序（不同截面上取同样的正交次序），以及动态顺序（在每个截面上根据一定规则确定其正交次序）。施密特正交法的优点是按同样顺序正交的因子有显式的对应关系，但是正交顺序没有统一的选择标准，正交后的表现可能受到正交顺序标准和窗口期参数的影响。

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）

2.规范正交

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇） # 规范正交 def Canonical(self):
overlapping_matrix = (time_tag_data.shape[ 1 ] - 1) * np.cov(time_tag_data.astype(float))
# 获取特征值和特征向量
eigenvalue, eigenvector = np.linalg.eig(overlapping_matrix)
# 转换为 np 中的矩阵
eigenvector = np.mat(eigenvector)
transition_matrix = np.dot(eigenvector, np.mat(np.diag(eigenvalue ** (-0.5))))
orthogonalization = np.dot(time_tag_data.T.values, transition_matrix)
orthogonalization_df = pd.DataFrame(orthogonalization.T, index = pd.MultiIndex.from_product([time_tag_data.index, [time_tag]]), columns=time_tag_data.columns)
self.factor_orthogonalization_data = self.factor_orthogonalization_data.append(orthogonalization_df)

3.对称正交

施密特正交由于在过去若干个截面上都取同样的因子正交顺序，因此正交后的因子和原始因子有显式的对应关系，而规范正交在每个截面上选取的主成分方向可能不一致，导致正交前后的因子没有稳定的对应关系。由此可见，正交后组合的效果，很大一部分取决于正交前后因子是否有稳定的对应关系。

对称正交尽可能的减少对原始因子矩阵的修改而得到一组正交基。这样能够最大程度地保持正交后因子和原因子的相似性。并且避免像施密特正交法中偏向正交顺序中靠前的因子。

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）

对称正交的性质：

与施密特正交相比，对称正交不需要提供正交次序，对每个因子是平等看待的
在所有正交过渡矩阵中，对称正交后的矩阵和原始矩阵的相似性最大，即正交前后矩阵的距离最小。

LUCIDA：如何利用多因子策略构建强大的加密资产投资组合（因子正交化篇）