【华安金工】因子间相关性与横截面资产回报——“学海拾珠”系列之一百六十一

admin9个月前 (10-14)研报655

报告摘要

►主要观点

本篇是“学海拾珠”系列第一百六十一篇，研究因子间的相关性对因子配置过程中因子筛选的影响，并提出OWL模型提升组合表现。在高维特征中，因子间通常高度相关，但传统模型往往忽略因子相关性从而影响模型的有效性和鲁棒性。本文作者首先提出一个基于LASSO的有序加权LASSO估计器（OWL）在放宽假设的条件下分解因子，在美国市场上进行实证分析，与其他基准方法相比，OWL可以有效识别出因子的显著性，且样本外对冲组合获得最高的夏普比率。

回到国内市场，如何通过科学的方法进行因子筛选始终是一个重要的研究方向，因子间的相关性，尤其是尾部相关性会显著影响组合业绩的稳定性，本文提出的OWL估计法值得借鉴。

·高维环境下因子通常高度相关，但传统方法存在劣势

本文考虑的80个因子中，有 64%的因子间相关系数（绝对值）大于0.5。而文献中流行的LASSO的方法尽管考虑了因子相关性，但是压缩时任意分配或者需要先验知识将导致估计量不稳定。

·OWL估计器具有分组特性和渐近一致性

OWL估计量具有分组特性，将高相关的因子间分配相似的系数；且在放宽假设条件下，OWL估计量是渐近一致估计。在蒙特卡洛模拟中，证实了OWL的理论统计特性，且该估计器的表现优于其他基准方法。

·OWL估计器在实证中获得最优的表现

使用1980-2017年美股数据进行实证分析，发现OWL可以有效识别出市场因子为显著因子，而其他基准方法由于市场因子和其他因子往往高度相关而无法识别。此外，样本外对冲组合可以获得最高的夏普比率，且较小的偏度和峰度，使得收益率分布更接近正态。

·文献来源

核心内容摘选自Chuanping Sun在Social Science Research Network上的文章《Factor Correlation and the Cross Section of Asset Returns: a Correlation-robust Approach》

·风险提示

文献结论基于历史数据与海外文献进行总结；不构成任何投资建议。

引言

有大量文献试图研究和剖析高维公司特征（或与公司特征相关的因子，又称因子动物园）与横截面资产回报之间的关系，例如，参见Cochrane（2011），Harvey et al.（2015），Green et al.（2017），Hou et al.（2020），Feng et al.（2020），Freyberger et al（2020）等。然而，相关文献中关于因子相关性和对横截面资产的影响和意义的讨论还是远远不够的。许多高维的公司特征（或者相关的因子动物园）彼此间是高度相关的，因此忽略因子间相关性会影响标准模型的鲁棒性，从而对这些模型的有效性产生怀疑。例如，本文的实证分析表明由于市场因子和因子动物园中的很多因子高度相关，标准的计量模型，如Fama-Macbeth两步回归和LASSO回归，都无法确定市场因子是驱动横截面资产回报的重要因子。

在本文中，作者进一步开发和利用一个LASSO型估计器，即有序加权LASSO估计器（OWL，Figueiredo和Nowak（2016））以找出影响横截面资产回报的主要因子，重点是分解相关的因子。换句话说，当因子高度相关时，如何稳健地选择重要因子？本文对相关文献的贡献有两个方面。第一，相较于Figueiredo和Nowak（2016），进一步发展了在宽松假设下的OWL估计量的渐近特性，这将适合于经济和金融相关的研究问题，并且证明该估计量在一些温和条件下的一致性。此外，本文作者将OWL收缩法与随机折现因子法（SDF）（Cochrane，2005）相结合来选择因子。在此基础上，本文推导出资产回报的横截面因子选择的分组特性（即，定量地识别横截面资产回报的高相关因子的条件）。蒙特卡洛模型显示与其他机器学习算法（如LASSO，自适应LASSO和Elastic Net）相比，OWL收缩法取得了良好的效果，尤其是在因子高度相关的情况下。

第二个贡献是为横截面资产定价文献中一些令人困惑的问题提供了新的见解。因子间的高度相关性往往会削弱许多因子的统计上的显著性，特别会使市场因子对资产价格的推动作用变得微不足道。避免这一问题的传统方法通常是在模型中排除高相关性的因子。例如，Green et al.（2017）在Fama-MacBeth框架中排除了与Beta相关的因子后才找到了驱动美国股市的横截面收益的因子。但是这个方法需要设定一个阈值来决定哪些因子需要被剔除，而这个阈值的选择往往缺乏严谨的理由。此外，如果两个因子高度相关，要决定舍弃哪个、保留哪个并非易事。相比之下，本文的模型更具有鲁棒性，高相关性的因子获得相似的系数。因此，在使用本文的模型前，避免了任何的因子筛选。此外，本文作者提供大量的证据表明，尽管市场因子由于与其他因子高度相关在标准模型中被认为不显著，但在本文的估计框架中，市场因子仍是驱动横截面资产回报的一个重要因素。这与Harvey和Liu（2021）利用Bootstrap得出的新发现不谋而合。在下文将对此进行详细的讨论。

在实证分析中，本文考虑Green et al.（2017）中记载的100个因子进行因子投资，然后根据Freyberger et al.（2020）的方法，使用各种方法选择的因子稀疏集来形成对冲组合。为此，本文首先通过投资组合排序为每个公司特征构建异象因子（即市场因子以外的因子）。然后，按照Feng et al.（2020）方法形成数千个根据双变量排序的投资组合作为本文的测试资产。值得强调的是，本文使用的是已排序的投资组合（按照公司特征）而非个股作为测试资产。这是因为大部分个股都是小盘股，在总市值中所占的权重很小，而少数的大盘股在总市值中所占的比例很大。因此，如果使用个股作为测试资产，因子选择将会偏向于小市值股票，不是整个市场。相反，使用市值加权的投资组合作为测试资产可以有效地检验因子在总体水平上的效果。

本文的实证结果是对资产定价文献中一些常见观点的补充和挑战。第一，当采用Fama-MacBeth回归时，本文作者发现因子载荷间存在严重的相关性：68%的相关系数的绝对值高于0.5，这使得对使用像Fama-MacBeth回归法和LASSO收缩法等的标准估计方法的有效性产生了怀疑。本文作者发现，Fama-MacBeth法，LASSO和Elastic Net收缩法都未能识别出市场因子是驱动横截面资产回报的重要因素。这是因为市场因子与许多基于公司特征的因子是高度相关的，而这些因子之间的相关性削弱了这些方法推断的有效性。相反，OWL收缩法能够将市场因子确定为横截面资产回报的最重要的驱动因素。这一发现与Harvey和Liu（2021）的实证结果相吻合。

第二，本文作者发现流动性因子、资产增长率相关因子、盈利因子和投资因子是横截面平均回报变化的主要驱动因素。这一发现与Hou et al. （2020，2021）的研究结果相一致。有趣的是，本文作者还发现规模效应在1980-2000年期间消失了，这在现有的文献中已有详细的记载，可参见Amihud（2002）和Asness et al.（2018）。然而，再剔除更多的小盘股（小于NYSE上市股票的40%）后，规模效应变得再次显著，这意味着一些小市值的垃圾股很有可能导致规模效应的消失。一旦垃圾股被剔除，规模效应就会再次出现，这与Asness et al.（2018）的发现（如果控制了你的垃圾股，规模变得很重要）相一致。

第三，本文作者采用与Freyberger et al.（2020）类似的步骤进行样本外检验以找到哪个因子筛选方法最能准确预测横截面的资产回报并使用这些因子构建对冲组合。同时，作者对对冲组合进行了比较，发现OWL选择的因子构建的对冲组合的样本外夏普比率比其他方法高出20%至30%，这表明与其他基准方法相比，OWL收缩法能够在因子相关性普遍存在的情况下挑选出对横截面资产回报最优的因子组合。

最后，值得强调的是，像许多其他的机器学习算法一样，OWL估计量是有偏的。因此，如果不进一步开发一个无偏版本并推导出它的渐近性质，该模型就不适合进行统计检验。在2.4节将详细阐述这一问题。说到这里，作者强调本文的主要目的不是进行统计检验以确定一个简明的资产定价模型——尽管这类研究议题至关重要，但他可以是未来研究的一个主题。不过，本文侧重于高维因子模型中估计的鲁棒性和因子的筛选。然后，作者假设一个稀疏模型，比如五因子模型，并将这种因子选择方法与其他基准进行比较。本文的实证结果与近期文献中的一些实证结果不谋而合，同时也为横截面资产定价面临的一些令人困惑的问题提供了解释。

1.1 相关文献

本文建立在一系列致力于识别横截面资产回报的定价因子的文献基础上，例如，参加Fama和French（1992），Carhart（1997），Hou et al.（2014），Fama和French（2016），Fama和French（2018）等。自Sharpe（1964）和Lintner（1965）提出CAMP以来，经历了半个多世纪的发展，已有数百个异象因子被提出来解释横截面资产回报。然而，Hervey et al.（2015）记录了316个因子，并发现其中大部分因子是数据窥探的结果。Hou et al.（2020）试图复制447个异象因子，发现其中64%至85%的因子无法复制，这取决于显著性水平的选择。Kan和Zhang（1999）表示无用的因子会导致检验结果产生偏差，导致接受因子的阈值低于正常水平。Gospodinov et al.（2014）提出一种模型误设的鲁棒性检验来解决伪因子，使用分步检验法逐一剔除无用的因子。Fama和French（2018）使用夏普比率和应用Barillas和Shanken（2018）的RHS方法来选择因子。Harvey和Liu（2021）提出了一种逐步Bootstrap方法来检验因子，并且发现市场因子是影响横截面收益的最重要因素。

本文还涉及到选择和测试因子方法的研究。Fama和MacBeth（1973）提出两步回归法，通常用于检验具有显著风险溢价的因子。Green et al.（2017）使用Fama-MacBeth回归，在美国股票市场的100个候选因子中找到显著的因子。Lewellen（2015）研究了由Fama-MacBeth回归得出的收益预测的截面性质，并且发现不同股票的预测差异大，对真实回报有很强的预测能力。

本文亦为使用机器学习技术解决金融研究问题的文献快速增长做出了贡献。Tibshirani（1996）提出的LASSO估计起获得了巨大成功，成为当今解决高维数据的新标准。此后，为了实现各种目标，人们对LASSO进行了许多调整和改进。有关LASSO系列的文献发展迅速。Belloni et al.（2014）在拥有大量控制变量的情况下设计出双LASSO选择过程来进行因果推断。Feng et al.（2020）采用双LASSO选择过程来递归地评估（按时间顺序）因子是否对横截面股票收益具有显著的解释性。Yuan和Lin（2006）提出了分组LASSO估计器，它允许使用具有相关性的因子，即可以将相关因子或具有相似特性的因子放组。在估计过程中，如果某组被分组LASSO估计器认为不重要，分组LASSO估计器可以将该组中所有变量一起被压缩。Freyberger et al.（2020）利用自适应分组LASSO法来寻找预测横截面股票收益的因子。Babii et al.（2021）利用稀疏分组LASSO估计器来预测GDP。本文使用方法与分组LASSO收缩法有关，因为这两种估计方法都允许因子相关。然而，这两者关键的区别在于分组LASSO法在使用前需要获得有关因子如何聚类的先验知识。相反，OWL压缩法不需要这些先验知识，并且OWL估计器可以在估计过程中识别高度相关的因子。这种相关因子的识别与无用因子的收缩是同时进行的。Zou和Hastie（2005）提出了Elastic Net估计器，使得相关变量间的因子选择更稳定。Kozak et al.（2020）在贝叶斯框架中使用Elastic Net估计器，并发现稀疏的主成分能很大程度解释横截面的平均回报。Gu et al.（2020）比较了实证资产定价文献中常用的机器学习技术，并且证明了使用随机森林和神经网络可以获得巨大的经济收益。van Binsbergen et al.（2022）表明使用复杂的随机森林算法，机器在预测股票收益上的表现战胜了人工。相反，Cao et al.（2021）认为当公司复杂且拥有无形资产时，人工表现更好，而当信息透明且数量庞大时，机器的表现更好。然而，在预测股票价格时，将两者结合能产生最好的结果。

最后，本文使用的收缩方法直接建立在Figueiredo和Nowak（2016）和Zeng和Figueiredo（2014）的研究基础之上。相较于他们的研究，本文具有两个创新之处。第一，作者在更宽松的假设下进一步发展OWL估计器的统计特性（本文放宽了正态假设，而是对随机变量的分布施加了尾部约束）。第二，本文将OWL收缩法和随机折现因子法（SDF）相结合来寻找驱动横截面资产回报的重要因素。

本文其余部分安排如下：第2节首先介绍寻找驱动横截面资产回报的主要因素的方法，然后介绍OWL收缩法并讨论其统计特性。第3节使用蒙特卡罗模拟实验来评估OWL收缩法在不同设定下的表现，并与在经济与金融研究中高维数据集中通常采用的基准方法进行比较。第4节介绍实证研究结果，并讨论本文对资产定价文献的贡献。第5节给出结论。

方法论

作者采用 Cochrane（2005）的SDF方法来推断驱动横截面资产回报的因子。2.1 节比较了SDF法和 Fama-MacBeth两步回归法，并指出当因子相关时，应采用前者；2.2 节介绍模型，并讨论了在金融应用中的挑战和机遇。2.3节和2.3.2节介绍OWL收缩法，并讨论其统计特性。

2.1风险价格还是风险溢价

设

表示随机折现因子（SDF）

，

其中，

代表零贝塔率，是一个常数，

是因子收益向量。

是未知的SDF系数向量，称为风险价格；其中元素非零说明相应的因子是有价的。本文希望对因子的风险价格进行推断并找到有用的因子（即风险价格不为零的因子）。有效因子会推动SDF的变动，因此包含定价信息：反映了因子在解释横截面平均收益时的边际效用。

另一方面，因子可能是无效的或者冗余的。无效因子是指风险价格为零且与其他有效因子不相关的因子。冗余因子的风险价格也为零，但它们与某些有效因子相关。无效因子和冗余因子之间的区别在选择使用SDF方法还是Fama-MacBeth 两步回归法来寻找主要因子时起着重要作用。

与风险价格密切相关的一个概念是风险溢价。它指的是Fama-MacBeth第二步回归中的斜率系数。Cochrane（2005）的研究表明，风险价格和风险溢价通过因子的协方差矩阵直接相关

其中，

是风险价格向量，

是风险溢价向量。然而，他们本质上是不同的。一个因子的风险溢价推断出投资者需要为承担该因子的风险支付多少费用，而风险价格意味着一个因子对于解释横截面资产平均回报是否有用。当因子不相关时，

是一个对角矩阵。那么，

意味着

，反之亦然。在这种情况下，使用风险溢价来推断横截面资产回报的重要因子的结果与使用风险价格相同。然而，当因子相关时，情况就不是这样了：一个无价格的因子可以通过与一个有效因子相关而获得正向风险溢价。例如，设有两个因子

和

，协方差矩阵为

。

是有价的,

是无价格的，即

，

。可以算出

。因此，本文发现

只需与有效因子

相关，就能获得非零的风险溢价（即

）。如前所述，如果因子不相关，那么使用风险价格（SDF方法）或风险溢价（Fama-MacBeth回归）来选择因子都是可以的。然而，在高维环境下，因子通常是相关的，因此在这种情况下，应该使用风险价格来推断因子。

2.2 模型

设𝑅 是𝑁个测试资产向量的超额收益。定义𝑌=(𝑓′,𝑅′)′，因此

，其中𝑉𝑎𝑟(𝑓)(𝐾×𝐾)和𝑉𝑎𝑟(𝑅)（𝑁×𝑁)分布是因子𝑓和测试资产超额收益𝑅的方差-协方差矩阵。𝐶𝑜𝑣(𝑅, 𝑓)( 𝑁 × 𝐾)是收益和因子的协方差矩阵资产定价等式指出在任何可接受的 SDF，𝐸(𝑅𝑚) = 0。然而，当𝑚未知并通过模型估计时，等式可能不成立。上式中偏离零的部分被视为定价误差，设𝑚(𝑏)代表未知 SDF，它取决于未知的风险价格𝑏。定价误差𝑒(𝑏)可以写成并简化为：

其中，

≔ 𝐸(𝑅)( 𝑁 × 1)是测试资产的预期超额收益向量，𝐶 ≔ 𝐶𝑜𝑣(𝑅, 𝑓)。定价误差的二次型可以定义为 𝑄(𝑏) = 𝑒(𝑏)′𝑊𝑒(𝑏)

其中，𝑊是𝑁 × 𝑁的权重矩阵。然后通过最小化𝑄(𝑏)来估算出𝑏：

推出

对于权重矩阵𝑊，Ludvigson（2013）提供了两种用于模型比较的𝑊选择。第一，

，它将𝑄(𝑏)与众所周知的 Hansen-Jagannathan（HJ）距离联系起来。Ludvigson（2013）指出使用 HJ 距离可以抵消测试资产的变化从而得到稳定的估计值。因此，当测试资产数量较少时，推荐使用 HJ 距离。相反，当测试资产较多时，Ludvigson（2013）提倡选择第二种𝑊：恒等矩阵。使用恒等矩阵不会使权重偏向任何测试资产子集，尤其是当测试资产代表某个特定的经济利益时。本文中，测试资产根据公司特征组成的，因此不希望权重偏向于任何公司特征，所以本文将始终使用恒等矩阵作为权重矩阵。

Cochrane（2011）指出在高维数据中，识别有效因子的传统方法存在不足。另一方面，近期的金融研究已充分证明许多基于公司特征的因子没有被定价。因此，源自机器学习文献的稀疏性假设成为了处理这些问题的有用工具。LASSO 估计器（Tibshirani，1996）是实现稀疏模型的有力工具，在近年相关文献中大受欢迎。然而，众所周知，LASSO 估计器在协变量相关时的表现糟糕。为了在考虑因子相关性的同时规避维度诅咒，本文作者引入了一种新开发的机器学习工具---有序加权 LASSO（OWL）估计器（Figueiredo 和 Nowak，2016），并结合 SDF 框架从（高度相关的）因子动物园中选择因子。

2.3 有序加权LASSO(OWL)估计器

OWL 估计器通过在𝑄(𝑏)中加入惩罚项实现的。

是风险价格绝对值向量，按其大小降序排列。𝜔是一个预先指定的𝐾×1向量，定义为

其中，

和

是两个超参数。本文求解 OWL 估计器使用近似梯度下降算法。OWL 估计量对𝜔的选择很敏感，因此找到合适的

和

至关重要。根据机器学习文献，本文使用 10 折交叉验证法来确定超参数。

下一节，将开始讨论 OWL 估计器的统计特性。

2.3.1 分组特性

接下来，本文将介绍分组属性，它量化了识别因子相关性的条件，这是 OWL 估计器的一个关键属性，在因子相关时可得到稳健估计。

定理 2.1（分组）：设

代表第

的因子。

是因子𝑖和𝑗通过OWL估计的风险价格。

是向量

的标准差，

和

是𝑁个测试资产的均值和标准差。如果

则

。

推论 2.1：

的设定与定理 2.1 相同。如果

则

定理 2.1 有几个含义。第一，当因子高度相关时（即

较小），他们更有可能被组合在一起（即获得相似的系数，

）：两个因子表现出高相关性可能是同一个不可观测的潜在因子同时决定了这些可观测因子的结果。因此在解释资产回报时他们应该具有相似的系数。第二，

对分组属性有直接影响：

越大，越会促进分组。第三，测试资产的平均值（

）和标准差（

）会影响分组属性。当

和小

较小时，因子无法解释测试资产收益在不同时期变化不大的现象。推论 2.1 将 OWL 估计器的分组属性扩展到负相关因子：高度负相关因子的系数大小相似，但符号相反。

值得一提的是，分组特性使 OWL 估计器优于其他相关的机器学习方法，如 LASSO 和 Elastic Net 估计器，这也是本文作者认为在因子高度相关时应采用 OWL 估计器的主要原因。定理 2.1 表明，OWL 估计器允许因子之间存在相关性，并为它们分配相似的系数。另一方面，LASSO 估计器可能会任意将一些高度相关的因子设为零，而将其他因子保留为非零，从而导致不稳定的估计结果。

2.3.2 渐近特性

本节将讨论在 Figueiredo 和 Nowak（2016）提出的放宽假设条件下，OWL 估计器的渐近特性。本文允许𝐾≫𝑁。在一些正则性条件下，作者推导出 OWL 估计器的 Oracle 不等式（误差边界）和收敛速率，从而得出 OWL 一致估计条件。考虑一个线性高维资产定价模型并假设

其中，

是真实风险价格系数，𝜖是按照

缩放的定价误差。因此𝑏̂重写为

的第

的元素。

首先，使用以下符号和假设来推导理论结果。

，其中，

是𝐶的第

列，𝜖与之前定义一致。设

是𝐶的Gram矩阵。对任一标量𝑦∈𝑅，设|𝑦|代表其绝对值。对任一矩阵

，定义

假设 1（随机变量）：

是独立同分布,

。变量

的分布是亚高斯分布，使得

,其中𝑖 = 1, … , 𝑁, 𝑎 > 0,

，其中

不依赖于𝑎,𝑖,𝑗。

假设1概述了随机变量的条件。值得主要的是，与 Figueiredo 和 Nowak （2016）相比，假设 1 更加宽松，但根据 Kock（2016），这些关于随机变量的假设是高维计量经济学文献中的常见假设。

假设 2（稀疏性）：设𝑆是

中非零参数的个数。假设

。

设

，其中

代表集合

的基数。对于

，令

。

假设 3（限制特征值条件，Bickel et al.（2009））：对于所有𝑏，

满足限制特征值条件

假设 2 和假设 3 是推导高维渐近特性的必要条件。假设 2 通常被称为近似稀疏性假设，这是一个相当温和的假设：它只要求𝐾的对数增长率（按比例𝑆缩放）速度慢于的𝑁增长速度。但是，没有假定准确的𝑆。假设 3 的限制特征值条件规避了在高维因子模型下 Gram 矩阵因退化而产生的问题。

定理 2.2（Oracle 不等式）：满足假设 1，2 和 3 下，令

，其中𝜅是大于 0 的常数。设

。当

时，通过选择一个足够大的𝜅依概率 1，

满足

请注意，Oracle 不等式可以进一步发展，分别为预测误差

和估计误差

提供上限。因此，可以进一步利用这些预测误差和估计误差的上界来获得 OWL 估计器的收敛速率。

推论 2.2（OWL 的收敛速率）：

推论 2.2 表明，如果按照定理 2.2 限制𝜆2的速率慢于𝜆2，OWL 估计器的收敛速率与 LASSO 估计器相同。此外，根据假设2，推论2.2也意味着OWL估计器是一致的。

2.4 关于横截面资产回报和因子动物园的讨论

Cochrane（2011）提出”因子动物园“之谜。从那时起，它就引起了广泛关注，并推动了剖析横截面资产回报的”因子动物园“的方法论发展。Greenetal.（2017）采用Fama-MacBeth两步回归法，从”因子动物园“中选取美股回报因子。他们在进行分析之前剔除了一些因子（即beta因子），因为高相关因子会削弱Fama-MacBeth框架推断的鲁棒性。Fama-MacBeth框架的稳健性。然而，筛选出相关因子的处理方法并非易事，需要对流程所使用的标准进行深入的讨论。另一方面，统计和机器学习相关文献揭示快速发展的新技术也可用于剖析因子动物园。Fengetal.（2020）采用了Bellonietal.（2014）设计的双LASSO选择法来递归地测试驱动横截面资产回报的因子。双LASSO选择法的设计初衷是在具有大量控制变量的情况下测试经济学家感兴趣的少数变量。Bellonietal.（2014）的研究表明双LASSO选择法可以克服遗漏变量偏差。尽管如此，就研究问题（即因子动物园和横截面资产回报）而言，本文与Fengetal.（2020）密切相关。但是，研究问题的重点和采用的方法却是截然不同的。首先，本文的重点是相关性的鲁棒选择：如果因子高度相关，OWL收缩法会为因子分配相似的系数，而LASSO收缩法可能会将一些高度相关的因子缩减为零，而将其他因子保留为非零，从而会导致因子高度相关时，因子选择不稳定。其次，Fengetal.（2020）的研究重点是进行统计检验：采用双LASSO选择法来检验特定年份提出的因子的显著性，同时将之前提出的所有因子作为控制变量，根据每年进行递归测试。相反，进行统计检验超出了本文的范围。值得注意的是OWL估计量在小样本下是有偏的。为了对OWL收缩方法进行统计检验，需要开发一个去偏版本的OWL估计器和它的渐近特性，这将会在未来的研究议程中被解决。最后，由于双LASSO选择法只对少数因子进行测试（即不在大量控制变量上进行推断），因此本文需要手工挑选一小部分因子进行检验。相反，OWL收缩法则不受这些限制。

模拟

本节将在不同的蒙特卡洛模拟实验中研究OWL估计器和其它基准的性能。

3.1 模拟设计

在本文实验中，作者考虑𝐾个候选因子，其中2𝐾/3是有用的因子，即𝑏 ≠ 0， 𝐾/3个是无用或多余的因子(𝑏 = 0)。这些有用因子中，设定其中一半（占因子总数的1/3）是相关的，而剩余的一半则是不相关的。这种设定下，本文的模型包含相关因子，不相关因子和无效因子。

𝜌是𝐶(𝑁 × 𝐾)的相关系数矩阵 𝐾 × 𝐾)。设且𝜌被分成三块：

的对角线元素为 1，非对角线元素为；类似地，的非对角线元素分别为。这三块构成了矩阵𝜌的对角线元素，而𝜌的其他部分由零填充。该设置允许在每个子块内因子分别以相关系数相关，但不同子块间的因子互不相关。

首先设置的值，然后随机生成一个𝑁 × 𝐾矩阵𝐶，记为𝑠𝑖𝑚𝐶，它的相关系数矩阵为𝜌。使用表示不相关的有效因子，因此在实验中将设为零，且将设为不同的数值。然后，指定𝑏（风险价格）的值后模拟横截面平均收益率为，其中𝑒为定价误差。使用表示无效因子，因此中𝑏设为零。最后，使用 OWL、LASSO、自适应 LASSO、Elastic Net 和 OLS 估计器，利用模拟数据 𝑠𝑖𝑚𝐶和𝜇𝑅来估计风险价格。最后比较不同方法的估计值。

3.2 模拟结果

本文考虑90个候选因子(𝐾=90)。设定第一组的 30 个因子为有效用因子(𝑏 = 0.1)，因子间相关系数为；第二组 30 个因子为多余因子(𝑏 = 0)，因子间相关系数为；第三组 30 个因子为不相关的有效因子(𝑏 = −0.1,)。为简单起见，本文设置，并从集合{0.3,0.5,0.9}中进行选择。同时，本文还考虑了𝑁（资产数量）对𝐾（因子数量）的影响。为此，从{70,100,1000}中选择𝑁。𝑁 ≫ 𝐾是一种接近近似的设置。另一方面，如果𝑁~𝐾或𝑁 < 𝐾是高维数据集的常见设置。本文进行了500次模拟试验，并使用均方估计误差（MSE）作为比较标准，即对于模型，所有因子的 MSE 被定义为：

其中，𝑟𝑒𝑝代表试验的索引。为了更好地了解候选模型在不同设置下的性能，本文研究每个子块的 MSE。即𝑏𝑘1的 MSE 为：

类似地，可以定义𝑏𝑘2和𝑏𝑘3的 MSE。图表 1 展示了四种候选模型的模拟结果。对于第一和第二组，允许因子间的相关系数𝜌∈ {0.3,0.5,0.9}，而第三组的因子设定为不相关。同时本文还考虑了𝑁值的三种不同设置。𝑁 = 70表示样本数量小于因子个数，这通常类似于高维数据的设置。𝑁 = 100表示样本数量与因子个数大致相等。𝑁 = 1000代表一种理想的环境，即样本数量远大于因子个数，即接近渐近环境。图表 1 的左侧显示了相关的有效因子块的 MSE 值，中间显示了无用因子块的 MSE 值，右侧显示所有因子的 MSE 值。请注意，第三组没有展示，但可以从表格中推断出来。

首先，探究相关有效因子块和所有因子的性能。图表 1 显示，当𝑁 = 70和𝑁 = 100时，发现与其他基准相比，OWL 估计器在子块1 的MSE 最小。此外，作者还发现其他基准，如 LASSO、自适应 LASSO 和 EN，在因子相关性增加时性能会下降，相比之下 OWL 估计器受到的影响较小。所有因子的 MSE 值也表明在𝜌的所有设置下，OWL 估计器的性能优于其他基准的，即 MSE 值最小。

当𝑁 = 1000时，OWL 估计器在所有设定下的 MSE 都接近于零，这证实了推论 2.2 中的理论结果，即 OWL 估计量是一致估计量。尽管其他基准也是一致估计，但作者发现当𝜌 = 0.9，OWL 估计器的 MSE 小于 LASSO 和 EN，这表明当因子高度相关时，OWL 估计器的性能始终优于 LASSO 和 EN。

值得注意的是，与 LASSO 和 EN 估计器相比 OWL 估计器缩小多余因子的效果较差，在𝑁 = 70和𝑁 = 100设置下， MSE 略大于 LASSO 和其他基准估计器都成功地压缩了所有的无用因子。

这些研究结果表明当因子相关时，OWL 估计器是首选的估计器，尤其是在高维环境下。当因子相关性增加时，LASSO 估计器的性能会下降。尽管 Elastic Net 模型确实改善了 LASSO 模型的性能，但其优化效果远远小于 OWL 估计器。

实证分析

在本节中，作者采用 OWL 收缩法从 80 个因子（可能高度相关）中找出有用的因子集。首先介绍数据集，然后详细说明构造异象因子和使用投资组合排序法测试组合的方法，最后将揭示估计结果并讨论其影响。

4.1 数据

本文使用证券价格研究中心（CRSP）和 Compustat 数据库中的美股数据来构建异象因子并测试投资组合。Compustat 数据库中的美股数据来构建异常因子和测试投资组合。数据跨度为 1980 年 01 月到 2017 年 12 月，共计 456 个月，涉及所有纽交所、美国证券交易所和纳斯达克上市的普通股。无风险利率和市场超额收益从 Kenneth French 的在线数据图书馆中下载。所有异象因子都经过标准化处理，与市场因子具有相同的标准差。

4.2 构建因子动物园

本文参考 Green et al.（2017）中描述的 100 个公司特征，同时删除数据缺失率超过 40%的特征。然后，针对剩余的每个特征，每个月使用单变量排序法将股票划分成十等分。剔除总市值小于纽约证券交易所上市股票 20%的小盘股。然后，计算基于特征因子，计算每个公司特征的最高组和最低组之间的收益差。总的来说，本文获得 80 个异象因子，如图表 2 所示。每个特征的详细描述参见 Green et al. （2017）。

接下来，作者通过考察因子间的相关性进行初步分析。图表3（a）显示了以时间序列衡量的因子相关系数矩阵的热图。图中显示，16% 的因子相关系数（绝对值）大于0.5。特别是，贝塔因子与流动性因子、盈利因子、投资因子等高度相关。因此，Green et al.（2017）在采用 Fama-MacBeth 方法来寻找驱动美股横截面收益的显著因子之前，将贝塔因子排除在候选因子清单之外。图表3（b）显示了以因子载荷（即第二阶段 Fama-MacBeth 回归中解释变量的相关系数）衡量的因子相关系数矩阵的热图。与（a）相比，它显示出更高的相关性：64%的相关系数（绝对值）大于 0.5，这意味着如果使用标准的 Fama-MacBeth 回归，则意味着存在严重的多重共线性问题。

对因子相关性的初步研究表明许多因子间高度相关，这表明如果采用传统方法（如 Fama-MacBeth 回归法或 LASSO 回归）来推断有用的因子，将会出现严重的共线性问题。因此，急需一种相关性稳健的估算方法。

4.3 构建测试资产

关于测试资产，文献中对使用个股还是分类投资组合存在争议。文献中对使用个股作为测试资产的主要担忧是会引入变量误差（EIV）。在对估计变量（即因子载荷）进行回归时，预先估计的因子载荷会产生估计误差。Shanken（1992）通过引入“Shanken 修正”项对估计器进行了修改以减少误差。然而，也有人认为 “Shanken 修正”在小样本中的作用微乎其微。另一方面，Fama 和 French （2008）、Hou et al.（2014）、Feng et al.（2020）提倡将分类投资组合作为测试资产。个股通常会伴随噪声和异常值，这是 EIV 的主要来源。分类投资组合是一组具有相似特征股票的加权平均回报，受 EIV 问题的影响较小。

然而，使用个股的最大缺点是数据的缺失存在微型市值的股票。在很长一段时间内，新股上市和股票退市是不可避免的，这通常会导致数据集中数据缺失。数据的不连续会导致收益和因子协方差矩阵的估计不准确，但协方差矩阵是因子推断的基础。相反，分类投资组合是在每个时间点上构建的，同时将具有相似特征的股票分为一组，从而保证投资组合不受数据缺失问题的影响。

小市值股票将会给个股作为测试资产带来另一个主要问题。小盘股在股市上占据大多数，但少数大盘股却在总市值中占据很大份额。如果使用个股来衡量因子的影响，则不可避免地会扭曲对市场的影响：如果用个股来衡量因子的影响，则小盘股将在估计结果中占主导地位，对市值影响更大的大盘股的影响将会被大量的小盘股所抵消。相反，分类投资组合可以通过使用市值加权分类法来规避这一问题。在市值加权分类法中，投资组合收益是通过股票收益的加权平均值来计算的，其中权重反映了股票的市值。

Fama 和 French（1992，2016）使用双变量排序法来构建5 × 5的组合，该投资组合现已成为测试组合的热门选择。但是，Harvey et al.（2015）提示到当测试资产只考虑小部分分类组合时，因子选择会偏向用于分组的特征。Lewellen et al. （2010）认为根据价值和规模分 25 个投资组合是低阈值水平而无法测试因子，建议在测试资产中加入更多的投资组合。根据他们的建议，Feng et al.（2020）基于双变量排序法构建大量的投资组合作为测试资产。具体而言，他们使用市值因子和其他剩余因子构建5 × 5的分类投资组合，并将它们汇集在一起作为测试资产的大集合。本文效仿 Feng et al.（2020）的做法，构建双变量分类投资组合后汇集得到 1972 个测试组合。

4.4 估计结果：哪个因子最重要？

本文使用 2.2 节所述的 SDF 法来预测 OWL 收缩法估算的所有因子的风险价格。在本文的估计中使用𝐶和𝜇𝑅的样本表示。具体来说，。为了获得稳健的估计量，本文讨论以下几种情况：首先，考虑了全样本和子样本估计来检验因子选择的时变性。其次，比较不同投资组合的加权方法（等权加权或市值加权），并研究了它们对估计结果的影响。市值加权中大盘股会具有更大的权重，而等权则以小盘股为主。最后，在构建分类投资组合前使用不同的分位数（分别为 20、30 和 40）来剔除小盘股。百分位数越大，意味着在更多的小市值股票被剔除，导致因子选择更多地受到大盘股的影响。

图表4展示了估计结果。前5列使用全样本进行估计，第6-7列是1980年至2000年的子样本的结果，第8-9列是2001年至2017年子样本的结果。同时考虑了市值加权法（vw）和等权法（ew）。此外，还考虑了剔除小盘股的三种处理方式。图表4列出了每次估计中所选择的异象因子，同时还报告了每个因子在所有估计中被选中的次数。括号中的数字代表因子在单词估计中的重要性（数值越小表示越重要）。

图表3表明在大多数估计中，市值因子（mve）是最重要的因子，但这并不奇怪。市值因子被选择的次数最多，因此市值因子在测试组合中占主导地位。因此，本文将市值因子排除因子显著性排名中，但仍将列入表中以表明 OWL 估计器能够正确识别相关因子。

流动性因子（ill）是对横截面回报最重要的异象因子（Amihud，2002），其显著性在小盘股中尤为明显。流动性因子在20和30水平剔除小盘股后的分类投资组合的重要性高于40水平，这意味着小市值公司面临更严重的流动性约束。美元交易量标准差（std_dolvol）（Chordia et al.，2001）是流动性风险的另一个代表，因此紧随流动性因子之后，成为第二重要因子。同时，OWL 估计器也发现了它与流动性因子的高相关性。流动性作为影响横截面资产回报的风险来源已被大量文献记载，例如Pastor和Stambaugh（2003）以及Acharya和Pedersen（2005）。

资产增长率（agr）紧随流动性和交易量标准差之后，成为第三个常被选中的异象因子。这一发现与Hou et al.（2021）的观点不谋而合。他们提出了一个增强的q5模型，在著名的q4因子模型中加入了资产增长率作为第五个因子（Hou et al.，2014）。其他被多次选中的异象因子包括beta、betasq、现金负债率（cashdebt）和流动比率变化百分比（pchcurrat），它们也与流动性风险相关。除此之外，动量、投资资本回报率（roic）、资产回报率（roaq）和其他盈利相关的因子也被 OWL 估计器选为有效因子，尤其是在第一个子样本。

6和7列是使用1980-2000年子样本进行的估计的结果，8和9列是使用2001-2007年子样本进行的估计的结果。作者发现流动性约束只出现在第二个子样本中，其中流动性相关因子在解释横截面的平均回报方面发挥了重要作用。然而，在第一个子样本中没有显示出流动性相关因子驱动资产价格的有力证据。相反，动量和盈利因子是1980-2000间驱动资产价格的最重要因素，这说明决定横截面回报的因子具有时变性。

有趣的是，在第二个子样本中，剔除 20 百分位数的小市值股票后发现市值因子没有被选为驱动横截面回报的有效因素，这使其成为所有估计中唯一的例外。这一现象在其他文献中也有详细记载，例如Amihud（2002）和Asness et al.（2018）。规模效应在20世纪80年代初被发现后有所减弱。然而，本文的估计结果表明剔除40百分位数的小盘股后，规模效应在这一时期依然明显，这意味着规模效应的消失很可能是由一些小市值垃圾股造成的。在剔除这些垃圾股后，规模效应再次出现，这与Asness et al.（2018）的发现不谋而合：如果控制住垃圾股，市值也很重要。Asness et al.（2018）的研究表明当在回归模型中加入一些控制变量（衡量股票的垃圾程度）时，他们发现即使在20世纪80年代早期，规模效应也是显著的。

4.5 样本外测试

在本节中，作者参考 Freyberger et al.（2020）的方法，根据所选因子在样本外构建对冲组合。这项实验旨在通过评估对冲组合收益比较 OWL 收缩法和其他基准的表现。本文选择的基准方法为 LASSO 收缩法、Elastic Net 模型和 FamaMacBeth（FM）两步回归法。为公平比较，本文考虑仅五因子模型，即每个方法选择最重要的五个因子来构建对冲组合。考虑到因子选择的时序影响，本文同时还考虑 2000 年之前和之后的两个子样本。

值得注意的是，本文将市场因子（mkt）与80个异象因子放在一起作为候选因子清单。虽然有金融理论作为支撑，但是其显著性往往因与其他因子的高度相关性而大打折扣。因此，在使用传统方法时，市场因子经常被认为是不显著的。

图表 5 展示了不同样本下各方法选出的五个最显著的因子。作文发现在不同样本期所选因子之间存在巨大差异，这表明驱动横截面资产回报的主要因子存在时变趋势。此外，小市值股票对因子选择也有很大影响。在包含所有小盘股时，所有方法都时流动性因子、盈利因子、动量因子的相关的因子组合。但是一旦剔除部分小盘股（P20 和 P40），能发现因子选择的一些规律：OWL 表明在第一个子样本中，驱动资产价格的最显著因子是与动量和盈利相关的因子，而流动性因子则相对不重要；但在第二个子样本中，情况正好相反，流动性因子成为驱动资产价格主要因素。另一方面，LASSO 和其他方法并未显示出明显的特征变化规律。

有趣的是，作者发现 OWL 收缩法是唯一个能持续识别出市场因子是驱动横截面资产回报的重要因素的方法，尤其是在分类投资组合前剔除微型市值股票时。这一发现与 Lintner（1965）和 Sharpe（1964）的 CAPM 模型相关的大量文献相一致。相反，其他基准方法，如 LASSO、Elastic Net 和 Fama-MacBeth，即使剔除 40% 的小盘股，都未能将市场因子识别为驱动横截面回报的重要因子。如前所述，这是由于市场因子与其他因子间的高相关性造成的。这一发现重申了在因子高度相关时使用 OWL 收缩法的优点。

接下来，本文要比较各种方法的样本外表现。具体而言，本文采用与 Freyberger et al.（2020）类似的步骤，利用滚动窗口生成因子对冲组合来预测收益。首先，本文选择图表 5 所示的五个最突出的因子，同时考虑不同的数据样本和对小盘股的不同处理方式（即剔除 20%和 40%的小盘股）。然后使用滚动窗口（窗口大小为 120 月）来评估每种方法下因子对冲投资组合的表现。具体来说，在每个估计窗口结束时，将每种测试资产与每种方法所选的因子进行回归，但需要滞后一期。例如，在时刻𝑡，将𝑡−120 −1至 𝑡 期间的测试资产收益率对𝑡−120−2至 𝑡 −1 期间的选定的因子进行回归，并得到 𝛽̂。然后，通过𝛽̂与𝑡时刻的因子相乘预测下一期（即𝑡 + 1 时）测试资产的收益率。根据预测收益率从高到低将股票分成十等份，做多第一组并做空最后一组。在下一期（𝑡 + 1），当收益实现时，计算组合收益利差。随后，将窗口向前滚动一期并重复上述步骤直至期末。最后，计算样本外因子对冲组合对冲组合收益的四个矩和夏普比率。

图表 6 展示了使用 OWL、LASSO、Elastic Net 和 Fama-MacBeth 方法的生成的样本外对冲投资组合的绩效得分，包括夏普比率和四个矩。面板 A 显示OWL估计器在全样本中产生的夏普比率比其他基准高出约 20%。此外，作者还发现 OWL 对冲组合的偏度和峰度远远小于其他基准。Fama-MacBeth 估计表现通常最差。作者认为它受到因子相关性的严重影响，估计结果在第二轮估计中会受到弱因子的侵蚀。作者认为是 Fama-MacBeth 的第二步回归时的估计结果受到弱因子的侵蚀。有关这方面的详细讨论，请参阅 Kleibergen（2009）。

在子样本估计中，作者发现所有方法的因子对冲组合的夏普比率通常远高于全样本估计的夏普比率。此外，作者还发现与全样本估计相比，对冲组合收益的偏度和峰度显著降低，使得样本外收益率分布更接近正态。这说明驱动资产价格的因子具有时变性。作者还发现在所有的样本集中OWL的对冲组合的夏普比率始终高于其他基准的对冲组合。在第一个子样本中，OWL 收缩法选择动量和盈利相关的因子最为主要因子，而其他基准则主要选取了与流动性和贝塔相关的因子。面板B显示，夏普比率比其他基准方法高出20%至 30%。在面板 C 中，对后半期样本的估计也有类似结果：与其他方法相比，OWL 对冲组合的夏普比率最高。

结论

在因子动物园中，由于因子间的相关性，使用传统方法（如Fama-MacBeth回归法和LASSO压缩法）来寻找驱动横截面资产回报的因子面临巨大挑战。作者发现本文考虑的80个异象因子中，有64%的相关系数（绝对值）大于0.5，这对传统方法的有效性提出了质疑。相比之下，OWL收缩法允许因子相关性，并同时实现相关性识别和稀疏性收缩的功能。本文推导出OWL估计器的统计特性，并证明OWL估计量在某些约束下是一致统计量。蒙特卡洛实验证实当因子相关时，OWL估计器的性能优于其他基准估计器。实证分析结果表明，OWL收缩法始终可以识别市场因子是驱动横截面资产回报的重要因子，而其他基准由于市场因子与其他因子的高度相关均未能将市场因子识别为重要因子。此外，样本外测试表明与其他基准相比，OWL收缩法选择的因子能使得对冲组合获得最高的夏普比率。

最后，请注意本文的目的不是寻找一个真正的简约资产定价模型，而是在因子高度相关下能够稳健地识别出驱动横截面资产回报的一组稀疏因子集。考虑到这一点，本文的流程特别适用于因子投资：OWL收缩法可以识别出共同驱动股票回报的相关因子，并可进一步生成有效的投资组合策略，可参阅Asnessetal.（2013）。然而，寻找简约资产定价模型仍是金融研究中的关键问题。能够开发出去偏版本的OWL估计器，该问题就可以被解决。

文献来源：

核心内容摘自 Chuanping Sun 在 Social Science Research Network 上的文章《Factor Correlation and the Cross Section of Asset Returns: a Correlation - robust Approach》

风险提示

文献结论基于历史数据与海外文献进行总结；不构成任何投资建议。

重要声明

本文内容节选自华安证券研究所已发布证券研究报告：《因子间相关性与横截面资产回报——“学海拾珠”系列之一百六十一》（发布时间：20231012），具体分析内容请详见报告。若因对报告的摘编等产生歧义，应以报告发布当日的完整内容为准。分析师：严佳炜 || 执业证书号：S0010520070001,分析师：吴正宇 || 执业证书号：S0010522090001。

往期报告

--基金研究--

33.《买卖之间的心理迷思：处置效应下基金经理的行为模式》

32.《TMT行情降温，权益基金加仓通信、汽车等行业——权益基金2023年二季报解析》

31.《小荷才露尖尖角：黑马基金经理如何挖掘？》

30.《权益仓位再创新高，大幅加仓计算机——权益基金2023年一季报解析》

29.《基民收益启示录：寻找低落差感基金》

28.《寻找基金经理中的“稀缺基因”》

27.《加仓国防军工、交运，投资热点渐趋分散》

26.《FOF弹性与收益增厚：聚焦赛道ETF轮动》

25.《大幅加仓食品饮料，风格向大市值切换——权益基金2022年二季报解析》

24.《市场未出现大规模赎回，电新加仓成首位重仓行业——权益基金2022年一季报解析》

23.《揭秘布局优秀行业主题基金的“必要条件”》

22.《多只重仓股获主动减仓，分散持股趋势延续——权益基金2021年四季报解析》

21.《医药基金深度解析：持仓、业绩、逻辑的演绎与印证》

20.《沪深300 Pro Max——国泰300增强ETF投资价值分析》

19.《持股集中度下降，风格切换正当时——权益基金2021年三季报解析》

18.《基金投资如何选准对标的“锚”：华安分类标签框架介绍》

17.《公募权益基金的舒适管理规模是多少？》

16.《权益基金增配科技，风格向小市值切换》

15.《海纳百川：权益基金经理全景标签池》

14.《百舸争流：公募固收+产品盘点与剖析 |2021固收+产品投资策略展望》

13.《群雄逐鹿，公募基金销售渠道之争》

12.《银行获公募大幅加仓，港股龙头配置趋势不减》

11.《剖玄析微：公募对冲基金2020年报分析》

10.《基金持仓跟踪牢，抱团风向早知道》

9.《狭路相逢勇者胜：精选赛道下的精选基金框架》

8.《分享注册制改革红利，把握网下打新机遇》

7.《权益基金市场扩容万亿，龙头公司持股进一步集中》

6.《公募权益基金智能图鉴》

5.《2020年打新策略对基金的收益增厚有多少？》

4.《公募绝对收益基金持续发力》

3.《透视机构抱团行为，量化视角全面解析》

2.《公募基金产品的绝对收益之路》

1.《基金反编译：绩优指数增强基金的绝技》

--量化研究--

16.《收益和波动共舞：非对称性理论蕴含的alpha》

15.《ChatGPT与研报文本情绪的碰撞》

14.《股价和资金流间的引力和斥力》

13.《可比公司法的量化实践：重塑价值因子》

12.《寻找选股策略与行业轮动策略的“舒适区”》

11.《个股alpha与行业beta的双剑合璧》

10.《震荡行情下，如何挑选估值合理、成长性强的“宝藏股”？》

9.《企业生命周期理论如何运用在选股中？》

8.《如何借鉴赛道型基金持仓？基于业绩归因视角》

7.《当价值遇见成长：均衡估值因子》

6.《成长因子再升级：盈利加速度》

5.《昼夜分离：隔夜跳空与日内反转选股因子》

4.《留存收益、投入资本视角下的估值因子改进》

3.《信息提纯，寻找高质量反转因子》

2.《量价关系的高频乐章》

1.《高频视角下成交额蕴藏的Alpha》

--中观量化--

4.《行业轮动逻辑的标签化应用：重构轮动框架》

3.《企业生命周期理论如何运用在行业轮动中？》

2.《消费升级，需求为王：景气度视角下的消费行业轮动策略》

1.《盈利、估值视角下寻求板块轮动的确定性》

--量化绝对收益之路--

5.《FOF赋能绝对收益：基金组合构建实战（下）》

4.《固收+组合构建白皮书：大时代的小尝试（下）》

3.《固收+组合构建白皮书：大时代的小尝试（中）》

2.《FOF赋能绝对收益：基金组合构建实战（上）》

1.《固收+组合构建白皮书：大时代的小尝试（上）》

--学海拾珠--

160.《交易量对波动率的非对称效应》

159.《基金定期报告中的文本语气能否预测未来业绩？》

158.《因子投资中所蕴含的宏观经济风险》

157.《基于隐含波动率和实际波动率的系统风险指标》

156.《使用机器学习识别基金经理投资能力》

155.《通胀是否会影响会计信息-股票价格间的相关性?》

154.《信息不确定性、投资者情绪与分析师报告》

153.《Alpha与风格因子的综合风险平价策略》

152.《人工智能可以读懂企业高管的想法吗？》

151.《A股的流动性、波动性及其溢出效应》

150.《运用少量ETF可以复制主动基金的业绩吗？》

149.《基于强化学习和障碍函数的自适应风险管理在组合优化中的应用》

148.《投资者情绪能预测规模溢价吗》

147.《基金抛售资产时的选择性偏差》

146.《盈余公告披露的现象、方法和目的》

145.《股票因子个性化：基于股票嵌入的因子优化》

144.《动量、反转和基金经理过度自信》

143.《模糊因子与资产配置》

142.《chatGPT交易策略15个月收益500%+》

141.《前景理论能否解释共同基金的业绩》

140.《是否存在宏观公告溢价现象》

139.《利用深度神经网络改进时间序列动量策略》

138.《基金的协偏度择时能力》

137.《ETF交易与分析师预测》

136.《基于堆叠自编码器和长短期记忆网络的金融时间序列深度学习框架》

135.《基金窗口粉饰行为的新指标》

134.《策略拥挤与流动性冲击》

133.《盈余公告前的已实现测度是否能预测公告后的股票回报？》

132.《共同基金的长周期表现如何？》

131.《股票市场流动性、货币政策与经济周期》

130.《媒体效应如何影响基金投资者和基金经理的决策？》

129.《基于盈利公告发布日期的交易策略》

128.《基金在阶段业绩不佳后会调整激进程度吗？》

127.《20和21世纪风格因子表现的趋势和周期》

126.《基金持仓集中度究竟如何影响基金业绩？》

121.《投资者关注度在市场择时中的作用》

120.《社会责任基金的业绩与持续性》

119.《基于财报文本的竞争关系与股票收益》

118.《基金投资者的真实择时能力如何？》

117.《技术相似性对股票收益的预测能力》

116.《ETF的资金流动是否蕴含独特信息？》

115.《BAB增强版：与包含定价噪音的Beta为敌》

114.《基金经理能选出好的“投机性”股票吗？》

113.《明星分析师能否在糟糕的信息环境中做出更好的覆盖决策？》

112.《股票短线交易与收益异象》

111.《分析师反应不足和动量策略》

110.《共同资金流Beta与因子定价》

109.《被动投资对共同基金管理能力和市场效率的影响》

108.《低频交易的主动基金业绩表现如何？》

107.《不同的回撤指标之间存在差异性吗？》

102.《“聪明钱”、“糊涂钱”与资本市场异象》

101.《无形资产对因子表现的影响》

100.《因子动量与动量因子》

99.《基金评级的变化是否会对股票价格产生系统性影响？》

98.《预期收益、成交量和错误定价之间的关系》

97.《基于回撤控制的最优投资组合策略》

96.《基金抛售对股票价格影响的外溢效应》

95.《已实现半Beta：区分“好的”和“坏的”下行风险》

94.《基金业绩面板回归模型的展望应用》

93.《如何构建更稳健的风险平价投资组合？》

92.《衰退期职业起点与基金业绩影响》

91.《资产配置与因子配置：能否建立统一的框架？》

90.《基金对业务单一公司的偏好》

89.《如何理解因子溢价的周期性？》

88.《货币政策的冲击对基金投资的影响》

87.《度量共同基金经理的绩效表现—基于松弛度经理绩效指数》

86.《基金业绩预测指标的样本外失效之谜》

85.《付出越多，回报越多？—基金公司调研行为与基金绩效的实证研究》

84.《时变的基金业绩基准》

83.《席勒市盈率与宏观经济环境》

82.《基金可持续性评级的公布与资金流量》

81.《关于资产分散化的新思考》

80.《应对通胀时期的最佳策略》

79.《如何基于持仓刻画共同基金的择时能力？》

78.《基金经理可以在股市错误估值时把握住择时机会吗？》

77.《企业盈余管理是否与分析师预测有关？》

76.《主成分分析法下的股票横截面定价因子模型》

75.《盈余公告前后的收益特征是否与投机性股票需求有关？》

74.《债券基金交易风格与市场流动性风险》

73.《高点锚定效应和跨公司收益预测》

72.《贝叶斯动态面板模型下的基金业绩持续性》

71.《企业员工流动对股票收益的影响》

70.《双重调整法下的基金业绩评价》

69.《持仓技术相似性与共同基金业绩》

68.《基金组合如何配置权重：能力平价模型》

67.《财务受限，货币政策冲击和股票横截面收益之间的关系》

66.《基金流动性不足会加剧资产价格的脆弱性吗？》

65.《基于分析师目标价格及相对估值的策略》

64.《基金的“择时”选股能力》

63.《凸显效应对股票收益的影响》

62.《国内基金经理更换对业绩的影响》

61.《流动性不足对股票横截面和时间序列收益的影响》

60.《使用同类基准来评估基金表现有何效果？》

59.《如何用现金流特征定义企业生命周期？》

58.《基金投资者与基金持股的“分割”关系》

57.《高成交量溢价能预测经济基本面信息吗？》

56.《基金经理自购与基金风险》

55.《因子动量与行业动量，孰因孰果？》

54.《基金公司内部的信息传播速度》

53.《共同基金持仓拥挤度对股票收益的影响》

52.《基金的下行风险择时能力》

51.《社交媒体效应、投资者认知和股票横截面收益》

50.《投资者评价基金时会考虑哪些因素？》

49.《公司盈利季节性和股票收益》

48.《信息消化与资产定价》

47.《日历更替：研究盈余公告发布时点影响的新视角》

46.《收益的季节性是由于风险还是错误定价？》

45.《公司复杂性对盈余惯性的影响》

44.《如何衡量基金经理把握股票基本面的能力？》

43.《企业预期管理与股票收益》

42.《基金的资金流压力会对股价造成冲击吗？》

41.《投资者对待公司财报措辞变化的惰性》

40.《处置偏差视角下的基金经理行为差异》

39.《现金流能比利润更好的预测股票收益率吗？》

38.《基金经理个人投入度对业绩的影响》

37.《历史收益的顺序能否预测横截面收益？》

36.《基金买卖决策与其引导的羊群效应》

35.《分析师重新覆盖对市场的影响》

34.《基金规模和管理能力的错配》

33.《股利是否传递了有关未来盈利的信息？》

32.《基金换手提高能否增加收益？》

31.《基本面分析法下识别价值成长溢价的来源》

30.《有多少分析师建议是有价值的？》

29.《不同的经济环境下应如何配置资产》

28.《公募基金投资者是否高估了极端收益的概率》

27.《市场竞争对行业收益的影响》

26.《基金竞争格局对Alpha持续性的影响》

25.《度量beta风险新视角：盈利beta因子》

24.《知情交易的高频指标》

23.《因子择时的前景和挑战》

22.《基金在Alpha和偏度间的权衡》

21.《拥挤交易对板块轮动与因子择时的指示意义》

20.《横截面Alpha分散度与业绩评价》

19.《情绪Beta与股票收益的季节性》

18.《分解公募基金Alpha：选股和配权》

11.《羊群效应行为是否能揭示基金经理能力？》

5.《分析师共同覆盖视角下的动量溢出效应》

--打新跟踪--

145.《新股破发再现，9月打新收益回落至本年平均水平》

144.《近期新股涨幅进一步回落》

143.《新股涨幅有所“降温”，北证网上打新参与户数攀升》

142.《多只新股上市首日涨幅超100%，情绪维持”高温“》

141.《IPO“低速”运行，破发率处于历史低位》

140.《IPO节奏将阶段性收紧》

139.《打新赚钱效应持续，次新反复活跃》

138.《新股市场受资金追捧，打新收益陡升》

137.《破发改善，打新情绪指数持积极态度》

136.《创业板新股涨幅，参与账户数双升》

135.《科创板年内最大IPO华虹公司完成询价》

134.《创业板新股密集上市，月度打新收益率创新高》

133.《创业板新股收益回暖，情绪指数持积极态度》

132.《新股首日涨幅回暖，A类参与户数回升》

131.《农科巨头先正达成功过会，拟募资650亿元》

130.《本周新股涨幅环比下行，发行规模有所上升》

129.《5月双创破发率30%，主板打新收益回落》

128.《近期新股上市节奏维稳》

127.《新股首日涨幅分化，打新情绪底部回暖》

126.《主板注册制运行满月，打新收益较为稳健》

125.《4月创业板新股情绪回落，破发比例达62.5%》

124.《双创又见破发，打新收益环比下行》

123.《首批注册制主板新股上市首日表现亮眼双创》

122.《科创板新股首日涨幅回暖，首批注册制主板新股迎来上市》

121.《首批注册制主板新股中签结果公布》

120.《注册制首批主板新股询价状况如何？》

119.《注册制下首批主板企业过会》

118.《北交所迎本年首只网下询价新股》

117.《二月上市节奏回温，打新收益环比上涨》

116.《打新参与账户略有回升，核准制“扫尾”发行提速》

115.《全面注册制正式文件落地》

114.《打新收益显著上行，情绪指数维持积极态度》

113.《情绪冷暖指数建议近期打新持积极态度》

112.《1月发行节奏缓慢，打新收益环比下行》

1 11.《北交所做市业务持续推进》

1 10.《百花齐放不复在，潜心耕耘结硕果——2023年网下打新展望》

1 09.《北证破发率居高，多家待上市企业下调发行底价》

1 08.《2022年A类2亿资金打新收益率约3.47%》

1 07.《新股收益与参与账户数环比维持稳定》

1 06.《新股收益环比小幅下行，本周维持零破发》

1 05.《双创打新收益稳步增长，北证迎来发行高峰》

1 04.《11月打新收益环比上行》

1 03.《北证50指数产品发行在即，推进北交所高质量扩容》

1 02.《打新收益企稳，参与账户数缓慢回升》

101 .《北交所推出融资融券制度》

100.《北交所下半年发行提速，北证50成分股公布》

99.《麒麟信安上市表现亮眼，10月打新收益回温》

98.《破发率降低，打新收益自底部回暖》

97.《科创板股票做市交易业务准备就绪》

96.《科创板破发幅度较大，参与账户数显著下降》

95.《新股破发率企高，上市涨幅较低》

94.《北交所开启网下询价，发行制度实践更加完善》

93.《破发有所改善，但上市涨幅仍维持低迷》

92.《破发再现，打新收益率显著降低》

91.《八月上市规模环比上升，打新收益创年内新高》

90.《新股上市涨幅维稳，本周维持零破发》

89.《打新收益持续回温，海光信息贡献突出》

88.《打新收益回暖，机构参与积极》

87.《7月新股破发率提升，打新收益环比下降》

86.《近期新股定价PE上移，破发比例或再度上升》

85.《新股涨幅下降，单周打新贡献为负》

84.《新股破发再现，仍需警惕定价较高风险》

83.《新股首发PE中枢回落，定价趋于理性》

82.《六月新股打新收益创今年新高》

81.《科创板打新参与账户数量回升》

80.《新股上市涨幅大幅回暖，账户数量趋稳》

79.《五月上市规模较小，但网下询价新股均未破发》

78.《询价新规常态化运作，打新收益测算调整》

77.《打新收益回暖，本周新股申购密集》

76.《询价节奏缓慢，本月尚未有注册制新股上市》

75.《新股破发率较高，近期询价节奏缓慢》

74.《4月科创板打新呈负收益，主板中国海油收益较高》

73.《新股破发加剧，部分固收+产品率先退出打新》

72.《近期新股上市首日涨幅维持低迷》

71.《机构打新参与度持续走低》

70.《机构精选个股参与打新，定价能力日益突出》

69.《新股再现密集破发，单周打新负贡献》

68.《打新市场回温，3月上旬打新收益已超2月》

67.《大族数控成节后首只破发新股，2月打新收益较低》

66.《本周询价新股密集，预计总募资过百亿》

65.《创业板已成为打新收益主要来源》

64.《节后上市节奏缓慢，本周暂无询价新股》

63.《2022年1月A类2亿资金打新收益率0.36%》

62.《新股表现大幅回暖，单周打新贡献突出》

61.《上周市场情绪不佳，新股现密集破发》

60.《北证网上申购热情高涨，本周科创板打新负收益》

59.《发行节奏稳中有进，打新制度红利尚存——网下打新2021回顾与2022展望》

58.《2021全年新股发行规模超5000亿》

57.《2021至今A类2亿资金打新收益率12%》

56.《北交所网下投资者管理特别条款正式发布》

55.《新规后新股上市日内价格怎么走？》

54.《新股上市表现回暖，参与账户数趋稳》

53.《科创板年内最大新股百济神州询价待上市》

52.《从收益角度调整打新能力评价指标》

51.《北交所首批IPO新股采用直接定价发行》

50.《打新账户数量降低，机构参与热情下降》

49.《多只新股破发，打新收益曲线调整》

48.《新股发行价显著上行，中自科技上市首日破发》

47.《部分新股定价突破“四值”孰低》

46.《网下询价分散度提升，有效报价区间拓宽》

45.《本周注册制新股询价新规正式落实》

44.《如何估测未来网下打新收益率？》

43.《打新账户数量企稳，预计全年2亿A类收益率11.86%》

42.《新股上市涨幅回落，下调打新收益预期》

41.《2021至今A类2亿资金打新收益率9.8%》

40.《注册制发行制度优化、促进定价博弈平衡》

39.《从交易情绪中预测次新股走势》

38.《各类“固收+”打新基金推荐》

37.《新股上市后价格一般怎么走？（下）》

36.《新股上市后价格一般怎么走？（中）》

35.《新股上市后价格一般怎么走》

34.《新股上市首日流动性分析》

33.《2021上半年打新回顾：常态发行，稳中有进》

28.《单周上市规模200亿，和辉光电涨幅不及预期》

27.《优质新股集中上市，单周打新收益突出》

26.《新股上市首日最佳卖出时点有所后移》

25.《新股发行稳中有升，IPO排队现象缓和》

24.《2021新股上市规模破千亿》

23.《新股上市节奏趋于平稳，上市表现有所回暖》

22.《2021打新收益的规模稀释效应更加显著》

21.《科创板C类打新账户数量渐超A类》

20.《单周新股上市规模超百亿，3月规模环比上升》

19.《注册制上市涨幅维持150%，主板略微回落》

18.《A类账户数量企稳，2021打新收益可期》

17.《极米科技上市涨幅超300%，打新贡献显著》

16.《IPO发行常态化，2021新股规模可期》

15.《2021至今A类2亿资金打新收益率1.3%》

14.《1月新股上市规模同比下降》

13.《滚动跟踪预测2021打新收益率》

12.《基金打新时的资金使用效率有多少？》

11.《A股IPO发行定价历程回望》

10.《注册制助推IPO提速，2021新股储备较为充足》

9.《如何筛选打新基金？》

8.《如何测算2021年网下打新收益率？》

3.《从参与率和入围率两个角度筛选打新基金》

2.《网下打新报价入围率整体略有下滑》

1.《新股上市降速，蚂蚁暂缓发行》

--其他研究--

--指数研究--

6.《编制规则修改，沪深300指数或迎新成员——2021年12月主要指数样本股调整预测》

5.《2021年6月主要指数样本股调整预测》

4.《美国ETF监管新规导读》

3.《沪深300杠杆反向基金在港交所上市》

2.《半透明主动ETF：海外资管新风口》

1.《亚洲首支权益主动型ETF在香港上市》

--事件点评--

5.《全面注册制改革启动，打新收益或重获关注》

4.《震荡环境下的A股市场展望》

3.《侧袋机制在公募产品中的应用展望》

2.《上证综指编制规则优化简评》

1.《T+0交易制度的境外发展与境内探索》

--数据智库--

7.《2021Q2基金重仓股与重仓债券数据库》

6.《2021Q1基金重仓股与重仓债券数据库》

5.《打新策略定期跟踪数据库》

4.《权益基金定期跟踪指标库》

3.《2020Q3基金重仓股与重仓债券数据库》

2.《ETF跟踪模板发布》

1.《指数增强基金跟踪模板发布》

--产品分析--

12.《华商基金孙志远：稳守反击型FOF名将》

11.《华商基金张晓：俯筛赛道，仰寻个股》

10.《以静制动，顺势而为：景顺长城中证红利低波动100ETF投资价值分析》

9.《华商基金余懿：注重平衡，兼顾逆向和景气》

8.《华商基金彭欣杨：自上而下与自下而上相结合》

7.《华商基金厉骞：擅长进攻的”固收+“名将》

6.《华富基金尹培俊：擅长资产配置的绩优“固收+”舵手》

5.《华富成长趋势投资价值分析报告》

4.《创业板中报业绩亮眼，创业板指配置正当时》

3.《宽基中的宽基：国泰上证综指ETF投资价值分析》

2.《聚焦行业龙头，布局电子赛道》

1.《应对不确定性，黄金配置正当时》

关于本公众号

“金工严选”公众号记录华安证券研究所金融工程团队的研究成果，欢迎关注

重要声明

适当性说明

《证券期货投资者适当性管理办法》于2017年7月1日起正式实施，通过本微信订阅号/本账号发布的观点和信息仅供华安证券的专业投资者参考，完整的投资观点应以华安证券研究所发布的完整报告为准。若您并非华安证券客户中的专业投资者，为控制投资风险，请取消订阅、接收或使用本订阅号/本账号中的任何信息。本订阅号/本账号难以设置访问权限，若给您造成不便，敬请谅解。我司不会因为关注、收到或阅读本订阅号/本账号推送内容而视相关人员为客户。市场有风险，投资需谨慎。

投资评级说明

以本报告发布之日起12个月内，证券（或行业指数）相对于沪深300指数的涨跌幅为标准，定义如下：

行业及公司评级体系

买入—未来6-12个月的投资收益率领先市场基准指数15%以上；增持—未来6-12个月的投资收益率领先市场基准指数5%至15%；中性—未来6-12个月的投资收益率与市场基准指数的变动幅度相差-5%至5%；减持—未来6-12个月的投资收益率落后市场基准指数5%至15%；卖出—未来6-12个月的投资收益率落后市场基准指数15%以上；无评级—因无法获取必要的资料，或者公司面临无法预见结果的重大不确定性事件，或者其他原因，致使无法给出明确的投资评级。市场基准指数为沪深300指数。

分析师承诺

本人具有中国证券业协会授予的证券投资咨询执业资格，以勤勉的职业态度、专业审慎的研究方法，使用合法合规的信息，独立、客观地出具本报告，本报告所采用的数据和信息均来自市场公开信息，本人对这些信息的准确性或完整性不做任何保证，也不保证所包含的信息和建议不会发生任何变更。报告中的信息和意见仅供参考。本人过去不曾与、现在不与、未来也将不会因本报告中的具体推荐意见或观点而直接或间接收任何形式的补偿，分析结论不受任何第三方的授意或影响，特此证明。

免责声明

华安证券股份有限公司经中国证券监督管理委员会批准，已具备证券投资咨询业务资格。本报告中的信息均来源于合规渠道，华安证券研究所力求准确、可靠，但对这些信息的准确性及完整性均不做任何保证，据此投资，责任自负。本报告不构成个人投资建议，也没有考虑到个别客户特殊的投资目标、财务状况或需要。客户应考虑本报告中的任何意见或建议是否符合其特定状况。华安证券及其所属关联机构可能会持有报告中提到的公司所发行的证券并进行交易，还可能为这些公司提供投资银行服务或其他服务。

本报告仅向特定客户传送，未经华安证券研究所书面授权，本研究报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品，或再次分发给任何其他人，或以任何侵犯本公司版权的其他方式使用。如欲引用或转载本文内容，务必联络华安证券研究所并获得许可，并需注明出处为华安证券研究所，且不得对本文进行有悖原意的引用和删改。如未经本公司授权，私自转载或者转发本报告，所引起的一切后果及法律责任由私自转载或转发者承担。本公司并保留追究其法律责任的权利。