利用文本挖掘从财报电话会议记录中提取见解

随着投资阿尔法指数变得越来越难以捕获,主动投资经理正在寻求另类数据集和机器学习、自然语言处理等更复杂的技术,以发现投资机会。财报电话会议记录为这些愿景提供了一个很好的测试平台,因为这些记录记录了公司管理层和投资界之间的交流,并且可以利用文本挖掘技术来总结和提取见解。


我们利用自然语言处理技术从财报电话会议记录中提取出对捕捉管理层和投资界信号有意义的特征。利用2010年至2021年全球企业的财报电话会议记录作为语料库,我们根据记录不同部分创建了文档属性、可读性和情感等基于基本面的特征。我们测试了这些特征在预测企业未来股票收益方面的有效性,并发现投资者有机会在选股时使用这些信号。具体而言,我们发现可读性和基于方法的情感可以提高投资者区分优质股和劣质股的能力。虽然这些结果在美国小盘股研究样本中最为强劲,但我们的发现在不同的市值和地区范围内结果具有一致性。


我们也介绍了一些方法来为主动投资者和量化投资者创建更具鲁棒性的情感特征。通过分析各种电话会议参与者的表现模式,我们发现有证据表明,分析师提问部分可能比高管发言部分包含更多的信息。具体而言,公司高管可能正在调整他们的语义用法,以适应整个行业中越来越多文本挖掘技术的使用。最后,我们对基于BERT的模型进行了微调,以预测财报电话会议记录的情感,并发现通过上下文驱动的深度学习语言模型提取的情感特征很有应用前景,可能比词袋法更有效。

返回列表 Previous:对于因子投资者而言,1/N策略有多低效? Next:暂无内容