ChatGPT隐藏投资机会探寻
导读
1、近期,ChatGPT横空出世,作为OpenAI出品的大型语言生成模型,它可以理解和生成人类语言,并在信息搜索、非结构数据处理、本文生成等领域具有十分明显的领先地位。在此背景下,ChatGPT概念股风头强盛,受到投资者的重大关注。
2、在ChatGPT概念股之外,还有哪些与ChatGPT概念相关的隐藏投资机会等待投资者挖掘呢?本文将重点聚焦于从技术布局、产品布局与供求关系三个维度上挖掘与ChatGPT概念相关的隐藏股票,力图寻找出除概念股之外的隐藏投资机会。
3、具体来说,我们以ChatGPT概念股作为蓝本,引入供应链数据、产业链数据与专利分类数据,从技术、产品与供求关系三维度寻找与该热点企业最相似的企业名单。在各个维度上,我们均寻找出与ChatGPT概念股票具有较高布局相似的股票列表。最后,我们结合三者数据的特点,合并给出相关隐藏投资机会下的股票列表。
风险提示:模型基于历史数据,在市场环境发生变化时模型存在失效的风险。
1、引言
近期,ChatGPT横空出世,作为OpenAI出品的大型语言生成模型,它可以理解和生成人类语言,并完成多种文本生成任务,例如问答、对话、文本生成、内容摘要等。其原理是基于Transformer编码器来获取文本内部的相互联系。ChatGPT基于其巨大的训练总计算量、优秀的文本生成与识别能力、极低的学习成本和较强的数学处理能力和逻辑能力,在信息搜索、非结构数据处理、本文生成等领域具有十分明显的领先地位。未来,ChatGPT将被应用于如传媒、电商、金融、医疗等更广泛的场景。同时基于其未来更为强大的语言处理能力,ChatGPT的应用延展也会刺激上游算力需求提升。
在此背景下,ChatGPT概念股风头强盛,其相关概念股受到投资者的重大关注。以ChatGPT概念指数(8841669.WI)为例,该指数本月(2023年2月)与本周(2023-02-06至2023-02-10)期间的涨幅分别是26.2%与8.5%,明显优于其他主流宽基指数。
ChatGPT概念股风头正盛,在此之外,还有哪些与ChatGPT概念相关的隐藏投资机会等待投资者挖掘呢?本文将重点聚焦于挖掘与与ChatGPT概念相关的隐藏股票。具体来说,本文将从技术布局、产品布局与供求关系三个维度上出发,力图寻找出除ChatGPT概念股之外的优秀股票。
本文的结构如下:首先,我们将从技术布局、产品布局与供求关系三个维度引入兴证金工团队此前在多篇相关报告中引入的另类数据:秩鼎供应链数据、数库产业链数据与IPC专利分类数据。其次,我们将以ChatGPT概念股作为出发点,多维度地刻画与其相似的股票。最后,我们将复合多类数据挖掘隐藏的投资机会。
2、数据介绍
在本章中,我们首先介绍用于捕捉ChatGPT投资机会所用的数据。具体地,我们从三个维度刻画ChatGPT相关股票:供求关系、产品布局与技术布局。为此,我们引入兴证金工团队在此前多篇相关报告中引入的另类数据:秩鼎供应链数据、数库产业链数据与IPC专利分类数据。
2.1
供应链数据简介
在供应链的供需层面,我们引入秩鼎提供的供应链数据。对于每家上市公司(主体公司),存在为其提供原材料或服务的上游公司(供应商),同时存在购买其产品或服务的下游公司(客户)。如果把每家公司看成一个点,两两公司供应关系看作有向边,将会形成公司之间的供应链网络。秩鼎公司从各类公开披露信息如公司公告(定期报告、临时公告等)、第三方披露信息(审计报告、招中标公告等)获取公司供应链信息,并根据公司的实时股权比例设计股权穿透算法,覆盖历史数据的同时日度更新新增数据。
秩鼎的供应链数据主要分为四个模块:原始披露信息、原始披露交易信息补充及分析、交易关联方股权穿透后实体及其相关信息,以及最后的股权穿透处理信息,其中股权穿透后的信息为核心数据,该部分将非上市子公司的数据映射至上市母公司,极大提高了数据的丰富程度。在实际计算中,我们不仅统计了当年有披露数据的供应商、客户公司,还统计了披露时间在给定日期之前就存在记录的供应商、客户公司。下面我们统计秩鼎供应链数据在A股中的覆盖度。可以看到,每年都会有新的公司对自己的供应链情况进行披露,上市公司对于披露自身供应关系的意愿逐年提高。
2.2
产业链数据简介
在产业链维度,为了定量刻画公司的产品分布以及各个公司在不同产品上的营收,我们引入在《基于产业链的行业重构研究》等深度报告中提及的数库SAM产业链数据库。在产业链数据库中,数库通过对GICS行业分类与公司披露的主营业务收入(半年报与年报)进行标准化与本地化处理,将公司财报上数以万计的产品标准化为近4000个产品节点,并细分为7个不同的层级。除了1级和7级之外,每个产品节点均有其对应的父层级(上一层级)与子层级(下一层级)。下表展示了在数库SAM产业链数据库中,4级产品半导体集成电路(SE002019)及其父层级的名称和定义。在标准化产品分类及层级后,数库根据个股每期报告披露的各产品名称和主营收入,将产品标准化后,计算出个股在每个标准产品上的收入。
以京东方科技集团股份有限公司(000725.SZ)为例,下表中数库对京东方A 2021年报中原始披露的产品进行标准化之后,首先得到数库标准产品分类。其次,将数库中的标准产品对应到与之关联的二级产品分类,计算发现该公司在电子元件、电子设备和仪器以及保健护理机构上均有收入。
2.3
专利数据简介
在专利维度,我们引入在《基于专利分类的科技动量因子研究》、《寻找隐匿的专精特新“小巨人”》等兴证金工深度报告中提及的IPC专利分类数据。根据1971年签订的《国际专利分类斯特拉斯堡协定》,衍生了《国际专利分类表》(IPC分类),这是目前国际通用的专利文献分类和检索工具。国际专利分类系统按照技术主题设立类目,把整个技术领域分为5个不同等级:部、大类、小类、大组、小组,分别对应着8、145、670、3,000+、10,000+个类别。某种程度上IPC分类可以理解为一种全新的行业分类(部分概念释义参见图9)。从数据来源角度讲,一个专利的IPC分类的原始数据是一个JPG格式的文件,从中进行解析即可得到IPC分类相应的数据,具体参见下图。
在本篇报告中,我们将所有上市公司过去5年的有效授权发明专利映射到IPC二级分类(大类,共计145个)。以力合微(688589.SH)为例,我们统计该公司近5年来在二级专利分类上有效授权的发明专利细节,具体展示如下。截至2021年9月30日,力合微近五年主要的有效授权发明专利共有93个,集中在电通信技术(45个,48.39%)与测量;测试(22个,23.66%)上。若放在一级分类上看,其近五年的主要有效授权发明专利集中在电学(61.29%)与物理上(37.63%)。
3、ChatGPT热点公司介绍及其隐藏机会探寻
在本章中,我们重点关注ChatGPT热点企业,并从多维度寻找与ChatGPT热点企业相似的企业,挖掘隐藏的投资机会。具体来说,我们首先确定ChatGPT热点企业名单:以万得ChatGPT概念指数(8841669.WI)成份股作为ChatGPT热点企业列表。进一步,我们从技术、产品与供求关系三维度寻找与该热点企业最相似的企业名单。最后,我们结合三者数据的特点,合并给出相关隐藏投资机会下的股票列表。
3.1
ChatGPT热点公司
万得ChatGPT概念指数(8841669.WI)发布于2023年2月1日,主要涵盖研究或运营AI技术产品在智能应答领域应用的相关公司。该指数目前有28只成份股,具体如下。该指数成份股偏小盘,流通市值均值约为116亿元;具有较高的盈利质量,ROE(TTM,%)均值约为10。
从行业分布上看,ChatGPT热点企业集中于计算机、传媒TMT相关行业,个数占比高达85.7%。
3.2
各维度下ChatGPT热点公司相似股票挖掘
在本节中,我们将分别从技术、产品与供求三维度寻找与该热点企业最相似的企业名单,并最终结合三者数据的特点,合并给出相关隐藏投资机会。
3.2.1
供应链供求关系下的隐藏投资机会
首先是供应链维度。在供应链的供需层面,对于每家上市公司(主体公司),存在为其提供原材料或服务的上游公司(供应商),同时存在购买其产品或服务的下游公司(客户)。我们基于2022年全年的供应链数据,统计与ChatGPT热点企业进行交易的上市公司(包括作为供应商与客户)。具体来说,我们计算2022年全年中以ChatGPT热点企业作为供应商,交易金额占比最高的多个客户,以及以ChatGPT热点企业作为客户,交易金额占比最高的多个供应商。占比越高,说明这些企业在供求关系上与ChatGPT热点企业关联度越高。名单具体如下。
3.2.2
产业链布局相似的股票
其次是产品布局的相似程度,我们参考兴证金工团队在《基于产业链的行业重构研究》报告中的算法,寻找在产业链维度下,与ChatGPT股票上下游关系最紧密的企业。最终,我们得到两个企业间产业链上的关联度。该关联度指标值越大,代表两个公司在产品布局和营收上越相似,产品链所处位置也越趋于一致。最终,我们展示关联度之和最大的前15只股票,作为在产品布局和上下游关联程度上更加趋于一致的隐藏的ChatGPT投资机会。
可以看出,以产业链数据找出的隐藏投资机会在行业分布上也与ChatGPT热点企业极其相似,主要集中于计算机应用软件、通信等行业上。
3.2.3
专利布局相似的股票
最后是专利布局的相似程度,我们参考兴证金工团队在《基于专利分类的科技动量因子研究》、《寻找隐匿的专精特新“小巨人”》等报告中的算法,寻找和ChatGPT专利布局最相似的股票名单。最终,我们得到两个公司间专利分布相似度,该指标本质上代表着两家公司的专利在类别上的相似程度。该专利布局相似指标值越大,代表两个公司在申请的专利类别上布局越相似、创新研发方向也越趋于一致。这种相似性的衡量方式,已经跨域了传统财报以及行业分类所能提供的信息,在一定程度上反映了公司未来的发展战略方向。最终,我们展示关联度之和最大的前15只股票,作为在申请的专利类别上布局相似、创新研发方向趋于一致的隐藏的ChatGPT投资机会。
可以看出,以专利数据找出的隐藏投资机会在行业分布上与ChatGPT热点企业极其相似,主要集中于计算机应用软件、通信等行业上。
3.3
复合维度下ChatGPT热点公司相似股票挖掘
在上述结果的基础上,我们重点参考技术与产品布局的相似维度,相结合寻找与ChatGPT热点公司相似的股票。具体来说,我们首先计算专利和产业链维度下各个股票的相似度排名百分比,并加和得到最终的相似度。我们在此展示排名前20只的股票。可以明显看出,这些股票在行业分布上一样集中于计算机行业,在三级行业分布上集中于行业应用软件、专用计算机设备与咨询实施及其他服务中。
从进一步,我们统计排名前100只股票的行业分布,见下图。这些股票在行业分布上一样集中于计算机行业,在三级行业分布上集中于行业应用软件、咨询实施及其他服务与专用计算机设备中。
4、总结
本文从技术布局、产品布局与供求关系三个维度出发,基于ChatGPT概念股多维度地刻画与其相似的股票。在后续的研究中,我们将继续深耕类似研究,以当下热点企业作为出发点,多维度地寻找未来的隐藏投资机会。
风险提示:模型基于历史数据,在市场环境发生变化时模型存在失效的风险。
注:文中报告节选自兴业证券经济与金融研究院已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。
证券研究报告:《ChatGPT隐藏投资机会探寻》。
对外发布时间:2023年2月12日
报告发布机构:兴业证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)
--------------------------------------
分析师:郑兆磊
SAC执业证书编号:S0190520080006
E-mail: [email protected]
--------------------------------------
更多量化最新资讯和研究成果,欢迎关注我们的微信公众平台(微信号:XYQuantResearch)!
本篇文章来源于微信公众号: XYQuantResearch
本文链接:http://17quant.com/post/ChatGPT%E9%9A%90%E8%97%8F%E6%8A%95%E8%B5%84%E6%9C%BA%E4%BC%9A%E6%8E%A2%E5%AF%BB.html 转载需授权!