中国电商网 -专业的电子商务平台
收藏本站

885001,这个神秘代码可以靠量化来解码了

2022-05-17 10:38来源:中国电商网  

投资难,选基地难。仅仅跑赢主动型基金的平均水平就更难了。

我能看见它,但是我不能触摸它。只想一键解码885001,简单投资。

这段时间,相信很多基民都在煎熬。现在通过量化的方法,你或许可以在一定程度上解决这个痛点。

曲靖,复旦大学数学学士,美国卡内基梅隆大学硕士,15年证券从业经验,6年公募基金管理经验,擅长基本面与量化相结合的系统投资。历任美国千禧基金、中信证券投资岗。现任中欧基金量化投资总监,中欧数据挖掘混合A(001990)、中欧量化驱动(001980)基金经理。

85001是什么?

北落师门:

朋友们好,我是你们老朋友在北洛的师傅。今天,我很高兴邀请中欧基金的基金经理与我们进行交流。曲从业15年,其中管理基金6年多,一直专注量化投资。

经常说基金赚钱,基民不赚钱。我们通常以偏股混合型基金指数885001为基准,给你做一个数据演示。有人说我就是要这个指数的收益率,也就是平均水平。它不太高。能做到吗?

先来问一下迷宫的一般科普。885001是一个什么样的指数?

弯曲路径:

作为发展中国家的股市,中国最大的特点就是主动管理的基金经理有更多的阿尔法机会。

85001可能在一定程度上描述了中国主动管理型股票基金经理的终极水平特征。是万得编制的偏股混合型基金指数。包括样本中所有成立三个月以上的中国市场偏股混合型基金,每天按照净值取一个平均值。表现出来的业绩相当于偏股混合型基金经理的平均投资水平。

北落师门:

从历史上看,这个平均水平在a股市场有超额收益。与沪深300、中证500等指数相比,表现出哪些特点?这些基金经理在最终的平均成绩中表现如何?

弯曲路径:

2015年以后,基金行业有了很大的发展。到现在七年,偏股混合型基金指数有五年跑赢沪深300,六年跑赢中证500。所以相对于宽基指数,其常年胜率相对较高。

再看更长的时间,如果从2004年开始看,中证500涨了468.67%,沪深300涨了235.65%。从2004年到今年5月5日,偏股混合型基金指数涨幅为889.05%,平均年化收益率为13.73%。

所以从历史数据来看,偏股混合型基金指数一定程度上反映了大家所说的基金赚钱的情况。更有意思的是,历次市场大跌后的偏股混合型基金指数呢?

量化解码885001

北落师门:

我们不否认基金赚钱。现在的问题是,为什么基民不赚钱,甚至基民想要一个平均水平都很难?

当你选择一只基金的时候,很可能是它的最高时刻。当时刚刚度过了最甜蜜的表演期,开始声名鹊起,然后开始规模扩张。这个时候,再想赚到平均水平已经很难了。另外,这是一个不可复制的指数,包含2000多只基金。所以大家都想要平均水平,每年都能达到这个就很满足了。从投资的角度怎么解决?你能提供这样的目标和工具吗?

弯曲路径:

这就是我们开始研究这件事的目的。85001好像每天都能看到,感觉到,但是投资收益好像没有。

另一方面,我们做量化,擅长数据计算。通过连续五年做移动窗口,我们计算出有多少基金可以连续五年跑赢885001。如果有很多基金经理能达到这个水平,就买他的基金吧。我们发现能连续五年运行在85001上方的基金经理不多,五年一轮。为什么是五年?因为5年是一个价值增长的窗口期。看一两年可能不太准确,但五年至少有两轮不同风格的切换。所以很难得到一个打败885001的。

而且,我们擅长定量建模。我们想通过数学手段建立一个模型,以手头可用的工具为出发点,看看能不能把85001拆了,把它的成份股和行业配置描述清楚。如果我们能清楚地描述这一点,我们将获得一个可投资的基金。

股票型基金一年所有仓位有两个答案,一个是半年报,一个是年报。此外,还有四个模糊答案,分别是每个季度报告后15个交易日公布的前十名。以前有一种简单粗暴的方式可以买到前十名。后来拿历史上15年的数据来来回回,你会发现你总是在追高,跟不上收益节奏。后来我们用了一些数学方法来解读这件事。除了刚才的两个正确答案和四个模糊答案,还有一个工具,就是每日的净值增减。净值的增减其实是受他所配置的主要行业影响的。比如今天的药暴涨,其配置的药高,自然弹性就会高一些。这个很直观。知道了它近期的连续净值,就可以回归到行业的涨跌,估计它大概率配置在哪些行业,你就有了一个估计。这个估计是用前面的两个正确答案和四个模糊答案校准的。一年有六个校准点,然后实时利用净值回归的结果,就可以估算出基金在哪个方向加仓,哪个方向减仓。

然而,这给单个基金会带来了问题。找明星基金经理。按照这个方法,他的仓位变化肯定是不允许的,因为个股和行业之间是有阿尔法的。但是考虑到一两千的资金,可以在一定程度上减少刚才估算的误差,所以最后我们利用每日净值涨跌和行业涨跌的关系,以及他一年标定的前十的两个满仓的正确答案和四个模糊答案,估算出885001个满仓的持股行业配置。

北落师门:

有两个小问题。第一种是用净值校准。会不会有些行业关联度高?你怎么能猜到人们应该得到什么?第二是特别多的行业。做回归分析的时候,大概会看几个行业指数?

弯曲路径:

你提到的问题是为什么有人用我们刚才口述的方法去做,发现返回的猜测是错的。因为写模型是关于框架的,所有的效果都在细节里。对于同涨同跌的问题,数学上有一个词叫共线性。比如最典型的就是医药和白酒,可能经常是同涨同跌。我们需要加入一些强假设,先去除自变量的共线性,让你的系数更稳定,估计更正确。

第二个问题,比如现在申万一级有30多个行业。仅仅用最近15天的净值是无法估算出30个行业的。数学上还有一个名字,叫自由度。自由度太多,要用量化的方法压缩自由度。

雷达投资决策更加理性。

北落师门:

你量化投资的方法和策略和其他基金公司有什么区别?有的人做基本面量化,有的人做多因子,有的人可能用其他技术,比如私募。我不知道你属于什么风格,但是你能告诉我们一些关于它的事情吗?

弯曲路径:

在我加入中欧基金之前的十年,主要做多因子。多因素是如何产生的?在美国特别有意思,比如PB-ROE双因子。90年代的美国,一些聪明人把优秀的老基金经理的想法大大抽象出来,用一些抽象的算法表达出来,发现了一个很好的PB-ROE公司。当时表达的时候其实有美国经济环境和科技环境的背景,因为90年代结构化数据第一次应用到这个投资上。比如以前富达的基金经理把美国证券交易委员会的报表打印出来,然后分析里面的结构,让他的研究员帮他计算公司的ROE和ROIC的各种情况,然后决定公司要不要投资。

1995年,美国芯片价格大幅降低,电脑被广泛用于投资。最后,我们发现可以使用一些方法来清理会计报表中的科目,并将其放入结构化的数据库中。上市公司公布会计报表的时候,可以和老基金经理同时知道这个数字,但是计算比别人快,当天就可以做出决定。公司买它是因为它又便宜又好。从1995年到2009年,很多因素在美国蓬勃发展,拥有获取和处理信息的能力非常重要。

现在如果我去中欧基金找一个汽车研究员,让他推一只PB-ROE的股票,他肯定会笑话我。你看什么基本面?我们要做的是把口腔行业选股的核心逻辑写成一个模型,模仿美国当年的多元因素,用科技手段把这些数据处理好,发出信号,让我们在时间轴和逻辑上不落后于主动管理的基金。这样才能拥有信息获取和处理的优势。

最后一个例子,我们如何量化基本面?比如汽车行业真正看基本面的人,一定要看销量数据,看社会库存,看客运联合会和中汽协的停车场库存,还要看购置税减免等政策。我们必须成为虚拟变量,并将它们放入模型中。最终,它将成为人们像真正的基本面投资者一样看待的东西,但好处是,该模型将每天像雷达一样扫描,自动捕捉数据,处理信号,并形成投资决策。这样才能形成真正的基本面和量化相结合的投资方法。

基本面本质上是多因素的高级版本。如果你从三维的角度俯视所有量化整个平面的不同策略,你会发现multifactor是第一代使用基本面逻辑的量化,但它在横截面上更加抽象和水平,所有行业都使用一个模型来做。但我们希望比它更具体,更深入地挖掘基本面真正关心的是什么,并把它写成模型。

现在我们的基本面研究,找方法,建模型,基本上都有相应的节奏。某行业研究模型1.0版本成立,2.0版本更新,3.0版本上线。覆盖这么多行业并没有你想象的那么复杂,因为一旦我们写好了模型,它会自动帮我抓数据,跟踪,处理问题。

北落师门:

历史上,特别是在熊市中,偏混合基金指数的表现如何?

弯曲路径:

刚才说到偏股混合型基金指数的年收益率,从2004年到现在是13.7%。为什么是这个水平?总的来说,买股票是公司的投资回报,是ROE的水平。平均而言,主动管理型基金经理购买相对较好的公司,最终长期ROE在10到15之间。最终会获得13.7%左右的回报,这是一个正常股权投资的回报。

说到熊市,因为08年我在纽约,经历了美国的金融危机,所以对这个事件印象深刻。

北落师门:

今天也借此机会给大家做个心理按摩,就是经历了这么多熊市。你现在的感受是什么?和2008年美国的心情相比,是一种什么样的状态?

弯曲路径:

美国2008年的金融危机基本上是从2007年下半年到2008年9月开始的。作为一名工作第一年的研究员,我认为这是开始我一生工作的大好时机。因为那次事件之后,我很少感到害怕。

我当时做的主要是欧洲大陆跨国跨境交易的数量模型。那时候我会在纽约每天晚上三点自然醒来。凌晨三点,正好是欧洲开盘时间,然后打开我的彭博和远程机看看情况。事实上,投资生涯可能不长的投资经理和研究人员,现在都感到深深的焦虑。我也是从那个时候过来的,但是后来我发现了艾刚的老司机是怎么做到的。

2008年9月15日我印象特别深刻。9月14日,美联储召开会议,决定不拯救雷曼。然后我做了一些事情。我走出家门,在雷曼兄弟大楼前拍了张照片。当时上面的霓虹灯招牌是雷曼兄弟。当我第二天早上经过那栋大楼时,它已经变成了巴克莱资本。因为雷曼倒闭了,曼哈顿的每个人都非常害怕。前所未有的金融危机肯定会带来另一场大的连锁反应。后来,不出所料,美林和美国银行合并了,大家都认为高盛可能是下一个。当市场恐慌到这种程度时,巴菲特买入了高盛优先股。

直到现在,市场波动的时候,我都会回想起那个时候。如果20多岁市场跌到这种情况,你还敢买美股吗?如果你当时买了标准普尔500,接下来就是2008年到2019年的十年牛市。

现在每一次优秀的公司被估值到很便宜的水平,我都会问自己,如果我站在那里,还敢买吗?因此,一代又一代人都是在金融危机中成长起来的。我能感觉到,越是有经验的基金经理,遇到危机越是兴奋。因为市场越来越接近有更多筹码可供选择的机会。之前看芒格的采访,有个人曾经问他“你觉得生活在这里能达到现在的成就吗?你觉得你性格中最重要的一点是什么,只能说一个字?”然后查理·芒格说:“理性。”

量化追求,预测,你的预测。

北落师门:

这种量化的方法,和各种武术流派一样,都有自己的适应环境,擅长的东西没有区别。那么这个教派,在什么样的市场环境下通常会更有优势,让大家的投资体验会更好呢?

弯曲路径:

第一,量化是一种非极端的、分散的状态。所以量化在“十九年计划”行情中肯定不突出。比如,市场上只有10%的股票在上涨,90%的股票在下跌。

第二,看几个时间点的特征。2019年2、3月是大家最后一次有从市值变成市场增长的印象;去年2、3月,基于消费长期贴现的投资框架转向科技增长;今年一季度主要是风险偏好快速下降,从高估值转向防御。在这个转变的四分之一里,基本面量化不会特别突出。

因为我们做基本面量化,希望赚上市公司,比如一个季度到一年之间,净利润好转后,股价上涨我们就拿钱。不像中高频的统计套利技术指标,我们希望赚中期的钱。所以在这个过程中,难免会遇到风格转变的压力。虽然股价最终会回归正轨,但会产生一个季度的波动,因为我们的目标投资周期是一个季度到一年的框架。

在上述两种情况下,量化有可能回滚。

北落师门:

一个行业会掌握哪些基本面数据?你的模型里没有动量因子吗?你能举些例子吗?

弯曲路径:

实际上,我们主要是预测上市公司在这个周期中一个季度到一年的净利润变化,这是我们基本面量化胜率最高的区间。因为从一个季度到一年,数据和逻辑驱动最容易判断上市公司净利润的变化。时间长了,可能有管理、赛道等原因。判断公司在这个框架下的盈利能力,要深入到每一个行业,看行业的业务特点。

比如这两年大家都很关注养猪。我们写模型的目的体现在模型中:我们尽力预测你的价格预测。猪价最终肯定会反映到上市公司的收入中,跟踪高频猪价会反映到上市公司的下一份报告中。但是这个东西太短了,它只是一个同步指示器。如果我想预测猪价,我得看供需的情况。基本面支撑是一头母猪怀孕4个月,仔猪育肥4-6个月,所以看看现在的猪价,再往后推9个月。如果9个月前没有足够的母猪配种,9个月后猪价就会上涨,这是市场上预测猪价的一般方式。但更重要的是,你要预测人们对猪价的预测,你要预测能繁母猪的情况,所以能繁母猪的情况会映射到整个行业的供需对比上。对猪的需求是中国人吃猪肉,基本稳定。与钢铁不同,钢铁的需求是下游的房地产,一直在波动。所以要拉出供给的成本曲线来看成本。那些养殖量最高的人什么时候会转离养殖?等他们觉得养猪亏了,又会退出。然后会繁殖的母猪就少了,9个月后猪价就上去了。所以最后写出来的模型一定是预测这些人什么时候退出产能,然后我们把基本面模型放进去预测。

北落师门:

像这个养猪行业的数据,其实你只要找到别人不知道的信息就可以赚钱。这个模型是如何处理的?过程是怎样的?

弯曲路径:

首先,我们不仅用比别人知道的更快的数据赚钱,也用更理性的模型赚钱。模式最大的优点就是不贪不惧。但是作为一个人,可能当时还是很兴奋的,因为猪价在最高点,股价还在继续上涨。我可能做不到低配,但是模型会提示我们低配,相信他的理性。

其次,与传统的多因素相对应,量化必须具有信息获取和处理的优势。弄得好,处理得好,就能有先发优势。在建立模型时会用到大量的数据拆解成本,比如购买仔猪的价格,这是散养农户养猪的成本。一只猪吃多少豆粕,多少玉米,多少维生素,或者人工成本是多少,这些数据都可以用高频数据代替。我们现在可以获得购买的小猪的每日数据。豆粕可以做豆粕期货,玉米可以做玉米期货,维生素价格也有高频数据。基本都能把模型映射到日常阶段。就好比多因子可以自动清算当年的会计报表,以此来参考老基金经理看会计报表的步骤,手动计算判断。我们更像是自动处理数据,而不是在excel里填写数据去找拐点。

北落师门:

有没有什么行业是这样做不到的?要么难度极大,要么行不通。

弯曲路径:

我们举两个例子,比如a股计算机行业的金融科技、乘用车自动驾驶、建材,都是订单驱动、项目驱动。当他要确认一年有多少收入时,是基于他自己的会计判断。项目进度达到60%,收入的60%确认到会计报表中。很难量化他今年打算确认多少收入。即使能在各个网站查到他的合同总额,也很难预测他的净利润。这类行业还包括苹果的产业链,优秀的分析师可以通过前瞻判断明年是多一个摄像头还是多个屏下指纹。但是等我们拿到它的产量、销量、订单的时候,股价可能已经有所反映了。

量化的数据验证逻辑

北落师门:

在选择产品,尤其是量化产品的时候,这种基本面量化产品适合什么样的投资者?

弯曲路径:

我经常告诉我们的客户,基本面量化不能给专注带来灵活性。你可以买一个行业的ETF,那灵活性肯定是最大的。我们更有可能在更广的维度上从每个行业中挑选我们认为比较好的公司,同时在行业轨道上稍微匹配今年到明年最好的行业。通过这种方法,可以在股权投资中争取更好的行业和股票的回报。就像885001,2004年到现在年化收益13.7%,但是你想让他像2020年一样每年赚50多点。我觉得很难提供这种基本面量化的分散投资方式。

北落师门:

最后想和曲老师谈谈如何走上量化投资的道路,如何看待量化投资和主动投资的关系?

弯曲路径:

我觉得验证的过程就是量化,只是每个人给他起的名字不一样。我喜欢用历史数据来验证我的各种逻辑,所以最终选择量化肯定是必然的方式。后来发现很多系统投资也是这种方式。比如美国的Daglio,就是非常典型的系统性投资。大家都看过他讲的原理。他用历史上反复出现过的逻辑来证明他对一个行业,一个国家,以及我们现在的历史周期的看法。他最近的一本书用中国在过去1500年中的变化展示了中美之间的关系。

所以我喜欢用数据来验证一些我认为的东西,最后发现对投资也很有好处。因为市场的无效率主要来源于交易者情绪的波动,就像查理·芒格说的,成功最大的优势是理性。现在a股也好,美股也好,都能产生这么大的波动,提供各种交易机会。说到底,Alpha其实是由于市场的非理性,数量优势是理性。

北落师门:

给朋友推荐一本关于量化投资的书?

弯曲路径:

我觉得你可以读一读《征服市场的人:西蒙斯传》,然后达格利奥的三本书其实很值得一读,因为他是一个系统思考市场的人。他从中观、微观、宏观三个层面系统思考市场形势,历史悠久。

责任编辑:沐瑶

最新阅读

推荐阅读