1.4 量化、AI并不是一切

随着围棋比赛中阿尔法狗完胜人类,近几年人工智能(大数据)将占领华尔街的新闻也是铺天盖地、甚嚣尘上。其实笔者并不相信目前纯粹的人工智能在投资上能够超过最好的基金经理。为什么这么说呢?因为围棋与投资有着本质的区别。

棋类游戏,很早的时候人类就已经被计算机打败了(如国际象棋)。不过围棋的难点在于,可能的状态数太多,无法穷举,但这些难点终究只是一个数量上的问题,所以围棋算法的核心要点在于,在有限算力的情况下,通过优化算法,放弃部分搜索空间,同时保证寻找到的是较优的解。在计算机领域,这其实就是个“优化”问题。

但是投资完全不一样,投资不是“优化”问题,投资是“预测”问题,是要预测市场的下一步应该怎么走。“预测”问题可以说极其困难。Facebook人工智能掌门杨立昆(Yann LeCun)演讲时曾提到过这个问题,人工智能最缺乏的是“常识”,这一缺陷导致了人工智能作出预测极为困难。杨立昆列举的例子是视频,比如某个视频的上半段是乔丹运球冲向篮筐,那么下半段会是什么样子呢?这个问题对人类来说很容易,大概率就是投篮或者扣篮。因为我们的常识已经熟知了篮球的套路。但这个问题对于人工智能来说,却是极为困难的。实际上,很多大公司都曾在预测问题上遭遇尴尬。很早的时候,Google就尝试使用大数据来预测流感,最后证明预测效果并不好。国内也有一些互联网大公司(如百度和腾讯)使用大数据发布了相应的指数基金,业绩相当一般。据笔者所知,Facebook目前甚至没有人去做股票的投资研究,他们肯定深知其中的困难—如果人工智能在投资上能有那么厉害,那么他们早就借此发家致富了。

至于国内很多所谓的人工智能,低级一点的,将神经网络套用在行情数据上,试图拟合出一个表现不错的策略,在实盘中往往会遭受事实无情的打击。高级一点的,扒取网上相关的舆情数据,先进行自然语言分析再根据信息做出决策。这些与我们“想象中”的人工智能其实都相差很远,也不太见得会有什么上佳表现。即使有表现较好的策略,其本质与用简单的回归模型做出的策略并无太大区别。实际上,国内很多做P2P风险分析的,用的都是Logistic回归,易懂又好用。

由于媒体的吹捧,大家对AI在金融投资领域的应用普遍存在着过高的期待,甚至有人危言耸听地号称将来AI会替代投资经理的职务。其实这都是不现实的,在一些简单的数据处理问题上,AI确实有替代人工的趋势,比如人脸识别。但对于金融投资这一复杂的领域,AI的应用进展其实是非常有限的。很多号称AI的投资基金其实是换汤不换药,本质上还是已经成熟了几十年的量化模型。

AI在金融投资领域最大的问题是,可用的样本数据极其有限,也无法大量生成。股市有多少历史数据,就有多少样本数据,但也只有这么多。极其有限的样本数据,加上极其庞大的特征维度,是AI在金融预测建模上举步维艰的根本原因。众所周知的是,训练数据是AI的基本养料,数据有限,就会导致模型很难得到大幅度的提升。就那么多有效的因子,大家反复挖掘,失效的速度也越来越快。

虽然笔者是量化投资和金融AI从业人员,但对量化投资或者AI并不存在过高的追捧和期待,我们还是要脚踏实地去解决一些与我们更密切相关的问题。