回归与模拟
《诺桑觉寺》里面有一段凯瑟琳.莫兰对历史的哂笑:“我总认为,要说历史是枯燥无味的,那就怪了,因为大多数历史是编造出来的”。我对这段话不予置评,但是我想稍加改动:“我总认为,要说我们能构建一个赢多输少的交易策略,那就怪了,因为大多数交易策略是在历史数据的垃圾堆里编造出来的第101个笑话”。
如果让我那历史数据去做回归分析,我会嗤之以鼻,因为我记得金融学中有这么一句俏皮话:“You may regret
your return when you rest on
regression”(你如果相信回归的话,你一定会对你的回报感到后悔,请注意原文押了头韵)。那些利率的历史数据到底是什么啊?是当时人们对未来通货膨胀的预期,而不是实际的通货膨胀数据,我如果对利率做一般的回归有何意义?我完全是搞错了科学与金融学的区别。如果我对某一个金属材料的耐腐蚀性进行测试的话,收集在各种温度和压力条件下的实验数据是有意义的,因为如果我们重复一遍实验的话,这些数字仍然是这样的,实验产生的历史数据将揭示物理世界的规律,而且无论我们揭示与否,那个规律仍然铁定存在。
但是,金融学是有关热带雨林的进化机制,不是铁板一块的物理学。我看不出来,如果我们把利率的历史数据收集了以后对我们预测今后的通货膨胀会有什么借鉴意义,那些国债利率的历史数据体现了当时人们、在当时条件下、根据当时的预算赤字,贸易平衡,就业水平等信息、对当时的未来、做出的主观判断;我看不出仅仅依赖于这样的历史数据会对我们预测今后的通货膨胀情况有什么帮助。
同样的道理,我们看到的股票交易的价格数据凝聚了当时历史条件下,人们的希望和恐惧。我看不出来如果我们把这些主观判断继承下来的话,能够告诉我们有关未来的任何情况。也许有一种情况是例外,《黑天鹅》的作者曾经说过,在市场极度恐慌的时候,人们的行为反而变得容易预测了——仅在此情况下,历史数据有意义,因为人性在巨大恐惧压力下的表现千百年来似乎没有多少进化。
而且另外一个我无法解释的现象是:错误逻辑和垃圾数据总是能够相互强化。300多年前,伯努利首先发现了随机现象中存在统计规律;300多年后的今天,人们喜欢把所有随机事件都当做概率问题。我们的量化策略投资小组很喜欢做这些工作,他们把历史数据当宝贝一样豢养在一个叫“移动硬盘”的抽屉里面,随时戴在身上。他们据此数据而进行的交易,会破坏原有热带雨林的价格信息,使得我们产生一堆垃圾交易数据,而这些交易数据可能反过来又增强了量化投资的热情,因为在一段比较短的时间里面,这些数据可能看起来更像是符合我们对某个概率分布的认识了。
金融学也许更需要模拟(simulation)而不是回归(regression),模拟的工作无非是随机地产生一组数据去验证我们打算投入市场的某个交易策略是否可靠。这虽然也不靠谱,并不保证你的交易策略跑赢大盘或者取得绝对正收益,但是模拟的工作要比回归靠谱得多。我常常举出崂山道士的例子,我感觉他们那种“竹筒摇签”的方法就是在用所谓的“左二右四,上三下五,金木水火”等仪式来模拟一个未来的场景,并赋予其神的力量,劝喻你接受并奉行某个交易策略。你出于宗教信仰而会接受这个签所暗示的行为规范,并相应执行下去,你会坚持一段时间,并相信这是你最好的交易策略,因为这是模拟未来的方法产生的。
泰勒布的新书《反脆弱》提出了“脆弱与反脆弱”的概念,我粗粗读了一遍,感觉这就是有关用自身能力去克服不确定性的问题:作者根据自己的经验,提出了与其担惊受怕,提心吊胆地以为有人会来对自己行凶,不如跟着“胖子托尼”去锻炼身体,把自己炼成300磅的肌肉男,然后目露凶光地走着纽约街头,不仅不担心被人袭击,反而成功地逆转了敌我力量对比。用能力克服不确定性,而不是购买一份商业保险或者安保合同让自己呆在安全的地方,这就是反脆弱。
我感觉模拟是为了检验你的反脆弱性,而回归是为了让脆弱的你找到一个生存空间。从这个角度来看的话,为了符合进化的意义,模拟法比回归法更接近于鼓励大家培养出克服未来不确定性的能力,因而也更接近于金融学的原教旨。模拟法是随机产生N组数据来验证你的交易策略或者风控措施,等于是让你的身体提前暴露在各种风险情况之下进行验证,这就是锻炼肌肉的方法。而回归法则很成问题,尽管这两者使用类似乃至相同的统计方法,回归的本意要帮你从历史中找出一条所谓的大概率事件,就像孙悟空用金箍棒给唐僧画一个圈一样,让你呆在这个所谓安全的区域里面。这样做的主要问题在于,一旦人们相信自己可以用数学方法找到安全区域,就会依赖于数学方法,而放松了锻炼身体,由此就松懈了跟随胖子托尼的健身运动,而实际上,你并不掌握纽约黑帮的运作规律,你自以为用回归法找出了一条所谓的安全回家路线,却可能因为放松了肌肉训练,而落入了一个新来打手的魔爪。