“防御性”是个需要显著性检验的论断
对“防御性”资产做点估计排名,并不能证明存在防御性优势。在相信它之前,先给均值附上 n、t、p——这里均值最高的那个并不显著,而真正可靠的对冲反而均值更小。
诱人的排名
按标普 500 下跌月份中的平均收益给资产排序,黄金高居榜首:在 106 个下跌月份里平均 +0.9%。这很容易让人把黄金封为下跌月份里最好的对冲。均值是真实的,但优势并未被确立:检验统计量为 t = 1.71、p = 0.09——在 5% 水平上并不显著。这个排名是一个假设,而非一个发现。
按均值排名奖励了什么
按均值排序会悄悄奖励高波动资产:少数几个大涨的月份就能把平均值拉高,哪怕这资产下跌的次数几乎和上涨一样多。黄金在下跌月份的胜率是 53%——只比抛硬币好一点点。高均值配上接近 50% 的胜率,恰恰是噪声的特征,而非可靠的防御性。
真正扛住的那个资产
债券(美国国债 IEF)在同样的下跌月份里平均只有更小的 +0.5%,但胜率为 56%、t = 2.10、p = 0.04——显著。现金则几乎在每一个下跌月份都微正。真正可靠的对冲,其头部均值反而更小;按均值排名会把你指向错误的资产。
应有的纪律
对任何条件性的“防御性”论断——下跌月份中、危机中、某个体制中的表现——都要在均值旁边报告 n、t、p,并明确标出 5% 这道门槛。点估计排名只告诉你该往哪里看;唯有统计推断才能告诉你那里到底有没有东西。