“防御性”是个需要显著性检验的论断

对“防御性”资产做点估计排名，并不能证明存在防御性优势。在相信它之前，先给均值附上 n、t、p——这里均值最高的那个并不显著，而真正可靠的对冲反而均值更小。

诱人的排名

按标普 500 下跌月份中的平均收益给资产排序，黄金高居榜首：在 106 个下跌月份里平均 +0.9%。这很容易让人把黄金封为下跌月份里最好的对冲。均值是真实的，但优势并未被确立：检验统计量为 t = 1.71、p = 0.09——在 5% 水平上并不显著。这个排名是一个假设，而非一个发现。

按均值排序会悄悄奖励高波动资产：少数几个大涨的月份就能把平均值拉高，哪怕这资产下跌的次数几乎和上涨一样多。黄金在下跌月份的胜率是 53%——只比抛硬币好一点点。高均值配上接近 50% 的胜率，恰恰是噪声的特征，而非可靠的防御性。

债券（美国国债 IEF）在同样的下跌月份里平均只有更小的 +0.5%，但胜率为 56%、t = 2.10、p = 0.04——显著。现金则几乎在每一个下跌月份都微正。真正可靠的对冲，其头部均值反而更小；按均值排名会把你指向错误的资产。

对任何条件性的“防御性”论断——下跌月份中、危机中、某个体制中的表现——都要在均值旁边报告 n、t、p，并明确标出 5% 这道门槛。点估计排名只告诉你该往哪里看；唯有统计推断才能告诉你那里到底有没有东西。