【一】
美国大选基本尘埃落定,共和党及其候选人唐纳德·川普(Donald Trump)可以说取得了决定性的大胜:不仅拿下了选举人票(目前已明确277票),而且拿下来参众两院,甚至川普本人是20年来首个拿到Popular Vote的共和党候选人:
显然这个差距不能再用“毫厘之差”“计票误差”来解释了,而且这似乎也和大选之前各个媒体所做的民意调查结果颇有出入:民调结果大部分都显示更看好哈里斯(Harris),虽然差异十分细微。
前面我们有讨论过:民调结果不能算板上钉钉,因为民调只能尽可能地提供有关候选人支持率的信息,但不能完全替代选举结果,因为有太多的误差因素:抽样偏差,“害羞选民”,选举人票制度,摇摆州等等。而且,民调结果的差异细微到了在统计误差范围之内,所以也谈不上哈里斯多么领先。
【二】
不过在众多的民调预测中,留园,整体上作为政治方向中性的媒体,其预测算是一股清流:在2020年大选(拜登vs川普)和2024年大选(哈里斯vs川普)中,留园的民调都十分精准地预测对了最终结果(仅考虑美国网友):
2020年,留园网友(美国区)预测拜登胜选。
2024年,留园网友(美国区)以大比例预测川普胜选。
押中一次可以说是偶然,连续押中2次那就要考虑考虑可能有什么原因了。而且,把留园当成一个典型案例分析,有可能反而能以斑窥豹,以小见大,看到一些在所谓的宏观视角下看不到的东西。
【三】
抛砖引玉,留园能做到连续两次精准预测,原因在于:其一,核心是候选人的竞选主张契合选民诉求;其二,在此基础上,留园用户具有真正的选举样本特性。
所谓“候选人的选举主张契合选民诉求”,也就是说,最终胜选的候选人所提出的竞选主张,都契合最大公约数的选民的诉求。
例如,2020年选战,拜登胜川普。此前4年,川普作为政治素人,甫登大位,心情激荡,高举高打,不可避免地说了很多过头话,办了很多过头事,或者虎头蛇尾收场,来回折腾,令选民观感欠佳,而且彼时恰逢covid-19新冠疫情爆发,美国政府初期应对欠妥,也给川普政府减分不少。而拜登充分扬长避短,发挥自己人脉的优势(能拉拢到铁杆共和党切尼一家,可见拜登魅力),以温和、安静的形象示人,在政治主张上坚持中间派的策略,拒绝支持由政府管理全民医疗、免费大学教育或财富税,最大限度地拉拢中间选民,这使得拜登的主张得到了最大限度的广泛回应,成为他胜选的基础。
而2024年选战,民主党和哈里斯把当年拜登获胜的秘诀几乎完全丢弃:放弃了中间路线,过度迎合政治正确、极端左翼和非法移民(起码没有明确保持距离),加之拜登4年的经济表现欠佳,选民不会进行太深入的深入分析和因果推断,只会很直观地认为:非法移民多了,我的收入少了,所以我想换共和党试试。
借用马斯克曾经发过的一张图:“左”不是问题,但“极左”就是问题,因为你会放弃中间选民。
可以这么说,与其说民主党被川普打败,不如说民主党是自己打败了自己。而川普的竞选主张中的两点契合了选民主张,这成为他的选举亮点,也使得选民选择性地“遗忘”了他的不足。第一痛点是经济问题,川普几乎逢会就问:“你们现在比两年前过得更好吗?”这当然能打中选民的痛点,毕竟全球经济下行周期,收入是选民关注的焦点。哪怕是留园,很多支持川普的版友也坦承:并不是喜欢川普,但觉得川普在任的时候经济状况更佳,起码比现在要好。尽管有新冠疫情等外部因素,但拜登政府也难辞其咎吧?
第二痛点是非法移民。这里不说什么大数据,举一个例子就够了:德州的Starr County,这是一个毗邻墨西哥的小county,看地图就知道了,它的位置与其说在美国还不如说在墨西哥。这样的位置,显然当地会对(非法)移民会是相当开放的态度。那么这是民主党的铁票仓吗?——是的,以前都是,起码前132年都是民主党的铁票仓,但今年被共和党翻盘了:
能把132年历史的民主党铁票仓翻盘成红色,除了共和党的努力之外,也能看到,非法移民问题在美国已经恶化到了什么程度、以至于对移民议题十分开放的边境小镇都要倒戈到共和党一边。而民主党显然并没有跟上全国选民的这个诉求,在全国大选中被压制也是迟早的事。
捏住了这两个选民的痛点和诉求,川普基本上立于不败之地了。
接下来,就是留园能精准预测的核心原因:留园用户具有真正的选举样本特性。
【四】
之前讨论过,大部分选前民调的结果都是哈里斯领先或小胜,但是,这样的民调其实带有很大的欺骗性,而留园的样本恰恰在很大程度上规避了这样的偏差;换句话说,留园的用户样本能更好地代表美国的选民,因此也就能更准确地预测选举结果。
1,留园用户的匿名性,可以规避所谓的“害羞选民”的问题。由于众所周知的政治正确等等原因,很多选民并不愿意公开表明自己的政治主张和倾向,在接受调查时往往选择隐瞒自己的真实想法,导致民调结果低估了他们的支持率。相比更加左翼、更喜欢唱政治正确高调的民主党,显然共和党的“害羞选民”会更多。2016年,川普击败民调呼声更高的希拉里,很大程度就是靠了害羞选民的支持。留园的匿名机制,可以真切获知每个投票人的真实观点,很大程度上规避了“害羞选民”这个问题。
2,留园用户分布的随机性,在很大程度上又可以缩小选举人票制度的偏差。选举人票制度虽然名义上是根据人口来定了,但在人口流动频繁、而选举人票额度基本保持不变的情况下,已经和人口比例出现了差异。留园用户假定是统计性地均匀分布在美国各州的话,反而能更好地模拟美国的人口情况和投票倾向。事实也确实如此,71.8%的留园用户选择了川普,而川普也确实最终赢下了popular vote。
3,抽样偏差在普通民调和留园民调都存在。有了前两点的存在,基本保证了留园民调反而能更好地模拟美国大选的实际情况。反过来说,留园民调当然也有抽样偏差,例如留园的男性比例偏高,这就会导致留园民调的结果中,川普和哈里斯的得票差异会大于实际得票差异。这就是所谓的留园的“压倒性选择川普”的主要来由之一,但白璧微瑕,不掩其光,这个差异已经超出了统计误差,所以可以视为最终结果并未受到影响。
【五】
所以,这就是留园民调反而比538网等政治中性网站的民调预测更加精准的原因,因为它更贴合了选民的人性:
候选人的竞选主张契合了选民诉求,这是前提和核心,在此基础上,留园的匿名性、分布的随机性在很大程度上有效规避了“含羞选民”、选举人票制度等干扰因素,反而更好地模拟了实际的选举情况。
当然,以上的分析还基于一个前提:所有谈论到的民调的造假或欺诈都在可忽略的范围内。
《百家论坛》 洪木林 原贴:https://club.6parkbbs.com/other/index.php?app=forum&act=threadview&tid=13592418