美国商务部长指令威胁数据隐私,科学界呼吁抵制反科学统计管理方式
斯科特·阿伦森(Scott Aaronson)的博客[Shtetl - Optimized](https://scottaaronson.blog/)强调,量子计算机不会通过并行尝试所有解决方案来瞬间解决难题。
2026年6月4日,美国商务部长发布指令([DAO 216 - 26](https://www.commerce.gov/opog/disclosure-avoidance-statistical-products)),要求经济分析局(BEA)和美国人口普查局在所有出版物中,只能使用追溯到20世纪70年代初的保密保护技术,无视半个多世纪以来数据主体保护方面的进展。此前,保密技术进步使人口普查局能以更精细细节分享更多数据,而该指令将导致统计数据实用性降低或可获取数据减少,或两者兼而有之。
此指令背后是政治利益,而非科学价值。DAO 216 - 26绕过法律规定的行政程序,兑现传统基金会“2025项目”策划者承诺,反映美国复兴中心(CRA)代表言论和误解。CRA直言使用差分隐私技术无法确定个人公民身份,但《人口普查法》规定对个人特征数据掩码处理是法律要求,且保密对确保人们参与人口普查至关重要。
DAO - 216 - 26禁止使用差分隐私和其他现代技术,将避免数据泄露的技术限制为“粗化”和“抑制”,禁止“噪声注入”。噪声注入技术是为满足精细数据需求而发明,对于地理或行业细节精细的商业和人口数据,粗化和抑制技术会失效。该指令禁止了过去三十年中数十次数据发布依赖的核心数据保密技术,包括自2002年起在季度劳动力指标中使用的输入噪声注入技术、经济分析局原计划使用的相关统计技术、自1990年起用于十年一次人口普查出版物的交换技术,以及差分隐私技术。
示例说明
DAO - 216 - 26与人口普查局提供数据保密和可用性的双重任务相冲突。回顾并扩展内森·戈德施拉格(Nathan Goldschlag)提出的示例,该示例受县商业模式(CBP)数据启发,说明提供有用信息和保护数据保密性之间的矛盾。粗化处理使公布的统计数据变得毫无用处,且无法保证数据的保密性。而噪声注入技术可以对相关方程进行扰动,防止精确重构。
实施障碍
美国商务部声称该指令回归到20世纪70年代过时的“传统统计”技术对数据使用者有益,但从戈德施拉格的示例可知,粗化处理起到的效果恰恰相反。粗化处理会减少对细粒度信息的获取,不使用噪声注入技术,基本计算就能破坏数据的保密性。差分隐私等正式噪声注入方法可防止这种情况发生。
保密对联邦统计至关重要
科学界仍在争论保护受访者数据保密性的最佳技术,但DAO - 216 - 26受政治利益驱动,并非基于科学。发布指令的人拿公众对这一过程的信任冒险,这种做法既不明智又危险。公务员为平衡遵守指令和保护数据保密性的任务,可能会减少数据产出、过度粗化数据或受政治人物压力发布易解密的数据,这将导致受访者拒绝参与调查,对负责提供民主数据的机构是毁灭性打击。
结论
需要对国家的统计机构进行深入投资,确保其有足够人员和支持,使用最佳工具改进方法,而不是让政治人物凌驾于政府统计学家之上。无论科学界对特定隐私增强技术看法如何,都必须抵制这种反科学的联邦统计管理方式。
如何采取行动
- 在专业网络和社区中分享文章。
- 联系国会代表表达担忧,查找代表联系信息并陈述担忧,可选择说明选民类型。
- 志愿参与保护人口普查工作文件和文档的工作,存档相关方法页面和技术文档,可通过互联网档案馆的时光机完成。
约翰·阿博德(John Abowd)、阿洛尼·科恩(Aloni Cohen)、辛西娅·德沃克(Cynthia Dwork)、李在俊(Jae June Lee)、杰什里·萨拉西(Jayshree Sarathy)、亚当·史密斯(Adam Smith)、萨利尔·瓦德汉(Salil Vadhan)联署本文。
对文章的回复
- 道格·S(Doug S.)于2026年7月2日下午5:20评论,怀疑政治人物施压发布易解密数据是真正目的。
- 亚当·特里特(Adam Treat)于2026年7月2日下午5:22总结,政府极右翼成员想用人口普查结果对付非公民,因数据受保护受阻,想通过要求使用劣质算法绕过限制,还打着冠冕堂皇的理由。
- 斯科特(http://www.scottaaronson.com)于2026年7月2日下午5:51表示,理解情况差不多如此,认为情况并非如此的信任度为零。
留下回复说明
可在评论中使用丰富的HTML代码和基本的TeX代码。2024年7月起,《Shtetl - Optimized》评论政策改变,默认评论视为写给斯科特·阿伦森的私人信件,不保证发布和回复,他会挑选有趣或推动话题发展的评论发布并尽力回复。