你有没有遇到过这样的场景:
你用 AI 助手查一份工作的薪资建议,输入了完全相同的职位和城市,只改动了一个细节——性别从“男”改成“女”。结果,AI 建议的薪资整整少了 12 万美元(约合人民币 87 万元)。
你没做错任何事。AI 也没有“针对”你。但它确实给出了不公平的建议。
问题出在哪?AI 从人类的数据里学会了偏见,然后戴着这顶“隐形有色眼镜”看待世界。
一、偏见从哪来?——AI 是人类的“偏见镜子”
很多人以为 AI 是客观的,因为它基于数学和代码。但事实是:AI 不是创造知识,而是模仿知识。它学什么,取决于我们喂给它什么。
AI 的偏见主要来自三个渠道:
📊 统计性偏见:数据里本来就“缺人”
如果训练数据里 90% 的工程师是男性,AI 就会“认为”工程师天然应该是男性。当它遇到一份女性工程师的简历时,可能会给出更低的匹配分数。
医疗领域同样如此。一个主要用于检测皮肤癌的 AI 模型,如果训练数据以浅肤色人群为主,那么它对深肤色患者的诊断准确率就会显著下降。而深肤色人群的黑色素瘤死亡率本来就比浅肤色人群高出3.75 倍——AI 的偏见,可能让这个差距更大。
🏛️ 社会性偏见:数据里写着“刻板印象”
AI 从互联网海量文本中学习,而互联网文本充满了人类的刻板印象。
一项覆盖 300 多条全球刻板印象的研究发现,AI 模型不仅会复刻“金发女郎不聪明”“工程师是男性”等常见偏见,在阿拉伯语、西班牙语、印地语等环境中,还会表现出“女性更喜爱粉色”“南亚人保守”“拉美人狡猾”等地域偏见。
更讽刺的是,当研究者输入“非洲村庄”时,一些图像生成模型频繁输出“茅草屋”“赤脚孩童”等刻板画面;输入“欧洲科学家”时,则是清一色的白人男性、穿白大褂、身处实验室。
⏳ 历史性偏见:数据里记录着“过去的错误”
信贷数据里,低收入群体过去违约率更高。但这可能是因为历史上的贷款歧视,而非这些人的真实信用水平。AI 学了这些数据,就会继续给特定邮编区的用户打上“高风险”标签——这就是所谓的“红线歧视”。
AI 不是发明了偏见,它只是忠实地继承了人类历史上的偏见,然后用“算法”的名义让这些偏见看起来更“权威”。
二、偏见去哪儿了?——五个真实世界的“翻车”现场
💰 场景一:招聘与薪资——性别不同,薪资差 358 万
康奈尔大学的一项研究测试了 5 款主流 AI 模型,让它们针对相同职位给出薪资谈判建议。
结果令人震惊:一个男性求职者应聘丹佛的资深医疗职位,ChatGPT 建议起薪40 万美元。而条件完全相同的女性申请者,被建议只要求28 万美元——整整少了 12 万美元。
不只是性别,种族同样影响 AI 的建议:白人通常获得最高建议薪资,非白人群体的建议薪资普遍偏低。
换句话说:AI 正在建议女性和少数族裔“低估自己”。
这已经不仅仅是“不公平”的问题了。如果企业采纳了这样的 AI 建议,可能面临法律风险。事实上,美国已有联邦法院受理了针对 AI 招聘工具年龄歧视的集体诉讼——原告指控某 HR 软件公司的算法“系统性地将年长求职者排除在考虑范围之外”。
🏥 场景二:医疗诊断——深肤色患者,AI 更容易看错
2025 年的一项研究评估了 4 款主流 AI 图像生成模型,让它们生成 20 种常见皮肤病的图片。
结果:生成的 4000 张图片中,89.8% 是浅肤色,只有 10.2% 是深肤色。其中 ChatGPT-4o 生成的深肤色图片仅占6.0%,Midjourney 只有3.9%。
更严重的问题是准确性:所有平台的图片中,只有 15% 被皮肤科住院医师评定为诊断准确。Adobe Firefly 的准确率甚至低至0.94%。
研究者警告:“如果不迅速采取行动确保数据集的包容性和准确性,这些技术将辜负它们本应服务的社区。”
⚖️ 场景三:司法审判——同样的案情,不同的“判决”
如果 AI 被用来辅助司法判决,它会公平吗?
一项 2025 年发表于《Nature》子刊的研究,让 GPT-4 和 GPT-4o 针对同一个虚拟刑事案件预测定罪概率,操控了被告的种族和性别变量。
结果发现:被告的种族和性别确实会系统性地影响 AI 的定罪预测。虽然影响幅度不大,但系统性偏差的存在本身就值得警惕——如果这种偏差被放大到成千上万个案件中,后果不堪设想。
哈佛法学院的研究者也在追问:AI 生成的判决,与人类法官的判决有多大差距?
🏦 场景四:金融贷款——算法“红线”重现
2025 年 7 月,美国马萨诸塞州总检察长宣布,学生贷款公司 Earnest Operations 以250 万美元达成和解。指控是什么?该公司使用 AI 承保模型进行贷款决策,未能减轻对黑人、西班牙裔和非公民申请人的差异化伤害。
这是美国首批针对算法歧视的州级执法行动之一。加州、俄勒冈、新泽西等州的检察长都已发布关于 AI 相关偏见和歧视的指导意见。
算法偏见正在从“学术问题”变成“法庭问题”。
🎯 场景五:广告推送——精准投放背后的“精准歧视”
Meta 的 AI 广告系统被指控** disproportionately(不成比例地)向黑人用户推送营利性大学的广告。这意味着:同样在刷社交媒体,不同种族的人看到的教育机会广告可能完全不同——AI 在替广告商“筛选”受众,也在替机会“筛选”人群**。
美国司法部也曾就“广告算法歧视”案与某大型科技公司达成和解——该公司被指控基于用户的种族、肤色、宗教、性别等信息推送房地产广告。
三、为什么 AI 的偏见比人类的偏见更危险?
1️⃣ 它看起来“客观”
人类表达偏见时,我们能看到表情、听出语气。但 AI 的偏见藏在代码和数学公式背后,披着“数据驱动”“科学决策”的外衣。受害者甚至不知道该向谁申诉。
2️⃣ 它规模巨大
一个人类 HR 一天看 50 份简历。一个 AI 招聘系统一天能筛5 万份。偏见一旦嵌入算法,就会被指数级放大。
3️⃣ 它自我强化
如果一个 AI 招聘系统倾向于不推荐女性工程师,那么被录用的人中男性就会更多。这些新的录用数据又被用来训练下一代 AI——偏见就这样被一代代“合法化”并放大。
4️⃣ 它“跨文化漂移”
AI 不仅复制偏见,还会把一种文化中的偏见“翻译”成另一种文化中的“事实”。Hugging Face 的首席伦理科学家玛格丽特·米切尔指出:AI“将特定社会背景下的偏见当作普遍规则输出”。
四、我们能做什么?
✅ 对个人:保持批判性思维
不要盲目相信 AI 的输出,尤其是涉及招聘、贷款、医疗等重大决策时。
如果怀疑自己被算法歧视了,要求“人工复核”——很多国家和地区的法律已经赋予你这个权利。
了解你的法律权利:在中国,《个人信息保护法》赋予你拒绝算法自动化决策的权利。
✅ 对企业:从源头治理
数据审计:在训练模型之前,检测数据集中是否存在性别、种族等敏感属性与目标变量的不当关联。
公平性约束:在算法中加入公平性正则项,让模型不只是追求“准确率”,还要追求“公平性”。
外部审计:引入第三方机构对算法进行年度伦理审计。
✅ 对监管:完善法律框架
中国正在推动“伦理前置审查”制度,要求对训练数据进行偏见检测与清洗。
欧盟 AI 法案要求高风险 AI 系统必须进行偏见评估。
美国的多个州已经出台针对算法歧视的执法指南。
写在最后:AI 是镜子,不是创造者
AI 没有“歧视”你,因为它没有“意图”。它只是一面镜子——映照出人类社会历史上积累的偏见、不公和刻板印象。
但镜子的问题在于:它不会自己修正画面。如果我们往镜子里看,发现里面的人像扭曲了,我们不能怪镜子——我们得改变站在镜子前面的人,以及我们给镜子“看”的东西。
AI 的偏见,归根结底是人类的偏见。解决它,不能只靠技术,还需要我们正视历史的不公、改善数据的多样性、建立问责的机制。
AI 可以成为放大人类最美好品质的工具,也可以成为固化人类最糟糕偏见的帮凶。选择权,在我们手里。