面部识别隐私安全问题爆发，IBM拿面部数据集赚钱？-EDN 电子技术设计

 面部识别技术成为整个 AI 行业最为常见的技术应用之一；不过，在识别效率越来越高的同时，人们也开始担心面部识别技术发展过程中的隐私安全问题。比如说最近 IBM 利用 Flickr 下载的图片来进行面部识别训练，就引起了人们的质疑；NBC News 针对此事进行了详细的报道，本文对这篇报道进行了不改变原意的编译。

近些年来，面部识别技术得到了长足发展，除了帮你解锁 iPhone，还能让执法机关在人山人海中“一眼”就认出犯罪分子，商店甚至用它来识别自己的“死忠”客户。不过，法律专家却警告称，大量未经允许滥用网络照片最终会画地为牢，反过来成为监控你的“帮凶”。x7Wednc

现在的面部识别技术还不完美，它工作时靠的是算法，目标则很简单——认出那张独一无二的脸。x7Wednc

想把这个任务完成好，技术人员就必须提前“喂给”算法“养料”，即天量的面部照片。那么这些照片从哪来呢？当然是互联网。x7Wednc

起初，算法学习的照片都会按照不同的标准进行分类，比如年龄、性别、肤色等，但经过一段时间的学习后，它的能力开始变得有些吓人了，于是法律和人权专家开始大声疾呼，他们担心技术人员对普通人照片的滥用会带来“反噬”效果。x7Wednc

“这是 AI 训练数据集背后的肮脏小秘密。技术人员可不管三七二十一，只要能用的照片他们都不放过。”纽约大学法学院教授 Jason Schultz 说道。x7Wednc

最近 IBM 公司也进了“暴风圈”，今年 1 月它们向研究人员分享了自己的数据集，包含了 Flickr 上近 100 万张照片，虽然 IBM 号称此举是为了减少面部识别的偏差。x7Wednc

了解真相后的摄影师们不愿意了，因为 IBM 在他们的作品上加了各种细节注释，包括面部几何结构、肤色等信息，而这些照片最终可能会成为面部识别算法的“养料”。x7Wednc

“我拍过的人可没想过，自己的照片居然会被用在面部识别算法训练上。”公关经理 Greg Peverill-Conti 气愤地说道，他有 700 多张照片被收录在了 IBM 的“训练数据集”中。“IBM 太草率了吧，它们怎么能不经同意就使用这些照片”。x7Wednc

IBM 公司 AI 研究主管 John Smith 则表示，公司“致力于保护个人隐私”，如果谁想从数据集中移除照片，尽管联系 IBM。x7Wednc

虽然 IBM 信誓旦旦的保证 Flickr 用户可以随时移除数据集中的照片，但事情哪有那么简单，这本就是个有来无回的“不归路”。因为 IBM 需要拍摄者发送想要移除图片的链接（光靠 Flickr 账号不管用），而它们却从没分享过到底这个数据集用了谁的 Flickr 照片，所以你大概率会被蒙在鼓里。x7Wednc

对于这个数据集，IBM 有自己冠冕堂皇的理由——它将用于学术工作，且担负着让面部识别变得更加公平的重任。当然，在网络照片滥用方面，IBM 并不是独一家，数十家其他研究机构或公司也在采集网络照片训练自己的面部识别系统。x7Wednc

一些法律专家认为，这不仅仅是对数百万人肖像权和隐私权的侵犯，它还加重了人们对面部识别技术的担忧，也许有一天执法部门会让它“双手沾满鲜血”。x7Wednc

面部识别技术的进化历程

面部识别工具刚刚诞生时，研究人员会付钱请人来试验室“帮忙“，这些人拿钱办事，将自己不同姿态和光照角度下的照片留了下来以供研究之用。不过，这样的方案成本高还浪费时间，因此早期的数据集往往只有数百个样本。x7Wednc

进入新世纪后，互联网飞速发展，研究人员突然意识到，面部识别的好时光来了，因为网上有天量的照片可供使用。x7Wednc

056ednc20190314 x7Wednc

“直接打开搜索引擎，输入名人的姓名，然后下载各种 360 度无死角的照片既可。”美国国家标准技术局数据集采集人员 P. Jonathon Phillips 说道。x7Wednc

随着社交网络的兴盛和自媒体的发展，普通人的照片也突然多了起来。研究人员默认这些照片是对所有人开放的，有时他们甚至会从 YouTube 的视频中抓取面部图片。x7Wednc

由于工作的非经营性质，学术人员用起照片来绝对是近水楼台，因为他们能绕过版权问题了，而 Flickr 的性质更是让它们成了研究人员绝对的安全之选。x7Wednc

为了保证数据集的多样性，IBM 其实从 Flickr 上 Down 了超过 1 亿张照片，随后又精选了 100 万张有注释的面部照片。为了力求精确，它们甚至为这些照片定了 200 多种分类标准。x7Wednc

057ednc20190314 x7Wednc

谷歌学术指出，这种研究方法在业内几乎已经是尽人皆知，因为有数百篇学术论文都在靠照片采集来佐证自己的论点，没人敢说自己是完全清白的，或者拿到了授权或同意。因此，面部识别准确性的提高和分析工具的进步主要就是靠这些“野路子”来的照片。x7Wednc

IBM 真没拿面部数据集赚钱？

“要想让面部识别系统超常发挥，训练数据必须足够多样化，而且覆盖范围足够广。”IBM 的 John Smith 说道。x7Wednc

在 IBM 看来，自己的数据集并未将图片中的人脸和具体的名字联系起来，这就意味着系统不会侵犯人们的隐私。不过，依然有人质疑 IBM 的动机，因为它们可是向政府出售过监控工具。x7Wednc

举例来说，911 袭击发生后，IBM 就将面部识别技术卖给了纽约警方，执法部门通过搜索监控录像就能识别出特殊的肤色或发色。IBM 还曾推出过“智能视频分析”产品，它们能通过监控摄像头给人们加标签（亚裔、黑人或白人）。x7Wednc

如今，IBM 则有了 Waston 视觉识别系统，通过图片算法就能识别出人的年龄和性别。配合正确的训练算法，客户就能从图片或视频中识别出特定的人。在被问到 Waston 用了什么训练数据时，IBM 称数据有多个来源，不过却拒绝披露具体的数据来源，并美其名曰保护知识产权。x7Wednc

一再逼问下，IBM 称从 Flickr 拿到的相片数据集仅用于研究，不会用来提升公司的商用面部识别工具。不过，有专家指出，类似 IBM 和 Facebook 这样的公司，其研发和商业运营部门之间的界限非常模糊，而且研发部门的知识产权均归 IBM 所有。因此，面部识别公司 Kairos 前 CEO Brian Brackeen 断言，即使学术部门研发的算法有其非商业化性质，这些算法最终还是会被拿来赚钱。x7Wednc

他还打了个形象的比喻，“你可以把它看做拿面部识别技术洗钱，公司将网上的照片洗成了自己的知识产权。”x7Wednc

“被选中”的摄影师们怎么想？

澳大利亚摄影师 Georg Holzer 将自己的作品上传 Flickr 是为了记录自己声明中的精彩瞬间，他也签署了创意认证，只要是非营利性项目，就能免费使用他的照片。不过，他没想到自己的照片会成为面部识别技术的“养料”。x7Wednc

“我了解技术能造成的伤害。”Holzer 说道。“当然，面部识别技术也有其积极的一面，但如果用得不对，它也能剥夺人的基本权利和隐私。我是无法接受这项技术广泛应用的。”x7Wednc

“我觉得 IBM 可不是家慈善公司，最终它们还是会用这项技术牟利，所以面部识别技术还是会进入商业市场。”Holzer 说道。x7Wednc

Dolan Halbrook 也有 452 张照片被 IBM 的数据集“侵吞”，他也认为 IBM 在使用这些照片时应该征得自己的同意。x7Wednc

当然，也有摄影师觉得自己的照片能被 IBM 选中并用在推动面部识别发展上是一大幸事。x7Wednc

瑞士的 Guillaume Boppe 就表示：“如果我的照片能帮助 AI 进化，降低探测错误率并最终提升全球安全指数，我举双手赞同。”x7Wednc

想从数据集中删图？没那么容易

如果你不同意 IBM 将自己的照片当成训练数据，也可以联系它们删除，但操作起来没那么容易。一位被抓取 1000 多张照片的摄影师忙活了半天，也只删除了 4 张照片，因为他无法找到所有照片的链接，而 Flickr 账号 IBM 可不认。x7Wednc

此外，即使从 IBM 的数据集中删除了照片，IBM 研究伙伴拿到的数据集也无法一并删除（已经有 250 多家组织和机构接入了 IBM 的数据集）。x7Wednc

显然，IBM 的数据集不是公共场所，没法想来就来想走就走。x7Wednc

好在，各国对隐私数据的保护正在加强。举例来说，欧洲就将照片看做“敏感个人数据”，如果 IBM 不按规定删图，可能就会被欧盟重罚。在美国，也有一些州有了相关规定，在不征得当事人同意的情况下采集、存储和分享生物信息属违法行为，而生物信息包含指纹、虹膜和面部几何结构等。x7Wednc

近期，芝加哥的律师 Jay Edelson 就向 Facebook 发起了集体诉讼，称其面部识别工具触犯了相关法律。x7Wednc

至于典型的法院判例，现在还是一片空白。x7Wednc

（原文发表于 NBC News，雷锋网编译）x7Wednc

阅读全文，请先

人工智能传感器/MEMS 消费电子安全与可靠性产业前沿

上一篇： 华为起诉美国政府是绝地反攻？ 下一篇： 实践证明：结构电池使无人机飞行时间增加一倍

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

2025松山湖中国IC创新高峰论坛：继续聊聊机器人去年的主题是智慧机器人，今年的主题仍然聚焦于机器人身上，不过变为了具身智慧机器人……
鹏瞰TS-PON Gen2芯片，用光协议重塑机器人“神经网络” TS-PON Gen2芯片是一款灵活的软件定义 SoC，适用于多种场景。它基于无源光网（PON）技术，具备高带宽（目前10G，未来可拓展至25G、50G）、低时延（微秒级）、高确定性等特性···
让人形机器人“耳聪目明”，昆泰芯KTM5900磁性编码器解编码器芯片作为机器人的核心传感器之一，对于提升机器人的感知能力、安全性和生产效率具有重要意义···
如何让具身机器人“看”得清？思特威给出了这个答案相比于滚动快门传感器，全局快门传感器能够同时曝光整个画面，有效避免了运动过程中产生的图像形变，为机器视觉提供高精度、无畸变的图像···
极海推出全球首款双核Cortex-M52实时控制MCU/DSP 随着机器人技术的不断发展，其应用领域从传统的工业制造逐步拓展至医疗、农业等多个新兴领域，这对机器人的控制系统提出了更高的要求，当前机器人控制系统当前主要面临高爆发、高动态、高精度和高安全这四方面的挑战···
比人类更灵活？先楫HPM6E8Y机器人关节控制解决方案 HPM6E8Y通过硬件加速器将电机控制算法执行时间缩短至2.8μs，以全链路高实时通信与多轴协同能力，开启机器人关节“芯”时代。
为旌科技感算控一体化芯片落地，带来6倍效率提升？具身智能的本质是‘大脑（认知）+小脑（控制）+感官（感知）’的协同进化，需要芯片层面实现三者深度融合。
爱芯元智发布AX8850：让AI算力更便宜，让智能更可及爱芯元智希望把算力做得更加便宜具智价比，普惠AI，让我们的边缘智能更加触手可及···
万有引力EB100芯片亮相，空间计算走向低功耗新时代？ EB100芯片将为XR和机器人行业带来更好、更低功耗的空间计算和显示能力，开启空间计算时代的无限可能···
芯驰D9 Max：为具身智能而生的高性能SoC，一颗芯片顶五颗我们希望以1个芯片完成5个芯片完成的事情。当应用发生爆炸性的变化，融合一定是一个非常大的趋势，而且融合的过程会使软件的开发更简单，系统的开发更简单，成本控制得更好···
情境感知AI：利用FPGA技术增强边缘智能现场可编程门阵列（FPGA）的灵活性、现场升级能力和互操作性，结合其低功耗、低延迟和并行处理能力，使其成为开发者克服挑战并优化情境边缘AI应用的关键工具。
ADAS 系统中的传感器创新如何在道路交通中挽救生命在本文中，我们将探讨 ADAS 在提高道路安全方面的作用，以及各种对实现这一目标至关重要的传感器技术。

25年第19周新能源周销量：不同价格带的车型走势解析本周插混与增程车型市场呈现出“两极化”趋势：一方面，10-15万元级的主流家用轿车与SUV销量强劲；另一方面，20万元
拆解报告：甲骨文3060W碳化硅服务器电源模块甲骨文服务器电源模块输入输出均为专用接口，采用热拔插设计。电源模块支持200-277V交流和240-380V直流输入，输
评测：森海塞尔ACCENTUM Open真无线耳机半入耳机森海塞尔ACCENTUM Open 真无线耳机采用半入耳式设计，搭配约4.4克的重量，佩戴舒适。耳机充电盒轻盈小巧，携带外
人形机器人如何做到“手眼”协同+“大小脑”协同？人形机器人正站在“走出实验室”的临界点。从本体制造、控制系统、核心零部件到应用场景拓展，技术与产业生态
南非2025年4月：奇瑞和长城汽车快速上升 2025年4月的南非车市增长，马恒达和现代的强劲回归是一个信号，而中国品牌的集体崛起，则预示着未来竞争将更加多
4月新能源车领跑汽车出口增长，中国汽车走向全球的新引擎 2025年开年以来的出口数据呈现出清晰的结构升级路径。新能源产品在出口中扮演的角色日益重要，不再只是锦上添
拆解报告：vivo手机原装90W氮化镓闪充充电器 vivo 90W氮化镓闪充充电器采用经典直板造型设计，同时附带一条专门量身定制的8.5A大电流数据线，配合信号屏蔽层
拆解报告：HONOR荣耀手环10 荣耀手环10在外观方面，延续了上代的轻薄双曲面设计，同时采用全新的双色NCVM镀膜工艺，使之更加的时尚精致。标配
2025年4月中国车企加速渗透土耳其市场：比亚迪Seal U打响突围战 2025年4月，土耳其市场的爆发式增长为全球车企提供了重要信号：新兴市场正在进入电动化转型的加速期，而土耳其作
2025年第19周新能源周销量：问界起势 2025年第19周，中国乘用车市场的周度销量达到44.4万辆，其中新能源车占比突破50%，达22.3万辆，占比50.2%。比亚迪体
2024年4月汽车市场终端数据：自主崛起、新势力分化、合资承压从整体销量数据来看，4 月汽车终端销量达 169.7 万，同比增长 9.3% ，在目前的价格力度下，这个销售数字差强人意。2
拆解报告：华为750W钛金牌服务器电源华为这款服务器电源型号为PAC750S12-TE，支持220V交流或240V直流输入，输出电压为12V，输出电流为62.5A，输出端设有

史密斯英特康推出新一代“ DaVinci Gen V”测试插座史密斯英特康推出新一代“ DaVinci Gen V”测试插座，为人工智能、6G通信及先进计算应用领域的芯片提供超
意法半导体高集成度低边电流测量放大器简化高准确度电流检测意法半导体的 TSC1801低边电流测量放大器集成了设定增益所需的匹配电阻，从而简化了电路设计，节省了物料清单
意法半导体推出创新的、带有可改变存储配置存储器的车规微控制器新推出的Stellar微控制器内置了xMemory技术，它为正在发展的软件定义汽车以及不断进化的电动汽车架构提供了一
新系列串口EEPROM内置唯一ID码，适合设备识别、溯源和可持续性应用意法半导体 (ST) 推出了一系列内置128位唯一只读ID码 (UID) 的串口EEPROM芯片，以满足市场对产品识别、溯
Vishay新添增强短瞬态脉冲防护性能的经AEC-Q200认证的厚膜功率电这些器件采用夹片式TO-247 封装形式，可直接安装在散热器上，具有高达 75 J/0.1 s的高脉冲吸收能力和 150
凉棚集成Nordic 技术实现Matter over Thread连接为家庭和企业 StruXure+ 凉棚和小屋系列集成 Nordic 的 nRF5340 SoC以提供无缝的 Matter over Thread 连接
智能楼宇技术全球领导者与Nordic Semiconductor携手合作确保楼业界连手推动NR+成为智能楼宇的全球连接标准···
Cadence 率先推出 eUSB2V2 IP 解决方案，助力打造高速连接新范 Cadence 在业内率先推出 eUSB2V2 IP，此 IP 基于先进的台积公司 N3P 工艺，符合最新的嵌入式 USB2 版
纳芯微发布双通道电流检测放大器NSCSA285，赋能工业与能源管理近日，上海 —— 纳芯微电子（简称“纳芯微”）发布全新高精度双通道电流检测放大器NSCSA285系列···
攻克PWM高频瞬态干扰难题！纳芯微发布车规级电流检测放大器NSCSA24 近日，纳芯微发布全新车规级双向电流检测放大器NSCSA240-Q1系列，专为汽车高压PWM系统打造解决方案···
TE Connectivity 推出INMORO系列：致力于满足中国市场需求而打造的连接和传感解决方案提供商泰科电子（TE Connectivity，以下简称 TE）工业事业部隆重推出INMORO 系列，致力于满足中
破解汽车与工业等应用新挑战，TDK展示多传感器融合与AI+发展趋势在新能源汽车应用中，热管理系统既要能高效地冷却和加热电池、电机与OBC等车辆核心部件，确保其处于最佳运行温

热门评论
最新评论

换一换

杂志声明

面部识别隐私安全问题爆发，IBM拿面部数据集赚钱？

面部识别技术的进化历程

IBM 真没拿面部数据集赚钱？

“被选中”的摄影师们怎么想？

想从数据集中删图？没那么容易