13910160652
010-52852558
| |EN
首页 > 创新科技
  • 13910160652
  • ciplawyer@163.com

苹果部署先进隐私技术:不窥探用户活动也能了解其行为

日期:2017-07-10 来源:凤凰科技 作者: 浏览量:
字号:
《华尔街日报》北京时间7月8日报道,去年,苹果公司针对一项新的隐私技术展开了大规模试验,旨在解决一个愈加棘手的问题:如何在不窥探用户活动的前提下,打造出能够了解用户行为的产品。

答案就是“差分隐私”技术(differential privacy),这个名词在学术圈以外几乎无人知晓,直到一年前才被外界了解。现在,微软公司、Uber公司等其他公司也都在测试这项技术。

差分隐私技术

差分隐私试图处理的问题,源自现代数据分析工具能够找到大型数据库之间的链接。隐私专家担心,这些工具可能会被用于在其他匿名数据集中识别用户。

两年前,麻省理工学院的研究人员发现,通过把社交媒体账户与匿名信用卡记录以及位置、购买时间等二手资料相链接,他们就能确认购物者身份。“我认为人们并没有意识到数据的去匿名化是多么简单,”伊桑·纳尤尔卡(Ishaan Nerurkar)表示,他的创业公司LeapYear Technologies销售基于机器学习的软件,并使用差分隐私技术保持用户数据的匿名化。

差分隐私算法通过增加大量可测量的统计噪声,对正在被分析的数据进行模糊化处理。例如,把一个问题(你是否犯过暴力罪行?)置换成一个在统计学上拥有已知反应率的问题(你是在2月出生?)。这样,试图寻找出数据之间链接的人就无法确定一个特定人被询问过哪个问题。研究人员在分析病历等敏感数据时也就无法把数据与特定人绑定在一起。

有助于苹果开发AI产品

加州大学圣克鲁兹分校助理教授阿布拉迪普·萨克塔(Abhradeep Guha Thakurta)表示,差分隐私对于苹果在人工智能(AI)上的努力至关重要。萨克塔一直在从事苹果的差分隐私系统,直到今年1月。


图:差分隐私技术原理

外界批评苹果在开发AI技术上未能跟上谷歌公司等对手的步伐,后者已经在图像和语言识别软件上取得巨大进步,这些软件被用于驱动虚拟助手和自动驾驶汽车。

尽管谷歌等公司获得了提高AI技术所需要的海量数据,但是苹果的隐私政策成为了他们发展AI的一个障碍。这一隐私政策遭到了一些人的批评,认为它导致苹果在Siri等AI产品方面成为了落后者。

“目前为止,苹果一直设法避免收集用户数据,但是要想在AI时代取得成功,他们必须收集用户信息,”萨克塔称。他表示,苹果从去年9月份开始推出差分隐私软件。

在苹果使用分析数据前,它必须得到用户的同意。苹果软件工程师凯蒂·斯金纳(Katie Skinner)在6月份举行的全球开发者大会上称,苹果原本使用差分隐私技术来了解用户如何在手机上使用表情符号和新俚语,现在已经扩大了它的用途,用于覆盖所收集到的网络浏览和健康相关数据及分析。

她表示,苹果现在每天能够收集到数百万份信息,全部使用差分隐私技术进行保护。这些信息来自运行最新操作系统的Mac、iPhone以及iPad。

“苹果相信,优秀功能的推出和保护隐私并不相悖,”苹果发言人通过邮件表示。

局限性

谷歌是差分隐私技术的早期使用者之一,已经在使用它保持Chrome浏览器数据的匿名化。但是,尽管这一技术很适合部分分析类型,但是并不适用于高精度分析。例如,谷歌专家称,它并不适用于所谓的A/B测试。A/B测试指的是开发者针对少量用户测试两种版本的网页,看看哪个反应更好。

“在一些情况下,你就是无法回答开发者想要让你回答的问题,”谷歌隐私工程师约纳坦·尊格(Yonatan Zunger)表示,“基本上,我们把差分隐私视为工具箱中的一个有用工具,但不是灵丹妙药。”

宾夕法尼亚大学计算机科学教授本杰明·皮尔斯(Benjamin Pierce)表示,对于差分隐私,研究人员提出了“惊人的强大使用方式”,但是这项技术才刚刚问世大约10年。“我们还远远不知道它的局限,”他表示。 自从苹果首次使用差分隐私以来,这项技术得到了更为广泛的使用。例如,Uber员工使用它改进服务,同时不必过度曝光用户数据。

微软正和圣地亚哥电力公司(San Diego Gas & Electric)在一个试点项目上展开合作,向研究人员和政府机构提供智能电表数据,以便进行分析。圣地亚哥电力公司客户隐私主管称,公司同时要确保“不能通过任何数据集找到我们的用户”。

美国人口调查局在10年前也面对过数据集之间的链接问题。人口调查局首席科学家约翰·阿波德(John Abowd)表示,2005年,人口调查局曾担心不在其控制范围内的大型数据库可能会被用于对参与普查的人口去匿名化。在与部分差分隐私技术的开发者会谈后,人口调查局成为了这项技术的支持者。

2008年,人口调查局发布了首款基于差分隐私技术的产品——基于网络的数据地图网站OnTheMap。阿波德称,人口调查局现在“正在作出巨大努力,把差分隐私技术用于2020年的人口普查”。