答案
建议、员工推荐、揭秘等等。让我们来帮助你。
插图:Wirecutter
大公司收集我们的数据。这就是他们认为我的样子。
看到你给一个公司提供的所有数据集中在一个地方,这是一种超现实的经历。
无论是在线还是离线,你做出的几乎每个生活选择、每个购买的物品或每个访问的网站都被记录、分类,然后输入到一个电子表格中进行出售。一旦摆在你面前,它可能会让你重新考虑将来如何分享信息。
今年初,加州颁布了新的隐私法,即《加州消费者隐私法》(CCPA),该法赋予人们查看企业对他们的数据、删除这些数据以及选择不再进一步收集的权利。这样的数据请求给每个人一个机会看到一小部分数据,虽然需要一些时间来完成请求的过程,但这是一种有用的练习,因为它可以帮助你在将来对自己的数据做出明智的决策。
我花了大约20个小时向30多家公司请求并阅读我的数据。我向显而易见的公司(如苹果和亚马逊)以及不那么显而易见的数据经纪商(如Acxiom和Clearview)要求了每一位数据。在我提交这些请求后,数据在最长45天后以大型电子表格或文本文件的形式到达,通常充斥着难以解读的代码。在整理我的文件时,我感觉自己像一个失忆的侦探,试图从自己的过去中拼凑线索。
零售商通常会收集一切可收集的信息
亚马逊收集并存储你在亚马逊上的一切行为并不会让任何人感到惊讶。该公司有一份我购买或退货的所有物品清单,我在亚马逊Prime Video上观看的一切(包括我观看的设备和位置),以及我在亚马逊上搜索的一切(包括我是否点击了互联网或外部链接)。它追踪每一封客户服务的电子邮件和聊天记录。它追踪你可以想象得到的一切,以及一些你可能没有想到的东西。
公司技术上只有45天的时间来回应请求,但有几家公司发出通知称他们需要额外的45天时间。
这种做法并不出人意料,但把它们都集中在一个地方看到确实很有趣。在巨大的电子表格上查看我的购买(和退货)历史为我生活中的某些时刻提供了一些微小的故事:当我离婚时,当我搬到一个新州时,当我开始对五弦琴着迷时,或者当蚂蚁连续几个月入侵时。
实体店也会收集数据。例如,家得宝对我来说有一个比我预期的要大得多的档案,尽管我没有在该零售商那里注册账户。我的数据包括推断的收入水平和净值(都非常错误)、种族和性别(都正确)、房屋所有权(错误)以及购买历史。百思买也有类似的数据,还加上了我推断的宗教和政党,以及其他“触发因素”,比如我不太可能购买手机(正确)、卫星电视(同样正确)或豪华车(非常正确)。
查看我的营销档案既令人宽慰又令人恐惧。对于它完全错误的一切(高度喜欢足球),总有一些东西是如此正确,以至于我不禁想知道它是如何想出来的(高度喜欢“重度纤维食品购买者”)。无论哪种情况,有了这些指标在我面前,我很容易想象出一个假设的未来,在那个未来,这些数据可能被滥用,要么拒绝为我提供服务,要么利用负面(或正面)的生活事件对我进行利用。 然而,零售商是从哪里获取这些数据的呢,比如有关政党、宗教信仰等方面的数据?
这就引出了数据经纪商。
数据经纪商可以根据你的线上足迹创建一个准确的个人资料
数据经纪商是收集和销售消费者信息给其他数据经纪商或个别公司的公司。数据经纪商从各个地方收集信息,包括公共记录、商业来源和网络浏览。然后他们将这些数据整理成一个个人资料。Vice对这些服务的工作方式进行了详细解析,包括数据经纪商如何收集和销售这些信息。Vice还提供了一个退出这些服务的资源。
我从几家数据经纪商那里得到了我的数据,包括Acxiom和Equifax。Acxiom有我从童年家庭到现在的地址,我从高中开始的电子邮件地址(包括我第一个Prodigy.net地址)和我的年龄。Acxiom还包括它对性别、收入和子女情况的推测。这是Home Depot和Best Buy等公司用来建立我的个人资料的第三方服务。我问过Home Depot的隐私部门,他们是否使用了Acxiom的数据来建立我的个人资料,尽管代表告诉我零售商使用了像Acxiom这样的数据服务,但他们没有直接确认使用了哪些服务。Best Buy没有回复我的邮件。
。
根据Best Buy从数据经纪商那里收集的数据,结果显示没有任何品牌可以影响我选择洗衣机(数字越低,公司预计越高的可能性描述了我)。
Acxiom跟踪我在服装、电子产品、一般订单等方面的购买行为。它知道我每个类别每个月购买多少次,以及我倾向于花多少钱。它知道我旅行多少次和捐赠多少钱。它使用这些信息来创建一个包括我的生活方式兴趣、自由收入和分组推测的个人资料(我是一个“高收入者”,“年轻的数码达人”和“富有成就者”,这对我来说是新闻)。即使我们声称我们的购买行为不定义我们,数据经纪商却正是利用我们的购买行为来做到这一点。根据Acxiom的推测,我在实际财富阶层之上。
Clearview---这家初创公司帮助执法机构将未知人物的照片与他们的线上形象进行匹配---并不完全是一个数据经纪商,但它在提供监视服务方面运营在类似的灰色地带。在我的案例中,我的数据很无聊,包括多年来我曾为之工作过的各种网站的个人照片。但正如Vice的Anna Merlan指出的,这些照片并不都来自社交媒体,如你所预期的那样。有些来自更为晦涩的来源,比如“某人写的一篇指责我进行黄色新闻报道的愤怒帖子,以及一个极其边缘的阴谋论者的网站,他曾多次写过我”。
设备和服务追踪每一次滑动
你在拥有的每个设备上所做的一切都被追踪。不仅仅是Netflix有我流媒体的5,751部影片的列表,Spotify知道我播放(和收藏)的每一首歌,Amazon记录了我在电子书阅读过程中放弃阅读的具体位置,而Apple Music则追踪我听歌的进度。
更令人惊讶的是硬件追踪参与度的程度。亚马逊不仅知道我多久换一页(可能是为了Kindle显示章节或书籍剩余时间),还知道我是通过点击还是滑动屏幕来进行换页。我猜想这个小细节在亚马逊设计下一代Kindle的界面时会被使用。Netflix的报告给了我除了我观看的视频之外的各种数据,比如我搜索了什么,我在电影中看到了多少,等等。 这是Netflix挖掘的数据类型,用于提出节目创意。
Netflix并不完全理解《双峰》之所以伟大的原因,只是简单地推荐更多的犯罪剧。
当你第一次看到推荐算法的输出时,它们给人一种神奇的感觉。但是当你有机会查看所有输入时——你向公司提供的每一点数据,集中在一个地方——这种神奇感就消失了。例如,我今年听了很多Purple Mountains的歌,因此Spotify推荐给我Silver Jews。我在Netflix上多次搜索《十二宫杀人案》,因此Netflix认为我可能会喜欢看《极恶嫌疑犯》或者类似的作品(如果无法获得版权)。这些算法能够建立明显的联系,但它们无法理解你为什么喜欢某个东西的细微差别,这使它们的用处不比两秒钟的谷歌搜索更大。《十二宫杀人案》之所以成为史上最佳电影之一,并不仅仅是因为它是关于连环杀手的——还有其他方面。
社交网络呢?
当你从Facebook(包括其所拥有的任何服务,如Instagram)、Google或Twitter请求数据时,它们通常会将你重定向到内部工具,以下载你提交给该服务的所有数据(如Instagram上的照片或Google中的搜索历史)。社交媒体公司不会提供任何隐藏的数据或关于你账户的深入细节。如果你已经使用这些服务很长时间了,将你的数据集中在一个地方可能是有趣的,但我觉得这不值得花费这么多精力。不过,所有这些公司都会向你展示你的广告偏好:
如何请求你自己的数据
如果你想请求你自己的数据(或行使CCPA下的其他权利),准备花几个小时。有些公司要求我出示一份带有照片的身份证明,而其他公司则要求提供照片或某种地址验证。还有一些公司只是简单地相信我。坚持你自己认为合适的方式,如果一家公司要求你提供比你认为需要的更多的身份证明,请直接联系该公司。无论如何,如果你还没有使用密码管理器,现在是设置一个的时候了。密码管理器有助于安全地跟踪所有这些请求和账户。
作为加利福尼亚居民,我首先参考了GitHub上的这个列表和Common Sense Media的列表,以找到我购买过的公司。如果你不是加利福尼亚居民,一些最大的公司允许你请求你的数据,无论你住在哪里:
- 亚马逊
- 苹果
- Doordash
- 谷歌
- 微软
- Netflix(需要使用与你的账户相关联的电子邮件账户发送电子邮件给某人)
- Ring
- Roku
- 星巴克
- Uber
- UPS(点击“数据隐私”下拉菜单项)
- Zillow
尽管CCPA为个人数据收集增加了一些保护和透明度,但它仍然需要改进。 公司对其要求的实施不一致,处理请求就像在泥浆中艰难前行,但该法律代表了朝着透明度的良好第一步,使每个人更容易理解他们的数据在哪里,如何被购买和出售,最终价值是多少。通过这个数据请求过程,我看到了许多公司收集的关于我的数据,如果可以的话,我建议你也去尝试一下,即使不是针对你曾经购物的每个地方,至少也要针对一些较大的公司。这种经历类似于学习如何修理你拥有的物品,拆解它会让你对它的工作原理有新的认识。了解你的数据是如何被收集然后在公司之间流动是理解整个过程的第一步。
我们放弃了比我们所知道的更多的数据。《加州消费者隐私法》揭示了其中的一部分,并且查看你的结果会让你重新考虑未来自愿放弃多少数据。完全关闭这种数据收集几乎是不可能的,但人们从《加州消费者隐私法》等法律中获得的越多工具,每个人就有越多机会阻止其中的一些。
上面提到的{#linked-heading}
原创文章,作者:纽约时报精选,如若转载,请注明出处:https://pingcer.com/nytimes/data-harvesting-by-companies/