您的公司需要查看正确的数据,才能最大限度地发挥数据驱动战略的作用。
德纳斯·格里包斯卡斯
德纳斯·格里包斯卡斯
11 分钟阅读
在线数据
Shutterstock 授权照片 - 由 Blue Planet Studio 提供
随着在线数据采集的兴起,我们正在踏入几乎未知的领域。网络抓取和其他形式的自动数据收集的行业监管实际上并不存在,我们可能不 塞内加尔电话号码数据 应该指望在不久的将来会出现任何监管。然而,有足够多的其他指示可以帮助我们遵守法律和道德。
内容
(非)公开数据
欧盟的个人数据
美国的个人信息
结论
除了对网络抓取提出质疑的特定法律案件外,我们还应该关注数据本身的类型和形式。虽然在线数据有多种分类方法,但我将把它们分为 3 个主要类型:公共数据、非公共数据和个人数据。
(非)公开数据
虽然对公共数据做出明确的定义可能很困难,但美国的判例法可能会让我们很好地了解它是什么样子。早在 2019 年,美国上诉法院就拒绝了 LinkedIn 阻止分析公司 HiQ 抓取其数据的请求。法院发现,HiQ 成功证明了其主张的成功可能性,即公共数据的自动数据收集不属于《计算机欺诈和滥用法案》(CFAA)规定的“未经授权”访问禁令。
最重要的是,法院评估认为,HiQ 实验室访问的数据任何人都可以使用常规网络浏览器访问,并且在我看来,相信抓取机器人的输入(访问公共数据时)与人类使用任何其他网络浏览器的输入没有任何不同。这给我们带来了一个额外的论点——自动公共数据收集不应被视为与手动收集不同,它只是一种更聪明、更高效的做事方式。
阅读更多
C 代
您需要了解 Talend 大数据创新新社区
雅虎承认大规模数据泄露后企业应吸取的 3 个教训
书评:大卫·麦坎德利斯 (David McCandless) 的《信息是美丽的》
在线数据科学学位真的具有包容性吗?
然而,美国上诉法院并没有完全放开任何类型的在线数据收集。虽然这可能很明显,但需要指出的是,许多法律法规和法律辩护理由,如版权法、数据库保护权、违反协议等,仍然存在。例如,通常受版权保护的数据(或一般内容)不能被收集并用于商业目的。
如上所述,该裁决不会推翻条款和条件。无论何时需要登录或注册,您可能都必须同意条款和条件,然后才能抓取相关网站的数据。更重要的是,从那一刻起,这些数据可能被归类为非公开数据。在几乎所有情况下,网站都会禁止任何自动数据收集。
因此,公共数据可能被定义为无需签署条款和条件或其他具有法律约束力的文件即可访问的免费信息。我们将其他所有内容视为非公开数据,如果没有制定其他法律依据,则可以使用自动化手段收集这些数据。
了解不同类型的在线数据,以制定数据策略
-
shukla7789
- Posts: 668
- Joined: Tue Dec 24, 2024 4:29 am