数据保留指引
介绍
数据很重要。这是我们作为一个组织和一个运动学习和发展的方式之一,以及我们如何帮助那些使用它们创造,学习和分享的人更好地完成项目。同时,我们致力于“在维护,理解和改进维基媒体网站的最短时间内保存您的个人数据,以及我们根据适用的美国法律承担的义务”(维基媒体基金会引用隐私政策)。
本文档帮助说明我们如何履行这个承诺,通过描述我们用于数据保留、系统设计和进行中的审查与维护的指引。这些指引将变成一份现存文档——它们将被同时更新以反映现有保留实践的问题。
什么数据会受本指引影响?
这些指引适用于我们从隐私政策和非Wiki隐私政策所涵盖的维基媒体网站收集的所有非公开数据。我们捐赠者隐私政策包括适用于捐赠者信息的单独数据保留指南。
我们的非公开数据会保留多久?
除非第三方要求或受不可抗力影响,我们将按照以下列表酌情定义数据保留期限:
数据类型 | 来源 | 例子 | 最高保留期限 |
---|---|---|---|
非公开的个人信息 | 从用户自动收集 |
|
最多90天后,它将被删除,汇总或取消标识 |
帳戶設定 |
|
直到使用者刪除/修改其帳戶設定 | |
非个人信息 | 从用户自动收集 |
|
无限期 |
|
最多90天后,它将被删除,汇总或取消标识 | ||
由用户提供 |
|
最多90天后,它将被删除,汇总或取消标识 | |
由用户提供 |
|
直到使用者刪除/修改其帳戶設定 | |
非个人信息[T 1] | 从各类用户自动收集 |
|
无限期 |
由读者浏览的条目 | 从读者自动收集 |
|
至多90天后,如果保留,則只以匯總的形式。 |
- ↑ 出于本表的目的,用户帐户表示用户名,用户ID或IP地址;读者是指维基媒体项目的访问者。
我们保留公共数据多长时间?
维基媒体托管维基百科及相关项目,作为我们收集,记录和自由分发人类知识总和的使命的一部分。因此,当您为任何维基媒体网站(包括用户或讨论页面)做出贡献时,您将创建一个永久性的公共记录,记录您添加,删除或更改的每个内容。 页面历史记录将显示您的贡献或删除时间,以及您的用户名(如果您已登录)或您的IP地址(如果您未登录)。我们可能会使用您的公共捐款,或者与他人的公共捐款或单独捐赠,为您创建新功能或数据相关产品,或者了解有关维基媒体网站如何使用的更多信息。 如果您错误地将您的个人信息包含在对维基媒体网站的贡献中,并且您希望将其删除,请咨询社区的监督政策。 请记住,我们网站修订历史的透明度和完整性对我们的使命至关重要,基金会支持我们社区拒绝监督请求以保护项目的权利。
如果您选择注册维基媒体项目的帐户,系统会要求您选择用户名。用户名将保留,直到用户请求该帐户为已被重命名,或通过社区隐退流程。
请参阅我们的隐私政策获取更多信息。
定义
为本指引之目的:
- “个人信息”是指您向我们提供或我们向您收集的可用于辨认您的信息。请参看隐私政策和非维基隐私政策了解详情。
- “公开信息”的例子有:
- (a)您的IP地址,如果您做出未登录编辑;
- (b)您的性别,如果您在用户资料(使用者设定档,user profile)中透露了;
- (c)任何您在维基媒体网站上透露的信息,例如您的真名或年龄。
- “不公开信息”的例子有:
- (a)您的IP地址,如果您是在登录时作出编辑;
- (b)您的电子邮箱地址,如果您在注册账号时已经提供给我们(但没有公开展示);及
- (c)可根据您的IP地址推断的您的大致位置,如果您未公开展示之。被视为“非公开”而非“公开”的信息,其具体类型在隐私政策中有更全面的解释。
- 数据经过“去标识化”处理是指,数据已被汇总或者以其它无法辨认用户的方式保留。
- 数据经过“汇总”处理是指,关联到特定单一用户的数据已经与来自其他用户的数据结合,从而在不辨认出特定用户的情况下展示一般趋势或值。
数据如何汇总的一个例子:
- 使用范围而非具体数字,例如记录“国家Y中使用X语言的编者有1~10个”,而不是记录符合这个条件的编者有4个。
未在本文件中定义的术语,含义与在隐私政策中所给出的相同。
方针例外情况
如果我们要对此指引设置例外,会在此页面上描述之以通知社区。
- 数据也许会在系统备份中保留更长周期,但最多不会超过5年。
- 我们开展调查或其它研究时,将向您提供隐私声明,详细说明您参与此类调查期间收集的信息(含个人信息)的保留期限。特定情况下,出于教育、开发或其它相关目的,信息可能被无限期保留,除非相关隐私声明另有说明。此类信息可能以原始、汇总或去标识化形式保留,直到我们收到参与者删除信息的请求为止。
- Research related to COVID-19: The Wikimedia Foundation Research team is conducting research regarding COVID-19 and its impact on Wikipedia. Retaining de-identified readership data from COVID-19 related articles will enable us to better understand how to prioritize content creation, to understand what happens to readership when there is a "shock to the system", and to empower the research community to answer such questions. By "COVID-19 related articles", we mean articles that link to the COVID-19, SARS-CoV-2 and 2019-2020 COVID-19 pandemic Wikidata items. For comparison purposes, we will retain data from a small number of articles unrelated to COVID-19 as well. In order to collect sufficient data, and obtain a picture of readership as time passes, we will be retaining this de-identified data beyond the 90-day retention limit, for a period of one year, ending on March 1, 2021. (Note that this includes a one-month extension due to staffing changes, in order to allow for the project's completion.). For technical details about the sampling and de-identification process, please see the project page on GitHub.
- Editing research: There is a short-term extension applying to data collected as part of experimental features to improve replying on talk pages. In order to collect and analyze sufficient data, this data must be kept beyond the standard 90-day period. The retained data will be deleted, aggregated, or de-identified within 180 days.
- Campaign landing pages: for certain events, campaigns, or marketing channels, users may create accounts on special landing pages. After creating their account on those pages, the association between their account and its source may be retained indefinitely, both to provide a good user experience for that account and for longitudinal analysis on campaign effectiveness. For more information, contact mmiller
wikimedia.org.
- CampaignEvents extension: An exception exists for data collected by the CampaignEvents extension. The extension collects the global user IDs of event organizers and event participants, as well as which events users organized or attended and when participants registered for an event. In order for the extension features to work consistently, data collected by the CampaignEvents extension may be retained indefinitely.
- Sound logo contest: There is a short-term extension applying to data collected as part of contest entries to allow the brand studios team to evaluate entries in preparation for announcing the winner in February 2023. The retained data will be deleted, aggregated or de-identified within 90 days after the winner is announced.
- Webrequest datasets: There is a short, one-time extension for data from the wmf.webrequest and wmf.pageview_actor datasets. This data needs to be retained longer than usual while we correct an error in the way unique devices are calculated from the dataset. Accurate unique device statistics are necessary for engineering purposes and legal reporting requirements. The underlying data used to calculate these statistics will be retained for an extra 30 days beyond the ordinary 90-day deletion period. After 30 days, the affected data will be purged and retention settings will reset back to 90 days.
- 极少数情况下,我们(或者如隐私政策所述,个别具有特定管理权的用户)可能需要在合理必要的期限内(此期限可能长于上方表格所述)保留您的个人信息,包括您的IP地址和用户代理信息,以:
- 依规约束或调查可能违反我们的使用协议、此隐私政策或任何基金会政策或基于用户社区的政策的行为;
- 针对法律威胁或法律行动进行调查或自我辩护;
- 帮助阻止破坏和滥用,打击对其他用户的骚扰,及更广泛地尽可能减少维基媒体网站上的破坏行为;
- 防止立即可能发生的严重人身伤害或死亡,或为保护我们的组织、雇员、承包商、用户或公众;或
- 检测、防止或以其它方式评估并解决潜在的滥发垃圾邮件、病毒、欺诈、滥用、不法行为及安全或技术疑虑。
审计和改进
基金会致力于持续评估和改进此指引,并定期审计确认此类改进。当我们更改现行规则和系统时,将更新此指引以反映我们做法的变化。
新系统设计
为支持此数据保留周期及我们的总体隐私政策,基金会投入使用的新工具和系统将把隐私纳入设计考量。包括:
- 在设计过程中要求纳入此数据保留指引;
- 设计和开发过程中的法律咨询;及
- 代码审查流程中纳入隐私考量。
仍在进行中的新信息处理
我们尽管在设计和部署新系统时尽到了最大努力,但仍可能偶尔以不符合此指引的方式记录个人信息。我们若发现此等疏忽,我们将及时对信息执行删除、汇总或去标识化处理以遵守此指引。
联系我们
如果您认为以上指引可能被人钻了漏洞,或者您对遵守指引有疑问或意见,请通过privacywikimedia.org联系我们。