Wikimedia Foundation Data Retention Guidelines
Johdanto
Tieto on tärkeää. Se on yksi tavoista, joilla voimme oppia ja kasvaa organisaationa ja liikkeenä, ja jonka avulla voimme tehdä projekteista parempia heille, jotka käyttävät niitä luomiseen, oppimiseen ja jakamiseen. Samalla olemme sitoutuneet pitämään henkilötietosi "lyhimmän mahdollisen ajan, joka on yhteneväinen Wikimedia-sivustojen ylläpidon, ymmärtämisen ja parantamisen, sekä soveltuvien Yhdysvaltain lakien, kanssa" (lainaus Wikimedia-säätiön Tietosuojakäytännöstä).
Tämä dokumentti auttaa selittämään, miten me täytämme tämän sitoumuksen, kuvaamalla ohjeistuksiamme tiedon säilyttämisestä, järjestelmän suunnittelusta, sekä jatkuvasta auditoinnista ja ylläpidosta. Näiden ohjeistusten on tarkoitus olla elävä dokumentti — niitä päivitetään ajan myötä kuvastamaan ajankohtaisia säilytyskäytäntöjä.
Mitä dataa nämä ohjeet koskevat?
Nämä ohjeet koskevat kaikkea Wikimedia-sivustoilta keräämämme ei-julkista dataa, joka määritellään Tietosuojakäytännössä ja Muiden kuin wikisivustojen tietosuojakäytännössä. Lahjoittajien tietosuojakäytäntö sisältää erilliset datan säilyttämisohjeet, jotka koskevat lahjoittajien tietoja.
Kuinka kauan säilytämme ei-julkista dataa?
Jos toisin ei ole mainittu, säilytämme seuraavia datatyyppejä enintään seuraavat ajat:
Datan tyyppi | Alkuperä | Esimerkit | Maksimisäilytysaika |
---|---|---|---|
Ei-julkiset henkilötiedot | Kerätty käyttäjältä automaattisesti |
|
Enintään 90 päivän päästä se poistetaan, aggregoidaan tai de-identifioidaan. |
Tilin asetukset |
|
Kunnes käyttäjä poistaa/muuttaa tilin asetuksia. | |
Muut kuin henkilötiedot | Kerätty käyttäjältä automaattisesti |
|
Ikuisesti |
|
Enintään 90 päivän päästä se poistetaan, aggregoidaan tai de-identifioidaan. | ||
Käyttäjän antamat |
|
Enintään 90 päivän jälkeen se poistetaan, aggregoidaan tai de-identifioidaan. | |
Käyttäjän antamat |
|
Kunnes käyttäjä poistaa/muuttaa tilin asetuksia. | |
Tiliin liittymättömät ei-henkilökohtaiset tiedot.[T 1] | Kerätty erilaisilta käyttäjiltä automaattisesti |
|
Ikuisesti |
Lukijoiden selailemat artikkelit | Kerätty lukijalta automaattisesti |
|
Enintään 90 päivän päästä, jos säilytetty lainkaan, vain aggregoidussa muodossa. |
- ↑ Tässä taulukossa "käyttäjätili" tarkoittaa käyttäjänimeä, käyttäjätunnistetta tai IP-osoitetta; "lukija" tarkoittaa Wikimedia-projektissa kävijää.
Kuinka kauan säilytämme julkista dataa?
Wikimedia ylläpitää Wikipediaa ja muita projekteja osana missiotamme kerätä, dokumentoida ja jakaa vapaasti maailmalle inhimillisen tietämyksen summaa. Sen mukaisesti, kun annat panoksesi millä tahansa Wikimedia-sivustolla, mukaan lukien käyttäjä- ja keskustelusivut, sinä luot pysyvän, julkisen tallenteen kaikesta sisällöstä, jota lisäät, poistat tai muutat. Sivuhistoria näyttää, milloin muokkauksesi tai poistosi on tehty, kuten myös käyttäjänimesi (jos olet kirjautuneena sisään) tai IP-osoitteesi (jos et ole kirjautuneena sisään). Saatamme käyttää julkisia muokkauksiasi joko yhdistettynä muiden julkisten muokkausten kanssa tai yksinään luodaksemme uusia toimintoja tai dataan liittyviä tuotteita sinulle, tai oppiaksemme lisää siitä, miten Wikimedia-sivustoja käytetään. Jos olet erehdyksessä liittänyt henkilötietojasi Wikimedia-sivustolla tekemässäsi toimenpiteessä ja haluaisit ne poistettavan, lue ohjeistusta kyseisen yhteisön häivytyskäytännöstä. Ota huomioon, että sivustojemme historioiden läpinäkyvyys ja eheys ovat olennaisia missiollemme, ja Säätiö tukee yhteisöjen oikeutta hylätä häivytyspyyntöjä projektien suojelun vuoksi.
Jos päätät rekisteröidä tilin Wikimedia-projekteissa, sinua pyydetään valitsemaan käyttäjänimi. Käyttäjänimet säilytetään, kunnes käyttäjä pyytää tilin uudelleennimeämistä tai käy läpi yhteisön katoamisprosessin.
Katso lisätietoja Tietosuojakäytännöstämme.
Määritelmät
Näissä ohjeissa:
- "Henkilötiedot" tarkoittavat sinun meille antamaasi tai meidän sinusta keräämäämme tietoa, joka identifioi tai jota voidaan käyttää identifioimaan sinut. Tarkempaa tietoa saat Wikimedia-säätiön Tietosuojakäytännöstä ja Muiden kuin wikisivustojen tietosuojakäytännöstä.
- Esimerkkeihin "julkisista tiedoista" voi sisältyä:
- (a) IP-osoitteesi, kun muokkaat kirjautumatta sisään;
- (b) sukupuolesi, jos olet valinnut sen käyttäjäprofiilissasi;
- (c) mikä tahansa henkilötieto, jonka kerrot julkisesti Wikimedia-sivustoilla, kuten oikea nimesi tai ikäsi.
- Joitakin esimerkkejä tietotyypeistä, joita pidetään "ei-julkisina tietoina":
- (a) IP-osoitteesi, jos muokkaat sisäänkirjautuneena;
- (b) sähköpostiosoitteesi, jos olet sen antanut rekisteröidessäsi tilin (mutta et ole julkaissut sitä); ja
- (c) IP-osoitteestasi pääteltävissä oleva summittainen sijantitietosi, jos et ole julkaissut sitä.
Tietosuojakäytännössämme selitetään tarkemmin, minkätyyppistä tietoa pidetään "ei-julkisena".
- Tieto on "de-identifioitu", kun se on aggregoitu tai säilytetty muulla tavalla niin, että sitä ei enää voida käyttää tunnistamaan käyttäjää.
- Tieto on "aggregoitu", kun tiettyyn käyttäjään liittyvä tieto on yhdistetty muiden käyttäjien tietojen kanssa esittämään yleisiä trendejä tai arvoja identifioimatta yksittäisiä käyttäjiä.
Esimerkki siitä miten tietoa voidaan aggregoida:
- Käyttämällä arvovälejä tiettyjen lukuarvojen sijaan, kuten kirjaamalla "1-10 muokkaajaa kielellä X maassa Y" sen sijaan, että kirjattaisiin muokkaajia olevan neljä.
Terms that are not defined in this document have the same meaning given to them in the Privacy Policy.
Poikkeukset näihin ohjeistuksiin
Jos teemme näihin ohjeistuksiin poikkeuksia, ilmoitamme niistä yhteisölle kuvailemalla poikkeukset tällä sivulla.
- Dataa saatetaan säilyttää järjestelmän varmuuskopioissa pidempiä aikoja, enintään 5 vuotta.
- Kun toteutamme kyselyn tai tutkimuksen, annamme sinulle tietosuojalausunnon, jossa eritellään osallistumisestasi kerätyt tiedot (mukaan lukien henkilötiedot). Joissakin tapauksissa tietoa saatetaan säilyttää määräämättömän ajan koulutukseen, kehittämiseen tai muuhun vastaavantyyppiseen liittyvään tarkoitukseen, ellei kyseisessä tietosuojalausunnossa toisin ilmaista. Sellaista tietoa saatetaan säilyttää raa'assa, aggregoidussa tai de-identifioidussa muodossa, kunnes saamme osallistujalta pyynnön poistaa tiedot.
- Research related to COVID-19: The Wikimedia Foundation Research team is conducting research regarding COVID-19 and its impact on Wikipedia. Retaining de-identified readership data from COVID-19 related articles will enable us to better understand how to prioritize content creation, to understand what happens to readership when there is a "shock to the system", and to empower the research community to answer such questions. By "COVID-19 related articles", we mean articles that link to the COVID-19, SARS-CoV-2 and 2019-2020 COVID-19 pandemic Wikidata items. For comparison purposes, we will retain data from a small number of articles unrelated to COVID-19 as well. In order to collect sufficient data, and obtain a picture of readership as time passes, we will be retaining this de-identified data beyond the 90-day retention limit, for a period of one year, ending on March 1, 2021. (Note that this includes a one-month extension due to staffing changes, in order to allow for the project's completion.). For technical details about the sampling and de-identification process, please see the project page on GitHub.
- Editing research: There is a short-term extension applying to data collected as part of experimental features to improve replying on talk pages. In order to collect and analyze sufficient data, this data must be kept beyond the standard 90-day period. The retained data will be deleted, aggregated, or de-identified within 180 days.
- Campaign landing pages: for certain events, campaigns, or marketing channels, users may create accounts on special landing pages. After creating their account on those pages, the association between their account and its source may be retained indefinitely, both to provide a good user experience for that account and for longitudinal analysis on campaign effectiveness. For more information, contact mmillerwikimedia.org.
- CampaignEvents extension: An exception exists for data collected by the CampaignEvents extension. The extension collects the global user IDs of event organizers and event participants, as well as which events users organized or attended and when participants registered for an event. In order for the extension features to work consistently, data collected by the CampaignEvents extension may be retained indefinitely.
- Sound logo contest: There is a short-term extension applying to data collected as part of contest entries to allow the brand studios team to evaluate entries in preparation for announcing the winner in February 2023. The retained data will be deleted, aggregated or de-identified within 90 days after the winner is announced.
- Webrequest datasets: There is a short, one-time extension for data from the wmf.webrequest and wmf.pageview_actor datasets. This data needs to be retained longer than usual while we correct an error in the way unique devices are calculated from the dataset. Accurate unique device statistics are necessary for engineering purposes and legal reporting requirements. The underlying data used to calculate these statistics will be retained for an extra 30 days beyond the ordinary 90-day deletion period. After 30 days, the affected data will be purged and retention settings will reset back to 90 days.
- Harvinaisissa tapauksissa me tai tietyt käyttäjät, joilla on tiettyjä Tietosuojakäytännössämme kuvailtuja ylläpidollisia oikeuksia, voivat tarvita säilyttää henkilötietojasi, mukaan lukien IP-osoitteesi ja selaimen tunnistetiedot niin kauan kuin on kohtuullisesti tarpeen (mikä voi olla pidempään kuin yllä olevassa taulukossa kuvaillaan) seuraaviin tarkoituksiin:
- valvomaan tai tutkimaan mahdollisia rikkomuksia liittyen Käyttöehtoihin, tähän Tietosuojakäytäntöön tai muihin Säätiön tai käyttäjäyhteisöjen käytäntöihin;
- investigate and defend ourselves against legal threats or actions;
- auttamaan vandalismilta ja väärinkäytöltä suojautumisessa, vastustamaan käyttäjien häiriköintiä ja yleisesti minimoimaan häiritsevää käyttäytymistä Wikimedian sivustoilla;
- estämään välitöntä ja vakavaa väkivaltaa tai henkilön kuoleman, tai suojelemaan organisaatiotamme, sen työntekijöitä, alihankkijoita, käyttäjiä tai yleisöä; tai
- havaitsemaan, estämään ja muulla tavoin arvioimaan ja käsittelemään mahdollista spammia, haittaohjelmia, petoksia, väärinkäytöksiä, laitonta toimintaa sekä turvallisuus- ja teknisiä huolenaiheita.
Tarkastukset ja parannukset
The Foundation is committed to continuous evaluation and improvement of these guidelines, and to periodic audits in order to identify such improvements. As we make changes to existing and systems, we will update these guidelines to reflect our changing practices.
Design of new systems
In order to support these data retention periods and our overall privacy policy, new tools and systems implemented by the Foundation will be designed with privacy in mind. This will include:
- inclusion of these data retention guidelines as requirements during the design process;
- legal consultation during the design and development process; and
- inclusion of privacy considerations in the code review process.
Ongoing handling of new information
Despite our best efforts in designing and deploying new systems, we may occasionally record personal information in a way that does not comply with these guidelines. When we discover such an oversight, we will promptly comply with the guidelines by deleting, aggregating, or de-identifying the information as appropriate.
Ota yhteyttä
If you think that these guidelines have potentially been breached, or if you have questions or comments about compliance with the guidelines, please contact us at privacywikimedia.org.