DSS data tools presentation

Author

Holger Döring and Wolfgang Zenk-Möltgen

Modified

November 6, 2023

Overview

https://hdigital.github.io/dss-presentation_data-tools/

Notes and code snippets for the DSS data tools presentation on 9. Nov. 2023 by Holger and Wolfgang.

This is our recently archived work we use as examples.

ColStudies – Wolfgang

ESS linking – Holger

The Allbus 2021 is an example of the GESIS Archive, da|ra, DataCite workflow.

Explore DOI APIs

A DOI url redirects you to a page of the record.

https://doi.org/10.5281/zenodo.8360298

You can also use the url to get structured data by specifiying a different header.

import requests

doi_url = "https://doi.org/10.5281/zenodo.8360298"

Formatted text citation

headers = {"accept": "text/x-bibliography"}
r = requests.get(doi_url, headers=headers)

r.text
'Zenk-Möltgen, W. (2023). <i>ColStudies: A web-frontend to Colectica API to register DOIs with da|ra</i> (Version v0.3) [Computer software]. Zenodo. https://doi.org/10.5281/ZENODO.8360298'

Citeproc JSON

headers = {"accept": "application/vnd.citationstyles.csl+json"}

r = requests.get(doi_url, headers=headers)

r.json()
{'type': 'book',
 'id': 'https://doi.org/10.5281/zenodo.8360298',
 'categories': ['DDI, da|ra'],
 'author': [{'family': 'Zenk-Möltgen', 'given': 'Wolfgang'}],
 'issued': {'date-parts': [[2023, 9, 19]]},
 'abstract': 'Basic ColStudies application, connect to Colectica repository, view studies, register DOIs with da|ra.',
 'DOI': '10.5281/ZENODO.8360298',
 'publisher': 'Zenodo',
 'title': 'ColStudies: A web-frontend to Colectica API to register DOIs with da|ra',
 'URL': 'https://zenodo.org/record/8360298',
 'copyright': 'MIT License',
 'version': 'v0.3'}
r = requests.get("https://doi.org/10.4232/1.14002", headers=headers)

r.json()
{'type': 'dataset',
 'id': 'https://doi.org/10.4232/1.14002',
 'language': 'de',
 'author': [{'literal': 'GESIS-Leibniz-Institut Für Sozialwissenschaften'}],
 'contributor': [{'family': 'Westle', 'given': 'Bettina'},
  {'family': 'Auspurg', 'given': 'Katrin'},
  {'family': 'Bühler', 'given': 'Christoph'},
  {'family': 'Hadjar', 'given': 'Andreas'},
  {'family': 'Hillmert', 'given': 'Steffen'},
  {'family': 'Rosar', 'given': 'Ulrich'},
  {'family': 'Wagner', 'given': 'Ulrich'},
  {'literal': 'Kantar Public, Munich'}],
 'issued': {'date-parts': [[2022]]},
 'abstract': 'Die Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) ist eine Trenderhebung, in der seit 1980 alle zwei Jahre eine Zufallsstichprobe der deutschen Bevölkerung befragt wird. Das primäre Ziel des Umfrageprogramms ist die Beobachtung von Einstellungen, Verhalten und sozialen Wandel in Deutschland. Jede ALLBUS-Querschnittserhebung besteht aus ein oder zwei Schwerpunktmodulen zu wechselnden Themen. Diese werden ergänzt durch weitere inhaltliche Fragen und ein Kernmodul mit detaillierten demografischen Informationen. Zudem werden Zusatzinformation zum Interview und den Interviewern bereitgestellt. Die Schwerpunktmodule folgen in der Regel einem 10-jährigen Replikationszyklus, viele Einzelindikatoren und Itembatterien werden aber auch in kürzeren Abständen repliziert. Das Schwerpunktmodul von ALLBUS 2021 befasst sich mit abweichendem Verhalten und Sanktionen. Weiterer Schwerpunkt der Erhebung war die Replikation von Fragen aus einem breiten Themenspektrum. Repliziert wurden u.a. Fragen zu Politik, sozialer Ungleichheit, Geschlechterrollen, Mediennutzung und Gesundheit. ALLBUS 2021 wurde erstmals in einem selbstadministrierten Mixed-Mode Design durchgeführt (MAIL (postalischer Selbstausfüller) und CAWI (Computer-Assisted Web Interview)). Themen: 1.) Mediennutzung:Dauer und Häufigkeit der Fernsehnutzung, Nutzungshäufigkeit von Nachrichtensendungen privater und öffentlich-rechtlicher Fernsehanbieter, Häufigkeit der Lektüre von Tageszeitungen pro Woche, Häufigkeit der Lektüre von Büchern / eBooks, Internetnutzung: Häufigkeit und Geräte, Häufigkeit der Nutzung sozialer Medien für Nachrichten und Politik, Glaubwürdigkeit verschiedener Informationsquellen beim Thema Kriminalität und öffentliche Sicherheit. 2.) Soziale Ungleichheit: Subjektive Schichteinstufung, gerechter Anteil am Lebensstandard, Zugangschancenungleichheit Bildung, Einstellungen zur sozialen Ungleichheit und zum Wohlfahrtsstaat. 3.) Ethnozentrismus und Minoritäten: Einstellungen zum Zuzug verschiedener Personengruppen, Einstellungen zu Ausländern, Kontakte zu Ausländern, antisemitische Vorurteile und Stereotype, Islamophobie, wahrgenommene Risiken und Chancen durch Flüchtlinge. 4.) Familie und Geschlechterrollen: Einstellung zur Erwerbstätigkeit von Vätern und Müttern, Arbeitsteilung mit Partner (Haushalt, Kinder), Erziehungsziele. 5.) Wertorientierungen: Arbeitsorientierungen, Einstellung zu Schwangerschaftsabbruch, Postmaterialismus (Wichtigkeit von Ruhe und Ordnung, Bürgereinfluss, Inflationsbekämpfung und freier Meinungsäußerung). 6.) Politische Einstellungen: Stolz, ein Deutscher zu sein; Vertrauen in öffentliche Einrichtungen und Organisationen: (Gesundheitswesen, Bundesverfassungsgericht, Bundestag, Stadt- und Gemeindeverwaltung, Kirchen, Justiz, Fernsehen, Zeitungswesen, Universitäten, Bundesregierung, Polizei, Parteien, Europäische Kommission, Europäisches Parlament); Verbundenheit mit Gemeinde, Bundesrepublik, EU; Steuersenkung oder Sozialleistungen, Einstellung zur Ausweitung oder Kürzung von Sozialleistungen, perzipierte Stärke von Konflikten zwischen gesellschaftlichen Gruppen, politisches Interesse, Selbsteinstufung auf einem Links-Rechts-Kontinuum, Zufriedenheit mit der Demokratie in Deutschland, Wahlabsicht (Sonntagsfrage). 7.) Abweichendes Verhalten und Sanktionen: Beurteilung der Strafpraxis von Gerichten, Kriminalitätsentwicklung, moralische Bewertung von Verhaltensweisen, deliktspezifisches Sanktionsbedürfnis (Punitivität), Wunsch nach gesetzlichem Verbot (verhaltensspezifisch), Einstellung zur Todesstrafe, selbstberichtete Delinquenz (Vergangenheit, Zukunft), wahrgenommene Entdeckungswahrscheinlichkeit, Viktimisierung (Diebstahl, Straftat), Norm Gesetzstreue, Senkung von Kriminalität durch harte Strafen (Abschreckung), Strafzwecke, Selbstkontrolle (Grasmick), Kriminalitätsfurcht, Sicherheitsgefühl in Wohnumgebung. 8.) Gesundheit: Subjektive Einschätzung des Gesundheitszustands, gesundheitliche Einschränkungen letzte 4 Wochen, Pandemien und Rechte des Staates. 9.) Religion: Religiöse Selbsteinstufung, Konfession, Häufigkeit Kirchgang / Besuch Gotteshaus. 10.) Sonstiges: Beurteilung der derzeitigen und zukünftigen Wirtschaftslage in Deutschland, Beurteilung der eigenen derzeitigen und zukünftigen wirtschaftlichen Situation, sozialer Pessimismus und Zukunftsorientierung (Anomia), interpersonales Vertrauen, subjektive Lebenszufriedenheit. 11.) ALLBUS-Demographie: Angaben zur befragten Person: Geburtsmonat, Geburtsjahr, Alter, Geschlecht, Familienstand, Staatsbürgerschaft (Nationalität), Anzahl der Staatsbürgerschaften, Herkunft, allgemeiner Schulabschluss, berufliche Ausbildung, Erwerbsstatus, Angaben zum gegenwärtigen bzw. früheren Beruf, Zugehörigkeit zum öffentlichen Dienst, wöchentliche Arbeitsdauer (Haupt- und Nebenerwerb), berufliche Aufsichtsfunktion, Furcht vor Verlust des Arbeitsplatzes, Dauer von Arbeitslosigkeit, Status der Nichterwerbstätigkeit, Zeitpunkt der Aufgabe hauptberuflicher Erwerbstätigkeit, jetzige oder frühere Gewerkschaftsmitgliedschaft, Mitgliedschaft in einer politischen Partei, monatliches Nettoeinkommen.Wohnort (Bundesland, politische Gemeindegröße, BIK-Stadtregion), Wohndauer in Deutschland, Wohndauer am Wohnort, Wohnstatus, Entfernung zum vorherigen Wohnort, Mobilitätsbereitschaft. Angaben zum Ehepartner: Geburtsmonat, Geburtsjahr, Alter, allgemeiner Schulabschluss, berufliche Ausbildung, Erwerbstätigkeit (incl. Nichterwerbsstatus), Angaben zum gegenwärtigen Beruf, Zugehörigkeit zum öffentlichen Dienst. Angaben zum nichtehelichen Lebenspartner: Geburtsmonat, Geburtsjahr, Alter, allgemeiner Schulabschluss, berufliche Ausbildung, Erwerbstätigkeit (incl. Nichterwerbsstatus), Angaben zum gegenwärtigen Beruf, Zugehörigkeit zum öffentlichen Dienst, gemeinsamer Haushalt mit befragter Person. Angaben zu den Eltern: Herkunftsland, Zusammenleben mit Eltern im Alter von 15 Jahren, allgemeiner Schulabschluss, berufliche Ausbildung, Angaben zum Beruf. Haushaltsbeschreibung: Haushaltsgröße, Haushaltseinkommen, Anzahl von über 17-jährigen Haushaltspersonen (reduzierte Haushaltsgröße). Angaben zu den einzelnen Haushaltspersonen (Haushaltsliste): Verwandtschaftsverhältnis zur befragten Person, Geschlecht, Geburtsmonat, Geburtsjahr, Alter, Familienstand. Angaben zu Kindern außerhalb des Haushalts: Zahl der Kinder außer Haus, Geschlecht, Geburtsjahr, Alter. 12.) Daten zum Interview (Paradaten): Studiennummer, Digital Object Identifier, Release, Identifikationsnummer des Befragten, Nummer des Samplepoints, Erhebungsmodus ALLBUS-Hauptbefragung, Zahl der Kontaktversuche, Anteil beantworteter Fragen, Datum Interviewbeginn und –ende, Interviewdauer, Anwesenheit weiterer Personen während des Interviews, Eingriff anderer Personen in die Beantwortung des Fragebogens, Unterbrechung der Bearbeitung des Fragebogens. 13.) Ergänzungen und abgeleitete Variablen: Postmaterialismus-Index (nach Inglehart), Berufsvercodung gemäß ISCO (International Standard Classification of Occupations) 1988 und 2008, SIOPS (nach Ganzeboom), ISEI (nach Ganzeboom), Sozioökonomische Gruppe (ESeG), ISCED (International Standard Classification of Education) 1997 und 2011, Lebensformen und Familiensituation, Transformationsgewicht für Auswertungen auf Haushaltsebene, Ost-West-Gewicht für gesamtdeutsche Auswertungen.',
 'DOI': '10.4232/1.14002',
 'publisher': 'GESIS',
 'title': 'Allgemeine Bevölkerungsumfrage der Sozialwissenschaften ALLBUS 2021',
 'URL': 'https://search.gesis.org/research_data/ZA5280?doi=10.4232/1.14002',
 'copyright': 'Alle im GESIS DBK veröffentlichten Metadaten sind frei verfügbar unter den Creative Commons CC0 1.0 Universal Public Domain Dedication. GESIS bittet jedoch darum, dass Sie alle Metadatenquellen anerkennen und sie nennen, etwa die Datengeber oder jeglichen Aggregator, inklusive GESIS selbst. Für weitere Informationen siehe https://dbk.gesis.org/dbksearch/guidelines.asp?db=d',
 'version': '2.0.0'}

Crosscite DOI APIs

https://citation.crosscite.org/docs.html#sec-4

“Currently three DOI registration agencies have implemented content negotation for their DOIs: Crossref, DataCite and mEDRA. They support a number of metadata content types, some of which are common to the three RAs.”

  • Formatted text citation // text/x-bibliography
  • BibTeX // application/x-bibtex
  • RIS // application/x-research-info-systems
  • Citeproc JSON // application/vnd.citationstyles.csl+json
  • Schema.org in JSON-LD // application/vnd.schemaorg.ld+json (only DataCite)
import time
import requests

CONTENT_TYPES = {
    "bibliography": "text/x-bibliography",
    "bibtex": "application/x-bibtex",
    "ris": "application/x-research-info-systems",
    "json-csl": "application/vnd.citationstyles.csl+json",
    "json-schema": "application/vnd.schemaorg.ld+json",
}


def get_doi_data(doi, content_type="bibliography"):
    """Return metadata for DOI."""

    url = f"https://doi.org/{doi}"
    headers = {"accept": CONTENT_TYPES[content_type]}

    return requests.get(url, headers=headers)


doi = "10.5281/zenodo.8421232"

for key in CONTENT_TYPES:
    time.sleep(2)  # pause to avoid requests limit
    doi_request = get_doi_data(doi, key)
    print(f"## DOI content type: {key}\n\n{doi_request.text}\n\n")
## DOI content type: bibliography

Bederke, P., &amp; Döring, H. (2023). <i>Linking European Social Survey (ESS) party information</i> (Version v0.1) [Computer software]. Zenodo. https://doi.org/10.5281/ZENODO.8421232


## DOI content type: bibtex

@misc{https://doi.org/10.5281/zenodo.8421232,
  doi = {10.5281/ZENODO.8421232},
  url = {https://zenodo.org/doi/10.5281/zenodo.8421232},
  author = {Bederke, Paul and Döring, Holger},
  keywords = {comparative politics, data management, survey data, voting behavior, expert surveys, validation},
  title = {Linking European Social Survey (ESS) party information},
  publisher = {Zenodo},
  year = {2023},
  copyright = {MIT License}
}



## DOI content type: ris

TY  - COMP
T1  - Linking European Social Survey (ESS) party information
AU  - Bederke, Paul
AU  - Döring, Holger
DO  - 10.5281/ZENODO.8421232
UR  - https://zenodo.org/doi/10.5281/zenodo.8421232
AB  - R code for linking European Social Survey (ESS) party information from Rounds 1–10 with social science datasets through Party Facts.
Two examples for linking ESS parties with the Chapel Hill Expert Survey (CHES) and the Parliament and Government Database (ParlGov) are provided in notebooks.
These examples are presented in a website at hdigital.github.io/ess-linking.
KW  - comparative politics
KW  - data management
KW  - survey data
KW  - voting behavior
KW  - expert surveys
KW  - validation
PY  - 2023
PB  - Zenodo
ER  - 


## DOI content type: json-csl

{
  "type": "book",
  "id": "https://doi.org/10.5281/zenodo.8421232",
  "categories": [
    "comparative politics",
    "data management",
    "survey data",
    "voting behavior",
    "expert surveys",
    "validation"
  ],
  "author": [
    {
      "family": "Bederke",
      "given": "Paul"
    },
    {
      "family": "Döring",
      "given": "Holger"
    }
  ],
  "issued": {
    "date-parts": [
      [
        2023,
        10,
        9
      ]
    ]
  },
  "abstract": "R code for linking European Social Survey (ESS) party information from Rounds 1–10 with social science datasets through Party Facts.\nTwo examples for linking ESS parties with the Chapel Hill Expert Survey (CHES) and the Parliament and Government Database (ParlGov) are provided in notebooks.\nThese examples are presented in a website at hdigital.github.io/ess-linking.",
  "DOI": "10.5281/ZENODO.8421232",
  "publisher": "Zenodo",
  "title": "Linking European Social Survey (ESS) party information",
  "URL": "https://zenodo.org/doi/10.5281/zenodo.8421232",
  "copyright": "MIT License",
  "version": "v0.1"
}


## DOI content type: json-schema

{
  "@context": "http://schema.org",
  "@type": "SoftwareSourceCode",
  "@id": "https://doi.org/10.5281/zenodo.8421232",
  "url": "https://zenodo.org/doi/10.5281/zenodo.8421232",
  "additionalType": "",
  "name": "Linking European Social Survey (ESS) party information",
  "author": [
    {
      "name": "Paul Bederke",
      "givenName": "Paul",
      "familyName": "Bederke",
      "affiliation": {
        "@type": "Organization",
        "name": "University of Konstanz, Germany"
      },
      "@type": "Person",
      "@id": "0000-0001-7555-8656"
    },
    {
      "name": "Holger Döring",
      "givenName": "Holger",
      "familyName": "Döring",
      "affiliation": {
        "@type": "Organization",
        "@id": "https://ror.org/018afyw53",
        "name": "GESIS - Leibniz-Institute for the Social Sciences"
      },
      "@type": "Person",
      "@id": "0000-0002-6616-8805"
    }
  ],
  "description": "R code for linking European Social Survey (ESS) party information from Rounds 1–10 with social science datasets through Party Facts.\nTwo examples for linking ESS parties with the Chapel Hill Expert Survey (CHES) and the Parliament and Government Database (ParlGov) are provided in notebooks.\nThese examples are presented in a website at hdigital.github.io/ess-linking.",
  "license": "https://opensource.org/licenses/MIT",
  "version": "v0.1",
  "keywords": "comparative politics, data management, survey data, voting behavior, expert surveys, validation",
  "datePublished": "2023-10-09",
  "@reverse": {
    "isBasedOn": {
      "@type": "ScholarlyArticle",
      "identifier": {
        "@type": "PropertyValue",
        "propertyID": "URL",
        "value": "https://github.com/hdigital/ess-linking/tree/v0.1"
      }
    }
  },
  "schemaVersion": "http://datacite.org/schema/kernel-4",
  "publisher": {
    "@type": "Organization",
    "name": "Zenodo"
  },
  "provider": {
    "@type": "Organization",
    "name": "datacite"
  }
}

DataCite API

https://support.datacite.org/docs/api-get-doi

Zenodo record

Zenodo uses DataCite for DOI registration.

Let’s briefly explore the DataCite API.

doi = "10.5281/zenodo.8360298"
r = requests.get(f"https://api.datacite.org/dois/{doi}")
r.json()
{'data': {'id': '10.5281/zenodo.8360298',
  'type': 'dois',
  'attributes': {'doi': '10.5281/zenodo.8360298',
   'prefix': '10.5281',
   'suffix': 'zenodo.8360298',
   'identifiers': [{'identifier': 'https://zenodo.org/record/8360299',
     'identifierType': 'URL'}],
   'alternateIdentifiers': [{'alternateIdentifierType': 'URL',
     'alternateIdentifier': 'https://zenodo.org/record/8360299'}],
   'creators': [{'name': 'Zenk-Möltgen, Wolfgang',
     'nameType': 'Personal',
     'givenName': 'Wolfgang',
     'familyName': 'Zenk-Möltgen',
     'affiliation': ['GESIS'],
     'nameIdentifiers': []}],
   'titles': [{'title': 'ColStudies: A web-frontend to Colectica API to register DOIs with da|ra'}],
   'publisher': 'Zenodo',
   'container': {},
   'publicationYear': 2023,
   'subjects': [{'subject': 'DDI, da|ra'}],
   'contributors': [],
   'dates': [{'date': '2023-09-19', 'dateType': 'Issued'}],
   'language': None,
   'types': {'ris': 'COMP',
    'bibtex': 'misc',
    'citeproc': 'article',
    'schemaOrg': 'SoftwareSourceCode',
    'resourceTypeGeneral': 'Software'},
   'relatedIdentifiers': [{'relationType': 'IsSupplementTo',
     'relatedIdentifier': 'https://github.com/moeltgen/ColStudies/tree/v0.3',
     'relatedIdentifierType': 'URL'},
    {'relationType': 'HasVersion',
     'relatedIdentifier': '10.5281/zenodo.8360299',
     'relatedIdentifierType': 'DOI'}],
   'relatedItems': [],
   'sizes': [],
   'formats': [],
   'version': 'v0.3',
   'rightsList': [{'rights': 'MIT License',
     'rightsUri': 'https://opensource.org/licenses/MIT',
     'schemeUri': 'https://spdx.org/licenses/',
     'rightsIdentifier': 'mit',
     'rightsIdentifierScheme': 'SPDX'},
    {'rights': 'Open Access',
     'rightsUri': 'info:eu-repo/semantics/openAccess'}],
   'descriptions': [{'description': 'Basic ColStudies application, connect to Colectica repository, view studies, register DOIs with da|ra.',
     'descriptionType': 'Abstract'}],
   'geoLocations': [],
   'fundingReferences': [],
   'xml': 'PD94bWwgdmVyc2lvbj0iMS4wIiBlbmNvZGluZz0idXRmLTgiPz4KPHJlc291cmNlIHhtbG5zOnhzaT0iaHR0cDovL3d3dy53My5vcmcvMjAwMS9YTUxTY2hlbWEtaW5zdGFuY2UiIHhtbG5zPSJodHRwOi8vZGF0YWNpdGUub3JnL3NjaGVtYS9rZXJuZWwtNCIgeHNpOnNjaGVtYUxvY2F0aW9uPSJodHRwOi8vZGF0YWNpdGUub3JnL3NjaGVtYS9rZXJuZWwtNCBodHRwOi8vc2NoZW1hLmRhdGFjaXRlLm9yZy9tZXRhL2tlcm5lbC00LjEvbWV0YWRhdGEueHNkIj4KICA8aWRlbnRpZmllciBpZGVudGlmaWVyVHlwZT0iRE9JIj4xMC41MjgxL1pFTk9ETy44MzYwMjk4PC9pZGVudGlmaWVyPgogIDxjcmVhdG9ycz4KICAgIDxjcmVhdG9yPgogICAgICA8Y3JlYXRvck5hbWU+V29sZmdhbmcgWmVuay1Nw7ZsdGdlbjwvY3JlYXRvck5hbWU+CiAgICAgIDxhZmZpbGlhdGlvbj5HRVNJUzwvYWZmaWxpYXRpb24+CiAgICA8L2NyZWF0b3I+CiAgPC9jcmVhdG9ycz4KICA8dGl0bGVzPgogICAgPHRpdGxlPkNvbFN0dWRpZXM6IEEgd2ViLWZyb250ZW5kIHRvIENvbGVjdGljYSBBUEkgdG8gcmVnaXN0ZXIgRE9JcyB3aXRoIGRhfHJhPC90aXRsZT4KICA8L3RpdGxlcz4KICA8cHVibGlzaGVyPlplbm9kbzwvcHVibGlzaGVyPgogIDxwdWJsaWNhdGlvblllYXI+MjAyMzwvcHVibGljYXRpb25ZZWFyPgogIDxzdWJqZWN0cz4KICAgIDxzdWJqZWN0PkRESSwgZGF8cmE8L3N1YmplY3Q+CiAgPC9zdWJqZWN0cz4KICA8ZGF0ZXM+CiAgICA8ZGF0ZSBkYXRlVHlwZT0iSXNzdWVkIj4yMDIzLTA5LTE5PC9kYXRlPgogIDwvZGF0ZXM+CiAgPHJlc291cmNlVHlwZSByZXNvdXJjZVR5cGVHZW5lcmFsPSJTb2Z0d2FyZSIvPgogIDxhbHRlcm5hdGVJZGVudGlmaWVycz4KICAgIDxhbHRlcm5hdGVJZGVudGlmaWVyIGFsdGVybmF0ZUlkZW50aWZpZXJUeXBlPSJ1cmwiPmh0dHBzOi8vemVub2RvLm9yZy9yZWNvcmQvODM2MDI5OTwvYWx0ZXJuYXRlSWRlbnRpZmllcj4KICA8L2FsdGVybmF0ZUlkZW50aWZpZXJzPgogIDxyZWxhdGVkSWRlbnRpZmllcnM+CiAgICA8cmVsYXRlZElkZW50aWZpZXIgcmVsYXRlZElkZW50aWZpZXJUeXBlPSJVUkwiIHJlbGF0aW9uVHlwZT0iSXNTdXBwbGVtZW50VG8iPmh0dHBzOi8vZ2l0aHViLmNvbS9tb2VsdGdlbi9Db2xTdHVkaWVzL3RyZWUvdjAuMzwvcmVsYXRlZElkZW50aWZpZXI+CiAgICA8cmVsYXRlZElkZW50aWZpZXIgcmVsYXRlZElkZW50aWZpZXJUeXBlPSJET0kiIHJlbGF0aW9uVHlwZT0iSGFzVmVyc2lvbiI+MTAuNTI4MS96ZW5vZG8uODM2MDI5OTwvcmVsYXRlZElkZW50aWZpZXI+CiAgPC9yZWxhdGVkSWRlbnRpZmllcnM+CiAgPHZlcnNpb24+djAuMzwvdmVyc2lvbj4KICA8cmlnaHRzTGlzdD4KICAgIDxyaWdodHMgcmlnaHRzVVJJPSJodHRwczovL29wZW5zb3VyY2Uub3JnL2xpY2Vuc2VzL01JVCI+TUlUIExpY2Vuc2U8L3JpZ2h0cz4KICAgIDxyaWdodHMgcmlnaHRzVVJJPSJpbmZvOmV1LXJlcG8vc2VtYW50aWNzL29wZW5BY2Nlc3MiPk9wZW4gQWNjZXNzPC9yaWdodHM+CiAgPC9yaWdodHNMaXN0PgogIDxkZXNjcmlwdGlvbnM+CiAgICA8ZGVzY3JpcHRpb24gZGVzY3JpcHRpb25UeXBlPSJBYnN0cmFjdCI+Jmx0O3AmZ3Q7QmFzaWMgQ29sU3R1ZGllcyBhcHBsaWNhdGlvbiwgY29ubmVjdCB0byBDb2xlY3RpY2EgcmVwb3NpdG9yeSwgdmlldyBzdHVkaWVzLCByZWdpc3RlciBET0lzIHdpdGggZGF8cmEuJmx0Oy9wJmd0OzwvZGVzY3JpcHRpb24+CiAgPC9kZXNjcmlwdGlvbnM+CjwvcmVzb3VyY2U+',
   'url': 'https://zenodo.org/record/8360298',
   'contentUrl': None,
   'metadataVersion': 2,
   'schemaVersion': 'http://datacite.org/schema/kernel-4',
   'source': 'mds',
   'isActive': True,
   'state': 'findable',
   'reason': None,
   'viewCount': 0,
   'viewsOverTime': [],
   'downloadCount': 0,
   'downloadsOverTime': [],
   'referenceCount': 0,
   'citationCount': 1,
   'citationsOverTime': [{'year': '2023', 'total': 1}],
   'partCount': 0,
   'partOfCount': 0,
   'versionCount': 1,
   'versionOfCount': 0,
   'created': '2023-09-19T15:15:25.000Z',
   'registered': '2023-09-19T15:15:26.000Z',
   'published': '2023',
   'updated': '2023-09-19T15:28:57.000Z'},
  'relationships': {'client': {'data': {'id': 'cern.zenodo',
     'type': 'clients'}},
   'provider': {'data': {'id': 'cern', 'type': 'providers'}},
   'media': {'data': {'id': '10.5281/zenodo.8360298', 'type': 'media'}},
   'references': {'data': []},
   'citations': {'data': []},
   'parts': {'data': []},
   'partOf': {'data': []},
   'versions': {'data': [{'id': '10.5281/zenodo.8360299', 'type': 'dois'}]},
   'versionOf': {'data': []}}}}

A dataset registered with DataCite through da|ra.

doi = "10.4232/1.14002"
r = requests.get(f"https://api.datacite.org/dois/{doi}")
r.json()
{'data': {'id': '10.4232/1.14002',
  'type': 'dois',
  'attributes': {'doi': '10.4232/1.14002',
   'prefix': '10.4232',
   'suffix': '1.14002',
   'identifiers': [{'identifier': 'ZA5280', 'identifierType': 'ZA-No.'},
    {'identifier': 'ALLBUS', 'identifierType': 'FDZ'}],
   'alternateIdentifiers': [{'alternateIdentifierType': 'ZA-No.',
     'alternateIdentifier': 'ZA5280'},
    {'alternateIdentifierType': 'FDZ', 'alternateIdentifier': 'ALLBUS'}],
   'creators': [{'name': 'GESIS-Leibniz-Institut Für Sozialwissenschaften',
     'nameType': 'Organizational',
     'affiliation': [],
     'nameIdentifiers': []}],
   'titles': [{'lang': 'de',
     'title': 'Allgemeine Bevölkerungsumfrage der Sozialwissenschaften ALLBUS 2021'},
    {'lang': 'en',
     'title': 'ALLBUS/GGSS 2021 (Allgemeine Bevölkerungsumfrage der Sozialwissenschaften/German General Social Survey 2021)'}],
   'publisher': 'GESIS',
   'container': {},
   'publicationYear': 2022,
   'subjects': [],
   'contributors': [{'name': 'Westle, Bettina',
     'nameType': 'Personal',
     'givenName': 'Bettina',
     'familyName': 'Westle',
     'affiliation': ['Universität Marburg'],
     'contributorType': 'Researcher',
     'nameIdentifiers': []},
    {'name': 'Auspurg, Katrin',
     'nameType': 'Personal',
     'givenName': 'Katrin',
     'familyName': 'Auspurg',
     'affiliation': ['LMU München'],
     'contributorType': 'Researcher',
     'nameIdentifiers': []},
    {'name': 'Bühler, Christoph',
     'nameType': 'Personal',
     'givenName': 'Christoph',
     'familyName': 'Bühler',
     'affiliation': ['Universität Hannover'],
     'contributorType': 'Researcher',
     'nameIdentifiers': []},
    {'name': 'Hadjar, Andreas',
     'nameType': 'Personal',
     'givenName': 'Andreas',
     'familyName': 'Hadjar',
     'affiliation': ['Universität Luxemburg'],
     'contributorType': 'Researcher',
     'nameIdentifiers': []},
    {'name': 'Hillmert, Steffen',
     'nameType': 'Personal',
     'givenName': 'Steffen',
     'familyName': 'Hillmert',
     'affiliation': ['Universität Tübingen'],
     'contributorType': 'Researcher',
     'nameIdentifiers': []},
    {'name': 'Rosar, Ulrich',
     'nameType': 'Personal',
     'givenName': 'Ulrich',
     'familyName': 'Rosar',
     'affiliation': ['Universität Düsseldorf'],
     'contributorType': 'Researcher',
     'nameIdentifiers': []},
    {'name': 'Wagner, Ulrich',
     'nameType': 'Personal',
     'givenName': 'Ulrich',
     'familyName': 'Wagner',
     'affiliation': ['Universität Marburg'],
     'contributorType': 'Researcher',
     'nameIdentifiers': []},
    {'name': 'Kantar Public, Munich',
     'nameType': 'Organizational',
     'affiliation': [],
     'contributorType': 'DataCollector',
     'nameIdentifiers': []}],
   'dates': [{'date': '2021-06/2021-08', 'dateType': 'Collected'},
    {'date': '2022', 'dateType': 'Issued'}],
   'language': 'de',
   'types': {'ris': 'DATA',
    'bibtex': 'misc',
    'citeproc': 'dataset',
    'schemaOrg': 'Dataset',
    'resourceType': 'NumerischNumeric',
    'resourceTypeGeneral': 'Dataset'},
   'relatedIdentifiers': [{'relationType': 'IsNewVersionOf',
     'relatedIdentifier': '10.4232/1.13954',
     'relatedIdentifierType': 'DOI'}],
   'relatedItems': [],
   'sizes': [],
   'formats': [],
   'version': '2.0.0',
   'rightsList': [{'lang': 'de',
     'rights': 'Alle im GESIS DBK veröffentlichten Metadaten sind frei verfügbar unter den Creative Commons CC0 1.0 Universal Public Domain Dedication. GESIS bittet jedoch darum, dass Sie alle Metadatenquellen anerkennen und sie nennen, etwa die Datengeber oder jeglichen Aggregator, inklusive GESIS selbst. Für weitere Informationen siehe https://dbk.gesis.org/dbksearch/guidelines.asp?db=d'},
    {'lang': 'en',
     'rights': 'All metadata from GESIS DBK are available free of restriction under the Creative Commons CC0 1.0 Universal Public Domain Dedication. However, GESIS requests that you actively acknowledge and give attribution to all metadata sources, such as the data providers and any data aggregators, including GESIS. For further information see https://dbk.gesis.org/dbksearch/guidelines.asp'}],
   'descriptions': [{'lang': 'de',
     'description': 'Die Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) ist eine Trenderhebung, in der seit 1980 alle zwei Jahre eine Zufallsstichprobe der deutschen Bevölkerung befragt wird. Das primäre Ziel des Umfrageprogramms ist die Beobachtung von Einstellungen, Verhalten und sozialen Wandel in Deutschland. Jede ALLBUS-Querschnittserhebung besteht aus ein oder zwei Schwerpunktmodulen zu wechselnden Themen. Diese werden ergänzt durch weitere inhaltliche Fragen und ein Kernmodul mit detaillierten demografischen Informationen. Zudem werden Zusatzinformation zum Interview und den Interviewern bereitgestellt. Die Schwerpunktmodule folgen in der Regel einem 10-jährigen Replikationszyklus, viele Einzelindikatoren und Itembatterien werden aber auch in kürzeren Abständen repliziert. Das Schwerpunktmodul von ALLBUS 2021 befasst sich mit abweichendem Verhalten und Sanktionen. Weiterer Schwerpunkt der Erhebung war die Replikation von Fragen aus einem breiten Themenspektrum. Repliziert wurden u.a. Fragen zu Politik, sozialer Ungleichheit, Geschlechterrollen, Mediennutzung und Gesundheit. ALLBUS 2021 wurde erstmals in einem selbstadministrierten Mixed-Mode Design durchgeführt (MAIL (postalischer Selbstausfüller) und CAWI (Computer-Assisted Web Interview)). Themen: 1.) Mediennutzung:Dauer und Häufigkeit der Fernsehnutzung, Nutzungshäufigkeit von Nachrichtensendungen privater und öffentlich-rechtlicher Fernsehanbieter, Häufigkeit der Lektüre von Tageszeitungen pro Woche, Häufigkeit der Lektüre von Büchern / eBooks, Internetnutzung: Häufigkeit und Geräte, Häufigkeit der Nutzung sozialer Medien für Nachrichten und Politik, Glaubwürdigkeit verschiedener Informationsquellen beim Thema Kriminalität und öffentliche Sicherheit. 2.) Soziale Ungleichheit: Subjektive Schichteinstufung, gerechter Anteil am Lebensstandard, Zugangschancenungleichheit Bildung, Einstellungen zur sozialen Ungleichheit und zum Wohlfahrtsstaat. 3.) Ethnozentrismus und Minoritäten: Einstellungen zum Zuzug verschiedener Personengruppen, Einstellungen zu Ausländern, Kontakte zu Ausländern, antisemitische Vorurteile und Stereotype, Islamophobie, wahrgenommene Risiken und Chancen durch Flüchtlinge. 4.) Familie und Geschlechterrollen: Einstellung zur Erwerbstätigkeit von Vätern und Müttern, Arbeitsteilung mit Partner (Haushalt, Kinder), Erziehungsziele. 5.) Wertorientierungen: Arbeitsorientierungen, Einstellung zu Schwangerschaftsabbruch, Postmaterialismus (Wichtigkeit von Ruhe und Ordnung, Bürgereinfluss, Inflationsbekämpfung und freier Meinungsäußerung). 6.) Politische Einstellungen: Stolz, ein Deutscher zu sein; Vertrauen in öffentliche Einrichtungen und Organisationen: (Gesundheitswesen, Bundesverfassungsgericht, Bundestag, Stadt- und Gemeindeverwaltung, Kirchen, Justiz, Fernsehen, Zeitungswesen, Universitäten, Bundesregierung, Polizei, Parteien, Europäische Kommission, Europäisches Parlament); Verbundenheit mit Gemeinde, Bundesrepublik, EU; Steuersenkung oder Sozialleistungen, Einstellung zur Ausweitung oder Kürzung von Sozialleistungen, perzipierte Stärke von Konflikten zwischen gesellschaftlichen Gruppen, politisches Interesse, Selbsteinstufung auf einem Links-Rechts-Kontinuum, Zufriedenheit mit der Demokratie in Deutschland, Wahlabsicht (Sonntagsfrage). 7.) Abweichendes Verhalten und Sanktionen: Beurteilung der Strafpraxis von Gerichten, Kriminalitätsentwicklung, moralische Bewertung von Verhaltensweisen, deliktspezifisches Sanktionsbedürfnis (Punitivität), Wunsch nach gesetzlichem Verbot (verhaltensspezifisch), Einstellung zur Todesstrafe, selbstberichtete Delinquenz (Vergangenheit, Zukunft), wahrgenommene Entdeckungswahrscheinlichkeit, Viktimisierung (Diebstahl, Straftat), Norm Gesetzstreue, Senkung von Kriminalität durch harte Strafen (Abschreckung), Strafzwecke, Selbstkontrolle (Grasmick), Kriminalitätsfurcht, Sicherheitsgefühl in Wohnumgebung. 8.) Gesundheit: Subjektive Einschätzung des Gesundheitszustands, gesundheitliche Einschränkungen letzte 4 Wochen, Pandemien und Rechte des Staates. 9.) Religion: Religiöse Selbsteinstufung, Konfession, Häufigkeit Kirchgang / Besuch Gotteshaus. 10.) Sonstiges: Beurteilung der derzeitigen und zukünftigen Wirtschaftslage in Deutschland, Beurteilung der eigenen derzeitigen und zukünftigen wirtschaftlichen Situation, sozialer Pessimismus und Zukunftsorientierung (Anomia), interpersonales Vertrauen, subjektive Lebenszufriedenheit. 11.) ALLBUS-Demographie: Angaben zur befragten Person: Geburtsmonat, Geburtsjahr, Alter, Geschlecht, Familienstand, Staatsbürgerschaft (Nationalität), Anzahl der Staatsbürgerschaften, Herkunft, allgemeiner Schulabschluss, berufliche Ausbildung, Erwerbsstatus, Angaben zum gegenwärtigen bzw. früheren Beruf, Zugehörigkeit zum öffentlichen Dienst, wöchentliche Arbeitsdauer (Haupt- und Nebenerwerb), berufliche Aufsichtsfunktion, Furcht vor Verlust des Arbeitsplatzes, Dauer von Arbeitslosigkeit, Status der Nichterwerbstätigkeit, Zeitpunkt der Aufgabe hauptberuflicher Erwerbstätigkeit, jetzige oder frühere Gewerkschaftsmitgliedschaft, Mitgliedschaft in einer politischen Partei, monatliches Nettoeinkommen.Wohnort (Bundesland, politische Gemeindegröße, BIK-Stadtregion), Wohndauer in Deutschland, Wohndauer am Wohnort, Wohnstatus, Entfernung zum vorherigen Wohnort, Mobilitätsbereitschaft. Angaben zum Ehepartner: Geburtsmonat, Geburtsjahr, Alter, allgemeiner Schulabschluss, berufliche Ausbildung, Erwerbstätigkeit (incl. Nichterwerbsstatus), Angaben zum gegenwärtigen Beruf, Zugehörigkeit zum öffentlichen Dienst. Angaben zum nichtehelichen Lebenspartner: Geburtsmonat, Geburtsjahr, Alter, allgemeiner Schulabschluss, berufliche Ausbildung, Erwerbstätigkeit (incl. Nichterwerbsstatus), Angaben zum gegenwärtigen Beruf, Zugehörigkeit zum öffentlichen Dienst, gemeinsamer Haushalt mit befragter Person. Angaben zu den Eltern: Herkunftsland, Zusammenleben mit Eltern im Alter von 15 Jahren, allgemeiner Schulabschluss, berufliche Ausbildung, Angaben zum Beruf. Haushaltsbeschreibung: Haushaltsgröße, Haushaltseinkommen, Anzahl von über 17-jährigen Haushaltspersonen (reduzierte Haushaltsgröße). Angaben zu den einzelnen Haushaltspersonen (Haushaltsliste): Verwandtschaftsverhältnis zur befragten Person, Geschlecht, Geburtsmonat, Geburtsjahr, Alter, Familienstand. Angaben zu Kindern außerhalb des Haushalts: Zahl der Kinder außer Haus, Geschlecht, Geburtsjahr, Alter. 12.) Daten zum Interview (Paradaten): Studiennummer, Digital Object Identifier, Release, Identifikationsnummer des Befragten, Nummer des Samplepoints, Erhebungsmodus ALLBUS-Hauptbefragung, Zahl der Kontaktversuche, Anteil beantworteter Fragen, Datum Interviewbeginn und –ende, Interviewdauer, Anwesenheit weiterer Personen während des Interviews, Eingriff anderer Personen in die Beantwortung des Fragebogens, Unterbrechung der Bearbeitung des Fragebogens. 13.) Ergänzungen und abgeleitete Variablen: Postmaterialismus-Index (nach Inglehart), Berufsvercodung gemäß ISCO (International Standard Classification of Occupations) 1988 und 2008, SIOPS (nach Ganzeboom), ISEI (nach Ganzeboom), Sozioökonomische Gruppe (ESeG), ISCED (International Standard Classification of Education) 1997 und 2011, Lebensformen und Familiensituation, Transformationsgewicht für Auswertungen auf Haushaltsebene, Ost-West-Gewicht für gesamtdeutsche Auswertungen.',
     'descriptionType': 'Abstract'},
    {'lang': 'en',
     'description': 'ALLBUS (GGSS - the German General Social Survey) is a biennial trend survey based on random samples of the German population. Established in 1980, its mission is to monitor attitudes, behavior, and social change in Germany. Each ALLBUS cross-sectional survey consists of one or two main question modules covering changing topics, a range of supplementary questions and a core module providing detailed demographic information. Additionally, data on the interview and the interviewers are provided as well. Key topics generally follow a 10-year replication cycle, many individual indicators and item batteries are replicated at shorter intervals. The main question module of ALLBUS/GGSS 2021 focuses on deviant behavior and sanctions. Another focus of the survey was the replication of questions from a broad range of topics. This included questions on politics and political attitudes, social inequality, gender roles, media use, and health. In contrast to the previous surveys in the ALLBUS series, ALLBUS 2021 was conducted in a self-administered mixed-mode design (MAIL (postal self-completion) and CAWI (computer-assisted web interview)). Topics 1.) Use of media: Frequency and average total time of watching tv, frequency of watching news programs on public and commercial tv, frequency of reading a daily newspaper per week, frequency of reading books / e-books; internet use: frequency and type of device, frequency of using social media for political information, trustworthiness of different news sources with regard to crime and public safety. 2.) Social Inequality: Self-assessment of social class, fair share in standard of living, assessment of access to education, attitudes towards social inequality and the welfare state. 3.) Ethnocentrism and minorities: Attitude towards the influx of various groups of immigrants, attitudes towards the foreigners living in Germany, contacts with foreigners, antisemitic stereotypes and prejudices, attitudes towards Islam (Islamophobia), perceived risks and chances with respect to refugees. 4.) Family and gender roles: Attitudes towards working fathers and mothers, division of labor regarding house and family work., importance of educational goals. 5.) Values: Work orientations, attitudes towards legalizing abortion, materialism / postmaterialism (importance of law and order, fighting rising prices, free expression of opinions and influence on governmental decisions). 6.) Political attitudes: Pride in being a German, confidence in public institutions and organizations (public health service, federal constitutional court, federal parliament (Bundestag), city or municipal administration, churches, judiciary, television, newspapers, universities, federal government, the police, political parties, European Commission, European Parliament); identification with own community, the Federal Republic of Germany and the EU, preference for lower taxes or more social spending, stance on extension or reduction in social services, perceived strength of conflicts between social groups, political interest, self-placement on left-right continuum, satisfaction with democracy in Germany, voting intention (Sonntagsfrage). 7.) Deviant behavior and sanctions: Assessment of adequacy of court judgments, development of crime rate, moral assessment of deviant acts, crime-specific desire for sanctions (punitivity), desire to prohibit specific behaviors, attitude towards the death penalty, self-reported deviant behavior (past and future), perceived probability of being caught committing various crimes, own victimisation (theft, any crime), respect of the law (norm), deterring crime through punishment, purpose of punishment, self-control (Grasmick), fear of crime, feeling of safety in living environment. 8.) Health: Self-assessment of overall health, physical and psychological shape during the last four weeks, acceptance of state powers to control epidemics. 9.) Religion: Self-assessment of religiousness, denomination, frequency of church attendance / attending a house of God. 10.) Other topics: Assessment of the present and future economic situation in Germany, assessment of present and future personal economic situation, social pessimism and orientation towards the future (anomia), interpersonal trust, reciprocity, authoritarianism, overall life satisfaction. 11.) ALLBUS-Demography: Details about the respondent: month and year of birth, age, gender, marital status, citizenship (nationality), number of citizenships, geographical origin, school education, vocational training, employment status, details about current or former occupation, affiliation to public service, working hours per week (primary and secondary job), supervisory functions, fear of unemployment, length of unemployment, status of non-employment, date of termination of full-time employment, current or former membership in a trade union, membership in a political party, respondent´s income. Place of residence (federal state, size of municipality, BIK-type of region), duration of residence (in Germany and at current place of residence), mobility. Details about respondent´s current spouse: month and year of birth, age, school education, vocational training, employment status, details about current occupation, affiliation to public service, fear of unemployment, status of non-employment. Details about respondent´s steady partner: month and year of birth, age, school education, vocational training, employment status, details about current occupation, affiliation to public service, fear of unemployment, status of non-employment, common household with respondent. Details about respondent´s parents: country of origin, cohabitation with respondent as adolescent, school education of mother and father, vocational training of mother and father, details about both parents´ occupation. Description of household: size of household, household income, number of persons older than 17 in household (reduced size of household). Details about household members: family relation to respondent, gender, month and year of birth, age, marital status. Details about children not living in the household: number of children not living in the household, gender, year of birth, age. 12.) Data on the interview (paradata): Study number, digital object identifier, release, respondent id, ID of sample point, mode of data collection, number of contacts, percentage of questions completed, date of beginning and end of interview, duration of interview, presence of other persons during the interview, interference of other persons in the course of the interview, pauses during completion of survey. 13.) Added value: Inglehart-Index, International Standard Classification of Occupations (ISCO) 1988 and 2008; Standard International Occupational Prestige Scale (SIOPS, according to Ganzeboom), International Socio-economic Index of Occupational Status (ISEI, according to Ganzeboom), European Socio-Economic Groups (ESeG), International Standard Classification of Education (ISCED) 1997 and 2011, forms of cohabitation and family situation, transformation weight for analyses on household level, east-west design weight.',
     'descriptionType': 'Abstract'},
    {'lang': 'en',
     'description': 'Self-administered questionnaire: Paper',
     'descriptionType': 'Methods'},
    {'lang': 'en',
     'description': 'Self-administered questionnaire: Web-based',
     'descriptionType': 'Methods'},
    {'lang': 'de',
     'description': 'ALLBUS 2021 wurde erstmals in einem selbstadministrierten Mixed-Mode Design durchgeführt (MAIL (postalischer Selbstausfüller) und CAWI (Computer-asisted Web Interview)). Unterschiedliche Erhebungsmodi werden von unterschiedlichen Teilpopulationen bevorzugt, so auch im ALLBUS 2021. Um diese Selbstselektion in die Erhebungsmodi zu berücksichtigen, wird bei inhaltlichen Analysen empfohlen die Fälle aus beiden Modi gemeinsam auszuwerten.',
     'descriptionType': 'Methods'},
    {'lang': 'en',
     'description': 'ALLBUS/GGSS 2021 was conducted as a mixed-mode survey. The target persons had the choice between the two modes MAIL and CAWI. Different survey modes are preferred by different subpopulations, as was the case in ALLBUS/GGSS 2021. To account for this self-selection, it is strongly recommended that the cases from both modes be analyzed together.',
     'descriptionType': 'Methods'},
    {'lang': 'de',
     'description': 'Personen (Deutsche und Ausländer), die zum Befragungszeitpunkt in Privathaushalten lebten und vor dem 01.01.2003 geboren sind.',
     'descriptionType': 'Methods'},
    {'lang': 'en',
     'description': 'All persons (German and non-German) who resided in private households and were born before 1 January 2003.',
     'descriptionType': 'Methods'},
    {'lang': 'de',
     'description': 'Wahrscheinlichkeitsauswahl: Disproportional geschichtete Zufallsauswahl; Wahrscheinlichkeitsauswahl: Mehrstufige Zufallsauswahl; Auswahlverfahren Kommentar: Zweistufige, disproportional geschichtete Zufallsauswahl in Westdeutschland (inkl. West-Berlin) und Ostdeutschland (inkl. Ost-Berlin). In der ersten Auswahlstufe wurden Gemeinden in Westdeutschland und in Ostdeutschland mit einer Wahrscheinlichkeit proportional zur Zahl ihrer erwachsenen Einwohner ausgewählt. In der zweiten Auswahlstufe wurden Personen aus den Einwohnermeldekarteien zufällig gezogen. Zielpersonen mit nicht hinreichend guten Deutschkenntnissen zählen zu den systematischen Ausfällen.',
     'descriptionType': 'Methods'}],
   'geoLocations': [{'geoLocationPlace': 'Germany'}],
   'fundingReferences': [],
   'xml': '',
   'url': 'https://search.gesis.org/research_data/ZA5280?doi=10.4232/1.14002',
   'contentUrl': None,
   'metadataVersion': 4,
   'schemaVersion': 'http://datacite.org/schema/kernel-4',
   'source': 'fabricaForm',
   'isActive': True,
   'state': 'findable',
   'reason': None,
   'viewCount': 0,
   'viewsOverTime': [],
   'downloadCount': 0,
   'downloadsOverTime': [],
   'referenceCount': 0,
   'citationCount': 1,
   'citationsOverTime': [{'year': '2023', 'total': 1}],
   'partCount': 0,
   'partOfCount': 0,
   'versionCount': 0,
   'versionOfCount': 0,
   'created': '2022-09-26T14:06:23.000Z',
   'registered': '2022-09-26T14:06:23.000Z',
   'published': '2022',
   'updated': '2023-04-26T19:00:44.000Z'},
  'relationships': {'client': {'data': {'id': 'gesis.gesis',
     'type': 'clients'}},
   'provider': {'data': {'id': 'vzek', 'type': 'providers'}},
   'media': {'data': {'id': '10.4232/1.14002', 'type': 'media'}},
   'references': {'data': []},
   'citations': {'data': [{'id': '10.1111/pops.12892', 'type': 'dois'}]},
   'parts': {'data': []},
   'partOf': {'data': []},
   'versions': {'data': []},
   'versionOf': {'data': []}}}}

GESIS data

We can access GESIS data through the DataCite API by providing the provider-id and client-id.

You can explore and try parameters at https://support.datacite.org/reference/get_dois

url = "https://api.datacite.org/dois"
headers = {"accept": "application/vnd.api+json"}
params = {
    "provider-id": "gesis",
    "client-id": "gesis.gesis",
    "page[size]": 5,
    "sort": "-updated",
}

r = requests.get(url, headers=headers, params=params)

gesis_data = r.json()
[record["id"] for record in gesis_data["data"]]
['10.4232/1.6138',
 '10.4232/1.11922',
 '10.4232/1.6195',
 '10.4232/1.14184',
 '10.7802/2618']
gesis_data["meta"]["total"]
9447
gesis_data["meta"]["resourceTypes"]
[{'id': 'dataset', 'title': 'Dataset', 'count': 9010},
 {'id': 'text', 'title': 'Text', 'count': 436},
 {'id': 'other', 'title': 'Other', 'count': 1}]

Zenodo API

Zenodo has an API to access and deposit research outputs.

https://developers.zenodo.org/#rest-api

Record

We start by accessing a Zenodo record through the Zenodo API.

https://developers.zenodo.org/#retrieve37

r = requests.get("https://zenodo.org/api/records/8360299")

r.json()
{'created': '2023-09-19T15:15:22.704918+00:00',
 'modified': '2023-09-20T14:27:05.762099+00:00',
 'id': 8360299,
 'conceptrecid': '8360298',
 'doi': '10.5281/zenodo.8360299',
 'conceptdoi': '10.5281/zenodo.8360298',
 'doi_url': 'https://doi.org/10.5281/zenodo.8360299',
 'metadata': {'title': 'ColStudies: A web-frontend to Colectica API to register DOIs with da|ra',
  'doi': '10.5281/zenodo.8360299',
  'publication_date': '2023-09-19',
  'description': '<p>Basic ColStudies application, connect to Colectica repository, view studies, register DOIs with da|ra.</p>',
  'access_right': 'open',
  'creators': [{'name': 'Wolfgang Zenk-Möltgen', 'affiliation': 'GESIS'}],
  'keywords': ['DDI, da|ra'],
  'related_identifiers': [{'identifier': 'https://github.com/moeltgen/ColStudies/tree/v0.3',
    'relation': 'isSupplementTo',
    'scheme': 'url'}],
  'version': 'v0.3',
  'resource_type': {'title': 'Software', 'type': 'software'},
  'license': {'id': 'mit-license'},
  'relations': {'version': [{'index': 0,
     'is_last': True,
     'parent': {'pid_type': 'recid', 'pid_value': '8360298'}}]}},
 'title': 'ColStudies: A web-frontend to Colectica API to register DOIs with da|ra',
 'links': {'self': 'https://zenodo.org/api/records/8360299',
  'self_html': 'https://zenodo.org/records/8360299',
  'self_doi': 'https://zenodo.org/doi/10.5281/zenodo.8360299',
  'doi': 'https://doi.org/10.5281/zenodo.8360299',
  'parent': 'https://zenodo.org/api/records/8360298',
  'parent_html': 'https://zenodo.org/records/8360298',
  'parent_doi': 'https://zenodo.org/doi/10.5281/zenodo.8360298',
  'self_iiif_manifest': 'https://zenodo.org/api/iiif/record:8360299/manifest',
  'self_iiif_sequence': 'https://zenodo.org/api/iiif/record:8360299/sequence/default',
  'files': 'https://zenodo.org/api/records/8360299/files',
  'media_files': 'https://zenodo.org/api/records/8360299/media-files',
  'archive': 'https://zenodo.org/api/records/8360299/files-archive',
  'archive_media': 'https://zenodo.org/api/records/8360299/media-files-archive',
  'latest': 'https://zenodo.org/api/records/8360299/versions/latest',
  'latest_html': 'https://zenodo.org/records/8360299/latest',
  'draft': 'https://zenodo.org/api/records/8360299/draft',
  'versions': 'https://zenodo.org/api/records/8360299/versions',
  'access_links': 'https://zenodo.org/api/records/8360299/access/links',
  'access_users': 'https://zenodo.org/api/records/8360299/access/users',
  'access_request': 'https://zenodo.org/api/records/8360299/access/request',
  'access': 'https://zenodo.org/api/records/8360299/access',
  'reserve_doi': 'https://zenodo.org/api/records/8360299/draft/pids/doi',
  'communities': 'https://zenodo.org/api/records/8360299/communities',
  'communities-suggestions': 'https://zenodo.org/api/records/8360299/communities-suggestions',
  'requests': 'https://zenodo.org/api/records/8360299/requests'},
 'updated': '2023-09-20T14:27:05.762099+00:00',
 'recid': '8360299',
 'revision': 5,
 'files': [{'id': 'eb31bd1f-8bf9-47b9-8c44-84b895a19501',
   'key': 'moeltgen/ColStudies-v0.3.zip',
   'size': 27443,
   'checksum': 'md5:cf4dd6c6160cc7a15779dd25c133a596',
   'links': {'self': 'https://zenodo.org/api/records/8360299/files/moeltgen/ColStudies-v0.3.zip/content'}}],
 'owners': [{'id': 367396}],
 'status': 'published',
 'stats': {'downloads': 1,
  'unique_downloads': 1,
  'views': 17,
  'unique_views': 12,
  'version_downloads': 1,
  'version_unique_downloads': 1,
  'version_unique_views': 12,
  'version_views': 17},
 'state': 'done',
 'submitted': True}

API key

A Zenodo API key is needed to access most of the REST API.

Read API key from a local .env not in Git repository with python-decouple

import os
from decouple import Config, RepositoryEnv

config = Config(RepositoryEnv("/workspaces/dss-presentation_data-tools/.env"))

ACCESS_TOKEN = config("ZENODO_API_KEY")

Depositions

https://developers.zenodo.org/#retrieve

Show that the Zenodo API key is needed to access depositions.

r = requests.get(
    "https://zenodo.org/api/deposit/depositions",
    params={"access_token": "no Zenodo access token provided"},
)
r.json()
{'status': 403, 'message': 'Permission denied.'}

Get depositions for API key holder.

r = requests.get(
    "https://zenodo.org/api/deposit/depositions", params={"access_token": ACCESS_TOKEN}
)
r.status_code
200
depositions = r.json()

len(depositions)
3
depositions
[{'created': '2023-11-01T11:31:01.496048+00:00',
  'modified': '2023-11-03T09:03:45.386507+00:00',
  'id': 10061174,
  'conceptrecid': '10061173',
  'doi': '10.5281/zenodo.10061174',
  'conceptdoi': '10.5281/zenodo.10061173',
  'doi_url': 'https://doi.org/10.5281/zenodo.10061174',
  'metadata': {'title': 'Harmonizing and linking party information: The ESS as an example of complex data linking',
   'doi': '10.5281/zenodo.10061174',
   'publication_date': '2023-10-09',
   'description': '<p>Combining party information from multiple sources is a work-intensive challenge for quantitative studies of political representation. Differences in the definition of political parties and difficult data structures can make linking party information across datasets challenging. The European Social Survey (ESS) is an example of a prominent data source in political science research whose party information is particularly difficult to work with. Here, we demonstrate how Party Facts, an online infrastructure for combining party information, can be used to link different social science datasets and assess the performance of the linking process. In this article, we discuss the difficulties of complex linking tasks and show how the ESS can be combined with other sources. We have updated the database to include appropriate links for the recent Round 10 of the ESS and provide two examples of complex linking by combining the ESS with the Chapel Hill Expert Survey (CHES) and with the Parliament and Government Database (ParlGov).</p>',
   'access_right': 'open',
   'creators': [{'name': 'Bederke, Paul',
     'affiliation': 'University of Konstanz'},
    {'name': 'Döring, Holger',
     'affiliation': 'GESIS - Leibniz-Institute for the Social Sciences'}],
   'related_identifiers': [{'identifier': '10.5281/zenodo.8421233',
     'relation': 'isSupplementedBy',
     'resource_type': 'software',
     'scheme': 'doi'}],
   'license': 'cc-by-4.0',
   'imprint_publisher': 'Zenodo',
   'upload_type': 'publication',
   'publication_type': 'preprint',
   'prereserve_doi': {'doi': '10.5281/zenodo.10061174', 'recid': 10061174}},
  'title': 'Harmonizing and linking party information: The ESS as an example of complex data linking',
  'links': {'self': 'https://zenodo.org/api/records/10061174',
   'html': 'https://zenodo.org/records/10061174',
   'doi': 'https://doi.org/10.5281/zenodo.10061174',
   'parent_doi': 'https://zenodo.org/doi/10.5281/zenodo.10061173',
   'badge': 'https://zenodo.org/badge/doi/10.5281%2Fzenodo.10061174.svg',
   'conceptbadge': 'https://zenodo.org/badge/doi/10.5281%2Fzenodo.10061173.svg',
   'files': 'https://zenodo.org/api/records/10061174/files',
   'latest_draft': 'https://zenodo.org/api/deposit/depositions/10061174',
   'latest_draft_html': 'https://zenodo.org/deposit/10061174',
   'publish': 'https://zenodo.org/api/deposit/depositions/10061174/actions/publish',
   'edit': 'https://zenodo.org/api/deposit/depositions/10061174/actions/edit',
   'discard': 'https://zenodo.org/api/deposit/depositions/10061174/actions/discard',
   'newversion': 'https://zenodo.org/api/deposit/depositions/10061174/actions/newversion',
   'registerconceptdoi': 'https://zenodo.org/api/deposit/depositions/10061174/actions/registerconceptdoi',
   'record': 'https://zenodo.org/api/records/10061174',
   'record_html': 'https://zenodo.org/record/10061174',
   'latest': 'https://zenodo.org/api/records/10061174/versions/latest',
   'latest_html': 'https://zenodo.org/record/10061174/versions/latest'},
  'record_id': 10061174,
  'owner': 399146,
  'files': [],
  'state': 'done',
  'submitted': True},
 {'created': '2023-10-31T18:21:09.091174+00:00',
  'modified': '2023-10-31T18:21:09.199219+00:00',
  'id': 8275697,
  'conceptrecid': '7043510',
  'doi': '10.5281/zenodo.8275697',
  'conceptdoi': '10.5281/zenodo.7043510',
  'doi_url': 'https://doi.org/10.5281/zenodo.8275697',
  'metadata': {'title': 'Party positions from Wikipedia tags (July 2023)',
   'doi': '10.5281/zenodo.8275697',
   'publication_date': '2023-08-23',
   'description': '<p>Estimation of party positions from Wikipedia tags with Stan (July 2023)</p>',
   'access_right': 'open',
   'creators': [{'name': 'Holger Döring',
     'affiliation': 'GESIS – Leibniz Institute for the Social Sciences'},
    {'name': 'Michael Herrmann', 'affiliation': 'University of Konstanz'}],
   'related_identifiers': [{'identifier': 'https://github.com/hdigital/partypositions-wikitags/tree/23.07',
     'relation': 'isSupplementTo',
     'scheme': 'url'}],
   'version': '23.07',
   'license': 'other-open',
   'imprint_publisher': 'Zenodo',
   'upload_type': 'software',
   'prereserve_doi': {'doi': '10.5281/zenodo.8275697', 'recid': 8275697}},
  'title': 'Party positions from Wikipedia tags (July 2023)',
  'links': {'self': 'https://zenodo.org/api/records/8275697',
   'html': 'https://zenodo.org/records/8275697',
   'doi': 'https://doi.org/10.5281/zenodo.8275697',
   'parent_doi': 'https://zenodo.org/doi/10.5281/zenodo.7043510',
   'badge': 'https://zenodo.org/badge/doi/10.5281%2Fzenodo.8275697.svg',
   'conceptbadge': 'https://zenodo.org/badge/doi/10.5281%2Fzenodo.7043510.svg',
   'files': 'https://zenodo.org/api/records/8275697/files',
   'latest_draft': 'https://zenodo.org/api/deposit/depositions/8275697',
   'latest_draft_html': 'https://zenodo.org/deposit/8275697',
   'publish': 'https://zenodo.org/api/deposit/depositions/8275697/actions/publish',
   'edit': 'https://zenodo.org/api/deposit/depositions/8275697/actions/edit',
   'discard': 'https://zenodo.org/api/deposit/depositions/8275697/actions/discard',
   'newversion': 'https://zenodo.org/api/deposit/depositions/8275697/actions/newversion',
   'registerconceptdoi': 'https://zenodo.org/api/deposit/depositions/8275697/actions/registerconceptdoi',
   'record': 'https://zenodo.org/api/records/8275697',
   'record_html': 'https://zenodo.org/record/8275697',
   'latest': 'https://zenodo.org/api/records/8275697/versions/latest',
   'latest_html': 'https://zenodo.org/record/8275697/versions/latest'},
  'record_id': 8275697,
  'owner': 399146,
  'files': [],
  'state': 'done',
  'submitted': True},
 {'created': '2023-10-09T11:48:42.068068+00:00',
  'modified': '2023-11-03T16:38:11.915812+00:00',
  'id': 8421233,
  'conceptrecid': '8421232',
  'doi': '10.5281/zenodo.8421233',
  'conceptdoi': '10.5281/zenodo.8421232',
  'doi_url': 'https://doi.org/10.5281/zenodo.8421233',
  'metadata': {'title': 'Linking European Social Survey (ESS) party information',
   'doi': '10.5281/zenodo.8421233',
   'publication_date': '2023-10-09',
   'description': '<p>R code for linking <a href="https://www.europeansocialsurvey.org/">European Social Survey (ESS)</a> party information from Rounds 1–10 with social science datasets through <a href="partyfacts.org">Party Facts</a>.</p><p>Two examples for linking ESS parties with the <a href="https://www.chesdata.eu/">Chapel Hill Expert Survey (CHES)</a> and the <a href="parlgov.org">Parliament and Government Database (ParlGov)</a> are provided in notebooks.</p><p>These examples are presented in a website at <a href="https://hdigital.github.io/ess-linking/">hdigital.github.io/ess-linking</a>.</p>',
   'access_right': 'open',
   'creators': [{'name': 'Bederke, Paul',
     'affiliation': 'University of Konstanz, Germany',
     'orcid': '0000-0001-7555-8656'},
    {'name': 'Döring, Holger',
     'affiliation': 'GESIS - Leibniz-Institute for the Social Sciences',
     'orcid': '0000-0002-6616-8805'}],
   'keywords': ['comparative politics',
    'data management',
    'survey data',
    'voting behavior',
    'expert surveys',
    'validation'],
   'related_identifiers': [{'identifier': 'https://github.com/hdigital/ess-linking/tree/v0.1',
     'relation': 'isSupplementTo',
     'scheme': 'url'}],
   'version': 'v0.1',
   'license': 'mit-license',
   'imprint_publisher': 'Zenodo',
   'upload_type': 'software',
   'prereserve_doi': {'doi': '10.5281/zenodo.8421233', 'recid': 8421233}},
  'title': 'Linking European Social Survey (ESS) party information',
  'links': {'self': 'https://zenodo.org/api/records/8421233',
   'html': 'https://zenodo.org/records/8421233',
   'doi': 'https://doi.org/10.5281/zenodo.8421233',
   'parent_doi': 'https://zenodo.org/doi/10.5281/zenodo.8421232',
   'badge': 'https://zenodo.org/badge/doi/10.5281%2Fzenodo.8421233.svg',
   'conceptbadge': 'https://zenodo.org/badge/doi/10.5281%2Fzenodo.8421232.svg',
   'files': 'https://zenodo.org/api/records/8421233/files',
   'latest_draft': 'https://zenodo.org/api/deposit/depositions/8421233',
   'latest_draft_html': 'https://zenodo.org/deposit/8421233',
   'publish': 'https://zenodo.org/api/deposit/depositions/8421233/actions/publish',
   'edit': 'https://zenodo.org/api/deposit/depositions/8421233/actions/edit',
   'discard': 'https://zenodo.org/api/deposit/depositions/8421233/actions/discard',
   'newversion': 'https://zenodo.org/api/deposit/depositions/8421233/actions/newversion',
   'registerconceptdoi': 'https://zenodo.org/api/deposit/depositions/8421233/actions/registerconceptdoi',
   'record': 'https://zenodo.org/api/records/8421233',
   'record_html': 'https://zenodo.org/record/8421233',
   'latest': 'https://zenodo.org/api/records/8421233/versions/latest',
   'latest_html': 'https://zenodo.org/record/8421233/versions/latest'},
  'record_id': 8421233,
  'owner': 399146,
  'files': [{'id': '2b03a282-bd30-4a15-a843-3dd59f482323',
    'filename': 'hdigital/ess-linking-v0.1.zip',
    'filesize': 3061494,
    'checksum': 'd615e35168eddbca6efb5c5fb636d1b4',
    'links': {'self': 'https://zenodo.org/api/records/8421233/files/2b03a282-bd30-4a15-a843-3dd59f482323',
     'download': 'https://zenodo.org/api/records/8421233/draft/files/hdigital/ess-linking-v0.1.zip/content'}}],
  'state': 'done',
  'submitted': True}]

GESIS records

https://developers.zenodo.org/#records

Get records

Get records for all GESIS members.

records_api_url = "https://zenodo.org/api/records"
search_query = 'creators.affiliation:("GESIS")'
params = {"q": search_query, "access_token": ACCESS_TOKEN}

r = requests.get(records_api_url, params=params)

gesis_records = r.json()
gesis_records["hits"]["hits"][0]
{'created': '2022-02-03T15:26:38.380712+00:00',
 'modified': '2022-03-04T10:58:01.633724+00:00',
 'id': 5914219,
 'conceptrecid': '5914218',
 'doi': '10.5281/zenodo.5914219',
 'conceptdoi': '10.5281/zenodo.5914218',
 'doi_url': 'https://doi.org/10.5281/zenodo.5914219',
 'metadata': {'title': 'KonsortSWD PID Registrator',
  'doi': '10.5281/zenodo.5914219',
  'publication_date': '2022-01-31',
  'description': '<p>The purpose of this software is to enable registering any object with an existing PID handle server based on the ePIC API.</p>',
  'access_right': 'open',
  'creators': [{'name': 'Zhang, Yudong', 'affiliation': 'GESIS'},
   {'name': 'Baran, Erdal', 'affiliation': 'GESIS'},
   {'name': 'Zloch, Matthäus', 'affiliation': 'GESIS'},
   {'name': 'Mühlbauer, Alexander', 'affiliation': 'GESIS'},
   {'name': 'Klas, Claus-Peter', 'affiliation': 'GESIS'},
   {'name': 'Mutschke, Peter', 'affiliation': 'GESIS'}],
  'contributors': [{'name': 'Klas, Claus-Peter',
    'affiliation': 'Gesis',
    'type': 'ProjectManager'},
   {'name': 'Mutschke, Peter',
    'affiliation': 'Gesis',
    'type': 'ProjectManager'},
   {'name': 'Zhang, Yudong', 'affiliation': 'Gesis', 'type': 'ProjectMember'},
   {'name': 'Baran, Erdal', 'affiliation': 'Gesis', 'type': 'ProjectMember'},
   {'name': 'Muehlbauer, Alex',
    'affiliation': 'Gesis',
    'type': 'ProjectMember'},
   {'name': 'Zloch, Matthäus',
    'affiliation': 'Gesis',
    'type': 'ProjectMember'}],
  'keywords': ['NFDI', 'PID', 'DOI', 'Registration', 'ePIC', 'da|ra'],
  'version': 'v0.1.0',
  'resource_type': {'title': 'Software', 'type': 'software'},
  'license': {'id': 'apache2.0'},
  'communities': [{'id': 'konsortswd'}, {'id': 'nfdi'}],
  'relations': {'version': [{'index': 0,
     'is_last': True,
     'parent': {'pid_type': 'recid', 'pid_value': '5914218'}}]}},
 'title': 'KonsortSWD PID Registrator',
 'links': {'self': 'https://zenodo.org/api/records/5914219',
  'self_html': 'https://zenodo.org/records/5914219',
  'self_doi': 'https://zenodo.org/doi/10.5281/zenodo.5914219',
  'doi': 'https://doi.org/10.5281/zenodo.5914219',
  'parent': 'https://zenodo.org/api/records/5914218',
  'parent_html': 'https://zenodo.org/records/5914218',
  'parent_doi': 'https://zenodo.org/doi/10.5281/zenodo.5914218',
  'self_iiif_manifest': 'https://zenodo.org/api/iiif/record:5914219/manifest',
  'self_iiif_sequence': 'https://zenodo.org/api/iiif/record:5914219/sequence/default',
  'files': 'https://zenodo.org/api/records/5914219/files',
  'media_files': 'https://zenodo.org/api/records/5914219/media-files',
  'archive': 'https://zenodo.org/api/records/5914219/files-archive',
  'archive_media': 'https://zenodo.org/api/records/5914219/media-files-archive',
  'latest': 'https://zenodo.org/api/records/5914219/versions/latest',
  'latest_html': 'https://zenodo.org/records/5914219/latest',
  'draft': 'https://zenodo.org/api/records/5914219/draft',
  'versions': 'https://zenodo.org/api/records/5914219/versions',
  'access_links': 'https://zenodo.org/api/records/5914219/access/links',
  'access_users': 'https://zenodo.org/api/records/5914219/access/users',
  'access_request': 'https://zenodo.org/api/records/5914219/access/request',
  'access': 'https://zenodo.org/api/records/5914219/access',
  'reserve_doi': 'https://zenodo.org/api/records/5914219/draft/pids/doi',
  'communities': 'https://zenodo.org/api/records/5914219/communities',
  'communities-suggestions': 'https://zenodo.org/api/records/5914219/communities-suggestions',
  'requests': 'https://zenodo.org/api/records/5914219/requests'},
 'updated': '2022-03-04T10:58:01.633724+00:00',
 'recid': '5914219',
 'revision': 10,
 'files': [{'id': '3ecd1aa8-992d-443d-8ba3-77277ac22a0e',
   'key': 'nfdi_pid_registrator_v0.1.0.tar',
   'size': 259584,
   'checksum': 'md5:41c5211ba7a8cf34746ca901bc3bd96c',
   'links': {'self': 'https://zenodo.org/api/records/5914219/files/nfdi_pid_registrator_v0.1.0.tar/content'}}],
 'owners': [{'id': 295671}],
 'status': 'published',
 'stats': {'downloads': 7,
  'unique_downloads': 5,
  'views': 196,
  'unique_views': 150,
  'version_downloads': 7,
  'version_unique_downloads': 5,
  'version_unique_views': 149,
  'version_views': 195},
 'state': 'done',
 'submitted': True}

Extract names

Extract creator names from records of GESIS members.

for record in gesis_records["hits"]["hits"]:
    print(f"\n## {record['doi']}\n[ {record['title']} ]")
    for creator in record["metadata"]["creators"]:
        if creator["affiliation"] and "GESIS" in creator["affiliation"]:
            print(creator["name"])

## 10.5281/zenodo.5914219
[ KonsortSWD PID Registrator ]
Zhang, Yudong
Baran, Erdal
Zloch, Matthäus
Mühlbauer, Alexander
Klas, Claus-Peter
Mutschke, Peter

## 10.5281/zenodo.259554
[ Rich metadata from the start ]
Hopt, Oliver
Klas, Claus-Peter
Mühlbauer, Alexander
Zenk-Möltgen, Wolfgang

## 10.5281/zenodo.6630263
[ Experiences with converting DDI among versions using DDI-FlatDB ]
Klas, Claus-Peter
Hopt, Oliver
Krämer, Thomas
Nugraha, Sigit

## 10.5281/zenodo.7023258
[ Umfrage zur Situation von Professor*innen an einer technischen Hochschule in Deutschland. Fragebogen (deutsche Version) ]
Geisler, Helena
Löther, Andrea
Steinweg, Nina

## 10.5281/zenodo.7024958
[ Survey on the situation of professors at a technical university in Germany. Questionnaire (English version) ]
Geisler, Helena
Löther, Andrea
Steinweg, Nina

## 10.5281/zenodo.7220636
[ UniSAFE D4.1 Final UniSAFE-Survey Questionnaire ]
Lipinsky, Anke
Schredl, Claudia
Baumann, Horst
Lomazzi, Vera
Freund, Frederike

## 10.5281/zenodo.259565
[ The Past, Present and Future of Geocoded Survey Data at the GESIS Data Archive ]
Müller, Stefan
Zenk-Möltgen, Wolfgang
Schweers, Stefan

## 10.5281/zenodo.4621051
[ Introduction to metadata initiatives of interest to CESSDA and Service Providers ]
Borschewski, Kerrin
Akdeniz, Esra
Piesch, Sophia

## 10.5281/zenodo.7143302
[ An integrated platform for comparing reference extraction toolkits and provisioning their output ]
Mayr, Philipp
Backes, Tobias
Shahid, Muhammad Ahsan

## 10.5281/zenodo.4581806
[ MS17 Open source CAT TM software selected ]
Veronika Keck
Dorothée Behr
Brita Dorer

## 10.5281/zenodo.1118382
[ Progress with the CESSDA Euro Question Bank Project ]
MahmoudHashemi, Azadeh
Mühlbauer, Alexander
Zenk-Möltgen, Wolfgang

## 10.5281/zenodo.1118391
[ Lessons Learned with Additional Mappings into DDI-FlatDB ]
Klas, Claus-Peter
Hopt, Oliver
Mühlbauer, Alexander

## 10.5281/zenodo.5180976
[ D4.9 Guidelines on the use of Translation Memories in survey translation ]
Veronika Keck
Dorothée Behr
Brita Dorer

## 10.5281/zenodo.8386418
[ Total Error Sheets for Datasets (TES-D) zur Dokumentation Digitaler Verhaltensdaten - Eine Kritische Reflektion des Datensammlungsprozesses ]
Fröhling, Leon
Sen, Indira
Soldner, Felix
Zens, Maria
Weller, Katrin

## 10.5281/zenodo.7638506
[ User Guide for the CESSDA Metadata Model version 3.0 ]
Esra Akdeniz
Kerrin Borschewski
Katrin Baum
Libby Bishop

## 10.5281/zenodo.3582020
[ CESSDA Webinar: The CESSDA EuroQuestionBank: Search, find and reuse questionnaire items from social scientific research ]
Akdeniz, Esra
Krämer, Thomas

## 10.5281/zenodo.7464990
[ European DDI Conference 2022 Training Fair: Overview of the Session ]
Bishop, Elizabeth
Zenk-Möltgen, Wolfgang

## 10.5281/zenodo.4518893
[ GDPR & Ethical Issues with Social Media Data ]
Weller, Katrin
Watteler, Oliver

## 10.5281/zenodo.1118384
[ DDI-FlatDB: Next steps ]
Klas, Claus-Peter
Hopt, Oliver

## 10.5281/zenodo.3597408
[ DDI based Questionnaire Editor ]
Klas, Claus-Peter
Hopt, Oliver

## 10.5281/zenodo.3781700
[ Data Sharing in DASISH ]
Alexia Katsanidou
Markus Quandt

## 10.5281/zenodo.3776982
[ Secure Data Solutions for Social Media Data Analysis ]
David Schiller
Katharina Kinder-Kurlanda

## 10.5281/zenodo.1118393
[ Practical Implementations of the DDILimDAS Results at the GESIS Data Archive ]
Akdeniz, Esra
Zenk-Möltgen, Wolfgang

## 10.5281/zenodo.1134531
[ Using DDI to Link Metadata in CharmStats ]
Winters, Kristi
Friedrichs, Martin

## 10.5281/zenodo.7149418
[ Handling Non-source Items in the project OUTCITE ]
Philipp Mayr
Tobias Backes

Create a list of GESIS authors and Zenodo publications.

gesis_authors = []

for record in gesis_records["hits"]["hits"]:
    for creator in record["metadata"]["creators"]:
        if creator["affiliation"] and "GESIS" in creator["affiliation"]:
            gesis_authors.append(
                {
                    "record": record["doi"],
                    "creator": creator["name"],
                    "type": record["metadata"]["resource_type"]["type"],
                }
            )
gesis_authors[:5]
[{'record': '10.5281/zenodo.5914219',
  'creator': 'Zhang, Yudong',
  'type': 'software'},
 {'record': '10.5281/zenodo.5914219',
  'creator': 'Baran, Erdal',
  'type': 'software'},
 {'record': '10.5281/zenodo.5914219',
  'creator': 'Zloch, Matthäus',
  'type': 'software'},
 {'record': '10.5281/zenodo.5914219',
  'creator': 'Mühlbauer, Alexander',
  'type': 'software'},
 {'record': '10.5281/zenodo.5914219',
  'creator': 'Klas, Claus-Peter',
  'type': 'software'}]

Analyze names

Convert list of dictionaries into a data frame with pandas.

import pandas as pd

df = pd.DataFrame(gesis_authors)

print(df)
                    record                 creator          type
0   10.5281/zenodo.5914219           Zhang, Yudong      software
1   10.5281/zenodo.5914219            Baran, Erdal      software
2   10.5281/zenodo.5914219         Zloch, Matthäus      software
3   10.5281/zenodo.5914219    Mühlbauer, Alexander      software
4   10.5281/zenodo.5914219       Klas, Claus-Peter      software
..                     ...                     ...           ...
70  10.5281/zenodo.1118393  Zenk-Möltgen, Wolfgang  presentation
71  10.5281/zenodo.1134531         Winters, Kristi        poster
72  10.5281/zenodo.1134531      Friedrichs, Martin        poster
73  10.5281/zenodo.7149418            Philipp Mayr  presentation
74  10.5281/zenodo.7149418           Tobias Backes  presentation

[75 rows x 3 columns]

Determine the number of publications per GESIS author with pandas.

(
    df.groupby("creator")
    .size()
    .reset_index(name="Count")
    .sort_values(by="Count", ascending=False)
    .head(10)
)
creator Count
19 Klas, Claus-Peter 6
45 Zenk-Möltgen, Wolfgang 5
15 Hopt, Oliver 5
29 Mühlbauer, Alexander 4
0 Akdeniz, Esra 3
14 Geisler, Helena 2
43 Weller, Katrin 2
41 Veronika Keck 2
39 Steinweg, Nina 2
20 Krämer, Thomas 2

Visualize names

Plot the number of publications per author with altair.

import altair as alt

(alt.Chart(df).mark_bar().encode(x="count():Q", y="creator:N", color="type"))

Zenodo metadata in GitHub

Zenodo imports metadata from a GitHub repository. However, some information needs to be added manually to have a full metadata record and a complete citation reference (e.g. authors full names and affiliations)

Get metadata

Here is the metadata of a record that was completed on the Zenodo page. We provide a json dump.

import json

r = requests.get("https://zenodo.org/api/records/8421233")

metadata = r.json()["metadata"]

print(json.dumps(metadata, indent=2))
{
  "title": "Linking European Social Survey (ESS) party information",
  "doi": "10.5281/zenodo.8421233",
  "publication_date": "2023-10-09",
  "description": "<p>R code for linking <a href=\"https://www.europeansocialsurvey.org/\">European Social Survey (ESS)</a> party information from Rounds 1\u201310 with social science datasets through <a href=\"partyfacts.org\">Party Facts</a>.</p><p>Two examples for linking ESS parties with the <a href=\"https://www.chesdata.eu/\">Chapel Hill Expert Survey (CHES)</a> and the <a href=\"parlgov.org\">Parliament and Government Database (ParlGov)</a> are provided in notebooks.</p><p>These examples are presented in a website at <a href=\"https://hdigital.github.io/ess-linking/\">hdigital.github.io/ess-linking</a>.</p>",
  "access_right": "open",
  "creators": [
    {
      "name": "Bederke, Paul",
      "affiliation": "University of Konstanz, Germany",
      "orcid": "0000-0001-7555-8656"
    },
    {
      "name": "D\u00f6ring, Holger",
      "affiliation": "GESIS - Leibniz-Institute for the Social Sciences",
      "orcid": "0000-0002-6616-8805"
    }
  ],
  "keywords": [
    "comparative politics",
    "data management",
    "survey data",
    "voting behavior",
    "expert surveys",
    "validation"
  ],
  "related_identifiers": [
    {
      "identifier": "https://github.com/hdigital/ess-linking/tree/v0.1",
      "relation": "isSupplementTo",
      "scheme": "url"
    }
  ],
  "version": "v0.1",
  "resource_type": {
    "title": "Software",
    "type": "software"
  },
  "license": {
    "id": "mit-license"
  },
  "relations": {
    "version": [
      {
        "index": 0,
        "is_last": true,
        "parent": {
          "pid_type": "recid",
          "pid_value": "8421232"
        }
      }
    ]
  }
}

Specify metadata

You can also specify Zenodo metadata in a .zenodo.json file in your GitHub repository.

https://developers.zenodo.org/#github

This allows you to almost fully automate the data archiving without adding information manually in Zenodo.

Here is a version of the .zenodo.json we created. It includes only the metadata that Zenodo can not extract from other GitHub information.

zenodo_json = """
{
  "title": "Harmonizing and linking party information: The ESS as an example of complex data linking",
  "description": "R code and notebooks with examples for linking party data in the European Social Survey (ESS)",
  "creators": [
    {
      "affiliation": "University of Konstanz, Germany",
      "name": "Bederke, Paul",
      "orcid": "0000-0001-7555-8656"
    },
    {
      "affiliation": "GESIS – Leibniz Institute for the Social Sciences, Germany",
      "name": "Döring, Holger",
      "orcid": "0000-0002-6616-8805"
    }
  ],
  "keywords": [
    "comparative politics",
    "data management",
    "survey data",
    "voting behavior",
    "expert surveys",
    "validation"
  ],
  "license": {
    "id": "mit"
  }
}
"""

Let’s check if the json is valid and can be loaded in Python.

zenodo_dict = json.loads(zenodo_json)

len(zenodo_dict)
5

Get license id

This is how we found the license id – see https://developers.zenodo.org/?python#licenses

response = requests.get("https://zenodo.org/api/licenses", params={"q": "id:mit"})
response.json()
{'hits': {'hits': [{'id': 'mit',
    'created': '2023-10-12T17:24:20.716475+00:00',
    'updated': '2023-10-12T17:24:20.758570+00:00',
    'links': {'self': 'https://zenodo.org/api/vocabularies/licenses/mit'},
    'revision_id': 1,
    'title': {'en': 'MIT License'},
    'description': {'en': 'A short and simple permissive license with conditions only requiring preservation of copyright and license notices. Licensed works, modifications, and larger works may be distributed under different terms and without source code.'},
    'icon': '',
    'props': {'url': 'https://opensource.org/licenses/MIT',
     'scheme': 'spdx',
     'osi_approved': 'y'},
    'tags': ['recommended', 'all', 'software'],
    'type': 'licenses'}],
  'total': 1},
 'sortBy': 'bestmatch',
 'links': {'self': 'https://zenodo.org/api/vocabularies/licenses?page=1&q=id%3Amit&size=25&sort=bestmatch'}}

Learning Python

Background

Many of the Python approaches used in this notebook are covered in Eric Matthes (2022): Python Crash Course.

Chapter 17 covers Working with APIs. This is the majority of tasks done in this notebook as well.

Chapter 15 on Generating Data provides examples for creating figures with matplotlib. In the notebook, we use Vega-Altair which is based on a grammar of graphis and similiar to the prominent R library ggplot2.

The book does not cover pandas, the major Python library for data analysis. Here, we use pandas to convert the API reponse with a list of dictionaries into a data frame.

We used ChatGPT regularly when creating the notebook to get code examples with parameters.

Finally, a couple of dead ends and unsuccessfull coding attempts did not make it into the notebook.

Book reference

As always in this notebook, there is an API to access metadata. Here, we use the Open Library Books API to get the metadata with the book’s ISBN.

r = requests.get("https://openlibrary.org/isbn/9781718502703.json")
book = r.json()

book
{'type': {'key': '/type/edition'},
 'authors': [{'key': '/authors/OL7634726A'}],
 'isbn_13': ['9781718502703'],
 'languages': [{'key': '/languages/eng'}],
 'pagination': '544',
 'publish_date': '2022',
 'publishers': ['No Starch Press, Incorporated'],
 'source_records': ['bwb:9781718502703', 'amazon:1718502702'],
 'title': 'Python Crash Course, 3rd Edition',
 'weight': '0.369',
 'works': [{'key': '/works/OL28018702W'}],
 'key': '/books/OL38327872M',
 'latest_revision': 2,
 'revision': 2,
 'created': {'type': '/type/datetime', 'value': '2022-06-18T00:55:01.629742'},
 'last_modified': {'type': '/type/datetime',
  'value': '2022-11-15T08:14:57.012982'}}
url = f"https://openlibrary.org/{book['authors'][0]['key']}.json"
url
'https://openlibrary.org//authors/OL7634726A.json'
r = requests.get(url)
r.json()
{'name': 'Eric Matthes',
 'created': {'type': '/type/datetime', 'value': '2019-10-04T05:26:31.796765'},
 'last_modified': {'type': '/type/datetime',
  'value': '2019-10-04T05:26:31.796765'},
 'latest_revision': 1,
 'key': '/authors/OL7634726A',
 'type': {'key': '/type/author'},
 'revision': 1}