Kaffeebart Kr Pul Sd Uetk unsplash

Datenzugang: Daten hinter Schloss und Riegel

Die Menge an Daten wächst exponentiell. Auch der Staat erhebt Mengen an Daten, doch nur ein kleiner Teil davon ist für die Öffentlichkeit zugänglich. Am Beispiel von Gerichtsurteilen beleuchten Selina Scherrer, Ilona Gretener und Julia Zingerle die verschiedenen Hürden, die den Datenzugang erschweren.

Der vorliegende Beitrag entstand im Rahmen der Sommerakademie «Stupid Statistics?!? Durchblick behalten im Daten-Dschungel der Gegenwart»der Schweizerischen Studienstiftung und wurde redaktionell begleitet von Reatch.

Dank moderner statistischer Sprachmodelle können Computer heutzutage auf Knopfdruck auch komplexe Datenquellen wie Bilder und Texte analysieren. Damit steigt auch das Interesse daran, Zugang zu solchen Quellen zu erhalten. Dies umfasst nicht selten auch Daten, die vom Staat erhoben werden. Mit verschiedenen Projekten, wie beispielsweise www.opendata.swiss, wird daran gearbeitet, der Öffentlichkeit Zugang zu den vom Staat erhobenen Daten zu verschaffen. Bei Gerichtsurteilen hapert es diesbezüglich aber noch.

Seit dem Jahr 2000 müssen die Schweizer Gerichte zwar auf Bundesebene grundsätzlich alle ihre Urteile publizieren. Ganz anders sieht das auf Ebene der Kantone aus: Je nach Kanton werden unterschiedlich viele Urteile von erst- und zweitinstanzlichen kantonalen Gerichten publiziert; oft wird hier eine Selektion nach Relevanz vorgenommen, wobei einige Gerichte überhaupt keine Urteile in digitaler Form veröffentlichen. Die Gerichte sind dazu nach geltendem Recht auch nicht verpflichtet, da Verfassung und Völkerrecht nur einen Anspruch auf Verkündung des Urteils und nicht auf Veröffentlichung des vollen Textes geben (Hürlimann, 2014).

Für eine sinnvolle Auswertung von Gerichtsurteilen mit statistischen Methoden wäre es wertvoll, alle Urteile der jeweiligen Gerichte zur Verfügung zu haben. Publiziert ein Gericht beispielsweise nur diejenigen Urteile, welche es als besonders wichtig erachtet, gibt es eine starke Verzerrung in der Datenauswahl, weil als «langweilig» erachtet Urteile seltener publiziert würden. Dabei sind es doch die eher banal erscheinenden Routine-Fälle, die repräsentativ für den Gerichtsalltag sind. Wie schafft man es, auch auf kantonaler Ebene die Zahl der digital verfügbaren Urteile zu erhöhen, ohne die Privatsphäre des Einzelnen zu verletzen und gleichzeitig den administrativen Aufwand in Grenzen zu halten?

Privatsphäre und Datenschutz

Wie bei allen Daten, die der Staat über seine Bürger:innen erhebt und dann veröffentlicht, muss auch bei Gerichtsurteilen sichergestellt werden, dass die Privatsphäre des Einzelnen nicht verletzt wird. Verwaltungs- und strafrechtliche Gerichtsurteile enthalten in der Regel sensible, personenbezogene Daten, welche vom Schweizer Datenschutzgesetz als besonders schützenswert betrachtet werden (Art. 5 lit. c Ziff. 5 DSG). Auch bei privatrechtlichen Verfahren kann ein grosses Interesse daran bestehen, dass nicht alle Details für jede Person öffentlich im Internet einsehbar sind. So ist es nur allzu verständlich, wenn jemand beispielsweise nicht möchte, dass sein Nachbar alle Einzelheiten seiner Scheidung mit einer kurzen Internetrecherche herausfinden kann.

Aus Sicht des Datenschutzes und des Anrechts jedes Einzelnen auf ein gewisses Mass an Privatsphäre ist es daher geboten, dass nicht alle Einzelheiten von Gerichtsurteilen publiziert und den betroffenen Personen zugeordnet werden können. Insbesondere durch die Möglichkeit, Algorithmen zu nutzen, um Daten aus Urteilen mit anderen öffentlich zugänglichen Daten abzugleichen, besteht eine hohe Gefahr, dass Rückschlüsse auf einzelne Personen gezogen werden können. Man könnte beispielsweise baurechtliche Streitigkeiten mit einem Register abgleichen, in welchem vermerkt ist, wem welche Parzellen gehören und so die Urteile aller Klagen einer bestimmten Person herausfiltern. Es muss also auch bei Gerichtsurteilen eine Abwägung zwischen Datenschutz und öffentlichem Zugang zu Daten getroffen werden. Oft erscheint es sinnvoll – und wird auch von den Gerichten auf Bundesebene momentan so praktiziert –, die Urteile soweit zu anonymisieren, dass kein direkter Rückschluss auf die Parteien möglich ist.

Es ist jedoch so, dass selbst sorgfältig anonymisierte Urteile in einigen Fällen wieder mit konkreten Individuen in Verbindung gebracht werden können; insbesondere wenn mehrere Datensätze kombiniert werden. Dieses Wiederverknüpfungsrisiko kann die Privatsphäre gefährden, wenn es nicht ausreichend berücksichtigt wird. So kann es dazu kommen, dass bei bestimmten Arten von Daten - vor allem bei seltenen Merkmalen oder kleinen Gruppen - trotz der Anonymisierung Einzelpersonen leicht identifiziert werden können.

Anonymisierung der Urteile

Aufgrund der eben beschriebenen Datenschutzüberlegungen werden Urteile vor der Publikation anonymisiert. Dies wird durch eine sogenannte Pseudonymisierung gemacht, bei welcher personenbezogene Daten durch allgemeine Bezeichnungen ersetzt werden. So könnte beispielsweise der Name der klagenden Partei durch ein X. und der Name der beklagten Partei durch ein Y. ersetzt werden. Diese pseudonymisierten Daten sind Daten, die ohne zusätzliche Informationen nicht mehr einer spezifischen betroffenen Person zugeordnet werden können (Schwabe, 2021).

Eine häufige Begründung für die sehr selektive Publikationspraxis kantonaler Gerichte ist der mit der Anonymisierung verbundene Aufwand. Die Anonymisierung eines einzelnen Urteils von Hand dauert durchschnittlich etwa eine halbe Stunde (Hürlimann, 2014). Das klingt erst einmal nach wenig, doch gerade auf erstinstanzlicher Ebene fallen jährlich sehr viele Urteile an. Zum Beispiel hat das Bezirksgericht Bülach im Jahr 2022 fast 5’000 Urteile gefällt – das Bezirksgericht Zürich sogar fast 14’000 (Obergericht Kanton Zürich, 2022). Hier gibt es ein grosses Potenzial, den Arbeitsaufwand mit Hilfe von Algorithmen zu reduzieren.

Es gibt bereits seit einigen Jahren Applikationen, welche eine semi-automatische Anonymisierung von Gerichtsurteilen ermöglichen. Ein Beispiel hierfür ist die “Weblaw Anonymisierung” (Dévaud/Kummer, 2017). Um ein besseres Resultat des automatisierten Prozesses zu erreichen, wäre es auch denkbar, Gerichtsschreiber:innen zu zeigen, wie sie Urteile so verfassen können, dass sie besonders gut von einer Software pseudonymisiert werden können. Es wird aber weder von Hand noch mittels Algorithmen möglich sein, in jedem Fall eine vollkommen lückenlose Anonymisierung zu gewährleisten.

Technische Infrastruktur für Publikation

Um Urteile zu publizieren, braucht es zuerst einmal einen Ort, an dem diese veröffentlicht werden können. Gerichte auf Bundesebene haben hierfür eine eigene Webseite, beispielsweise www.bger.ch für das Bundesgericht. Kantonale Gerichte, welche bereits jetzt Urteile publizieren, machen das ebenfalls häufig auf ihrer eigenen Webseite, zum Beispiel werden Urteile des Züricher Obergerichts auf www.gerichte-zh.ch publiziert. Es scheint jedoch wenig zielführend und auch sehr ressourcenaufwändig, wenn jedes erstinstanzliche Gericht dafür eine eigene Webseite erstellen müsste. Sinnvoller wäre es wohl, wenn die Kantone – oder noch besser der Bund – eine Infrastruktur zur Verfügung stellen würden, welche dann von den Gerichten genutzt werden könnte, um ihre Urteile zu publizieren. Im Bereich von anderen Daten des Staates gibt es ein solches Angebot schon mit der bereits erwähnten Website von www.opendata.swiss. Das würde nicht nur Ressourcen einsparen, sondern mit einer gemeinsamen Infrastruktur auch einheitliche Publikationsstandards etablieren – was wiederum die statistische Datenauswertung vereinfachen würde.

Politische Umsetzbarkeit oder Data Clean Rooms

Würde eine breite Publikation kantonaler Gerichtsurteile angestrebt, wäre wohl ein neues Gesetz notwendig, wofür ein politischer Konsens gefunden werden müsste. Da es wie oben erläutert durchaus problematische Punkte aus Sicht des Datenschutzes gibt und auch zusätzliche Ressourcen an Steuergeldern für den Aufbau der notwendigen technischen Infrastruktur benötigt würden, könnte es schwer werden, für ein solches Vorhaben eine politische Mehrheit zu finden. Als Alternative zu einer öffentlichen Publikation wäre ein Data Clean Room denkbar. Ein Data Clean Room ist eine sichere und kontrollierte Umgebung, in welcher Institutionen sensible Daten analysieren können, ohne Datenschutzanforderungen zu verletzen, indem sie personenbezogene Informationen entfernen oder anonymisieren, um die Privatsphäre zu schützen (Trost, 2023). In einer solchen kontrollierten Umgebung wäre es auch möglich, nur bestimmten Personen mit einem berechtigten Interesse einen Zugang zu den Gerichtsurteilen zu geben. So hätte beispielsweise diejenige Person, die aus reiner Neugier etwas über die Scheidung ihres Nachbars wissen möchte, keinen Zugriff auf die Urteile, eine Forscherin, die eine vergleichende Arbeit über die Gerichtspraxis bei Scheidungen schreibt, jedoch schon.

Letztlich lassen sich bei Gerichtsurteilen also ähnliche Hürden erkennen wie bei anderen sensiblen Daten, die vom Staat erhoben und verwaltet werden: Das öffentliche Interesse an Transparenz und das wissenschaftliche Potential auf der einen Seite müssen mit dem Anspruch auf Privatsphäre und Datenschutz sowie den administrativen Kosten auf der anderen Seite aufgewogen werden.

Quellen

Bundesgesetz über den Datenschutz (DSG) 235.1—Bundesgesetz vom 25. September 2020 über den Datenschutz (Datenschutzgesetz, DSG).

Dévaud, B./Kummer, F. (2017), (Semi-)Automatische Anonymisierung von Entscheiden, Jusletter IT

Hürlimann, D. (2014). Publikation von Urteilen durch Gerichte. sui generis. https://doi.org/10.21257/sg.8

Schwabe, C. (2021). Pseudonymisierte Daten. Robin Data GmbH https://www.robin-data.io/date...

Trost, D.-A. (2023). Zwischen Datenschutz und Performance: Was ist ein Data Clean Room? https://www.computerwoche.de/a...,3614386

Obergericht Kanton Zürich (2022), Rechenschaftsbericht https://www.gerichte-zh.ch/fil...

Autor*innen

Autor*in

Ilona studiert Soziokulturelle Animation an der Hochschule Luzern und interessiere sich für den gesellschaftlichen Wandel, Ehrenamtsmanagement und die soziale Kohäsion. Sie hat Arbeitserfahrung als Fachperson Gemeinwesenarbeit und als E-Tutorin an der Hochschule Luzern für Soziale Arbeit. In ihrer Freizeit engagiert sie sich gerne in der Pfadi und dem Musikverein.

Autor*in

Julia Zingerle studiert zurzeit Maschineningenieurwissenschaften an der ETH Zürich. Ihre Freizeit verbringt sie gerne draussen, sei es beim Skifahren, Baden oder Wandern. Ebenfalls interessiert sie sich sehr für Politik und kann sich für vieles begeistern.

Selina Scherrer studiert Rechtswissenschaften an der Universität Zürich. Sie interessiert sich besonders, wie man unterschiedliche Methoden und Menschen aus verschiedenen Wissenschaften zusammenbringen kann, um neuartige Erkenntnisse zu gewinnen.

Die Beiträge auf dem Reatch-Blog geben die persönliche Meinung der Autor*innen wieder und entsprechen nicht zwingend derjenigen von Reatch oder seiner Mitglieder.

Zum Kommentieren mehr als 20 Zeichen im Text markieren und Sprechblase anklicken.

Wir freuen uns über nützliche Anmerkungen. Die Kommentare werden moderiert.