crowdsourcing.wien

crowdsourcing.wien, Wien Museum; Wienbibliothek im Rathaus (ed.), 2022. https://crowdsourcing.wien (Last Accessed: 01.05.2025). Reviewed by orcid-icon Christian Erlinger (LibrErli – Christian Erlinger – Informatik für Bibliotheken, Archive und Museen), christian@librerli.eu. ||

Abstract:

Crowdsourcing.wien is a digital platform launched in 2022 by the Wien Museum and the Wienbibliothek im Rathaus to involve the public in transcribing and indexing historical documents. Originating from a pilot project on postcard transcription, the platform now hosts multiple initiatives, including letter transcription and metadata extraction from historical theater playbills. This review outlines the platform’s development, user interface, and collaborative mechanisms such as multi-step validation. While it effectively integrates user contributions into institutional collections, issues remain regarding data accessibility, licensing transparency, and restrictive privacy protocols that limit genealogical research. Overall, crowdsourcing.wien represents a valuable model for participatory cultural heritage preservation.

Die Crowdsourcing-Plattform des Wien Museums und der Wienbibliothek im Rathaus

1Crowdsourcing.wien ist eine Transkriptionsplattform, die in Kooperation zwischen dem Wien Museum und der Wienbibliothek im Rathaus betrieben wird. Am 4. Juli 2022 erfolgte der offizielle Launch des Portals (Wien Bibliothek im Rathaus 2022). Dem vorangegangen war ein Pilotprojekt, bei dem aus der topografischen Sammlung des Wien Museums Ansichtskarten zur Transkription vorgelegt wurden. Diese Rezension bespricht die Crowdsourcing-Plattform zuerst aus einem ‚chronologischen‘ Aspekt, um danach anhand der vorhandenen Teilprojekte die einzelnen Funktionalitäten und die Einbindung der Crowd in das Projekt zu diskutieren.

Pilotprojekt ‚Ansichtskartensammlung‘

22000 Ansichtskarten wurden im Sommer 2021 von der ‚Crowd‘ innerhalb von zwei Wochen transkribiert (Egger 2023b). Über 400 Personen haben sich bei diesem ersten Projekt auf der eigens dafür erstellten Online-Plattform registriert und an der Transkription der Karten und der darauf befindlichen Grußworte, Adressinformationen und Nachrichten mitgewirkt (Scheller, Békési und Stuiber 2021). Die derart gewonnenen Daten wurden in die Sammlungsdatenbank des Museums zurückgespielt und sind über die Online-Sammlung des Wien Museums zugänglich.1 Die Transkription der Ansichtskarten umfasst hierbei nicht etwaige aufgedruckte Textbausteine wie ‚Gruss aus Wien‘2, sondern ausschließlich handschriftliche, individuelle Textelemente sowie Angaben zu den Stempelabdrücken. Nicht erkennbar ist in der Online-Sammlung allerdings, ob eine pixelgenaue Markierung des Textes auf dem Bild erfasst und gespeichert wurde. Personenbezogene Daten, insbesondere im Adressblock, sind im Digitalisat der Karte verpixelt und im Transkript mit Auslassungszeichen dargestellt. Bei Ansichtskarten mit Aufgabedatum rund um 1900 besteht höchst unwahrscheinlich noch Datenschutz, denn ob Personen, die damals am Postverkehr aktiv teilnahmen, 120 Jahre später noch am Leben sind, kann bezweifelt werden. Dieses Vorgehen ist zwar als Grundvorgabe datenschutz- und persönlichkeitsrechtlich vorbildhaft, für etwaige Forschungen im genealogischen Bereich aber als absolut abträglich zu beurteilen. Gerade die Bearbeitung mittels Crowd-Sourcing hätte die Möglichkeit erbracht, eine detaillierte Beurteilung der datenschutzrechtlichen Situation zu erhalten: Sind AdressatIn oder AbsenderIn nachweislich bereits verstorben, dann würde gemäß europäischer Datenschutzbestimmungen kein Datenschutz bestehen. Auch die üblichen archivarischen Sperrfristen hätten in diesem Zuge einer durch die Crowd erfolgten Beurteilung für eine spätere korrigierte Veröffentlichung ohne Verpixelung des Adressblocks herangezogen werden können. Urheberrechtlich ist das digitale Abbild der Ansichtskarte auf der Online-Sammlungsseite mit CC0 lizenziert; dies wird auch das Transkript umfassen, sofern bei einfachen Grußworten überhaupt eine Schöpfungshöhe erreicht ist. Die Online-Sammlungen des Wien Museums weisen im Impressum bzw. auf den Detailseiten der Postkarten darauf hin, dass die gemeinfreien Objekte unter CC0 lizensiert sind3; das ist aber streng genommen die falsche Lizenz; korrekterweise sollte für die Ansichtskarten, bei denen offensichtlich die urheberrechtlichen Schutzfristen abgelaufen sind, die Public Domain Mark vergeben werden.

3Auch hinsichtlich der systematischen Durchsuchbarkeit hat man sich für einen protektiven Ansatz entschieden: Die Postkarten können gegenwärtig nicht über eine Schnittstelle im größeren Stil recherchiert werden.4 Auch stehen im Web-UI abgesehen von der Suche über den Tag ‚Postkarten mit Transkription‘ keine vertiefenden Recherchen der Postkarten (bspw. nach Adress-Geographika) zur Verfügung.

Portal ‚crowdsourcing.wien‘

4Mit den aus diesem Projekt gewonnenen Erfahrungen und wohl gestärkt durch die scheinbar überwältigend-erfreuliche Rückmeldung sowie das Interesse der Online-Community an der Transkription von Materialien im weitesten Sinne zur Geschichte Wiens wurde als dauerhafte Plattform ‚crowdsourcing.wien‘ im Sommer 2002 lanciert. Ziel der Plattform ist es, gemäß der Eigendefinition auf der Startseite der Plattform, „die beiden [Bibliothek und Museum] Wiener Gedächtnisspeicher durch Ihre Mithilfe gemeinsam zu erschließen und handschriftliche Dokumente zu transkribieren“ (Wien Museum und Wienbibliothek im Rathaus 2025). Gegenwärtig sind drei aktive Projekte eingestellt, zwei zur Transkription von Briefen, eines zur strukturellen Erschließung der (gedruckten, nicht handschriftlichen!) Metadaten der Theaterzettel-Sammlung. Jedes Projekt verweist auf eine eigene Subseite des Portals und erlaubt demnach auch projektspezifische Erfassungsregeln und Hinweise zu verfassen. Die „hochwertige[n] Transkriptionen“ sollen nach Abschluss der Projekte in die jeweiligen Online-Sammlungen integriert werden (Egger 2023a).

Erschließungsleistungen durch die Crowd

5Die Arbeiten, die die Crowd am Portal erledigen kann, sind individuell auf die bereitgestellten Bestände abgestimmt. Während es bei beiden Projekten zur Erschließung der Brief-Konvolute um die Volltexttranskription der Korrespondenzen geht, findet im Theaterzettel-Projekt eine strukturierte Erfassung der angegebenen Aufführungsinformationen statt. Dementsprechend unterschiedlich sind auch die Erfassungsmasken und Erschließungsrichtlinien auf der Plattform5.

Transkription von Briefen

Abb. 1: Screenshot der geöffneten Bearbeitungsmaske zur Volltexttranskription eines Briefes (https://web.archive.org/web/20240323195531/https://wienbibliothek.crowdsourcing.wien/briefe-1920-1934/object/4936713/).
6 Die Projekte zur Erschließung der Briefkonvolute erbitten von den Teilnehmenden die Transkription des auf den Manuskripten und Typoskripten befindlichen Textes nach dem ‚Acht-Augen-Prinzip‘. Das bedeutet, dass jeder als ‚vollständig‘ transkribiert gekennzeichnete Brief in einer zweiten Lesung von mindestens drei unterschiedlichen Beitragenden geprüft wird, und erst nach dreimaliger Bestätigung in der Prüfung als abgeschlossen gilt (Egger 2023b, 97). Diese Status sind gleichzeitig auch die wesentlichen Filtermöglichkeiten, um im jeweiligen Projekt Materialien zur Betrachtung bzw. Bearbeitung auswählen zu können. Je nachdem, ob man unbearbeitete Objekte erstmalig abtippen, bereits vorliegende Transkripte korrigieren oder einfach nur in Briefen lesend stöbern möchte, lässt sich das entsprechend einstellen. Die Bearbeitung der Volltexterschließung erfolgt in einem einfachen mehrzeiligen Textfeld, welches rechts vom Digitalisat des Briefes auf dem Bildschirm dargestellt ist (Abb. 1). Für das Digitalisat liegt eine eingebettete Zoom-Funktionalität vor.

7Direkt unterhalb des Bearbeitungsfeldes ist eine Kurzfassung der Editionsrichtlinien – der Transkriptionsregeln – sowie eine Hilfestellung für das Lesen von Kurrent verlinkt. Auch ist es möglich, eine benutzerspezifische Anmerkung zum Objekt zu hinterlassen, die für die weitere Bearbeitung durch andere Crowd-User hilfreich sein kann. Die Metadaten der Briefe stammen aus der digitalen Sammlung der Wienbibliothek. Etwaige Korrekturen an diesen können nur via E-Mail an die Bibliothek gemeldet werden.

Erschließung der Theaterzettel

8Die Theaterzettel, zumeist einseitig gedruckte Ankündigungen von Theatervorstellungen, liegen digitalisiert im Bestand der Wienbibliothek nach Veranstaltungsorten, d.h. nach Theaterhäusern, zusammengefasst vor. Eine tiefere Erschließung fand bislang noch nicht statt, weshalb auch dieses Projekt an die Crowdsourcing-Plattform angeschlossen wurde. Die Theaterzettel können ähnlich den Briefen nach ihrem Bearbeitungsstand gefiltert werden: ‚Erfassen‘ für noch unbearbeitete Zettel, ‚Prüfen‘ für die Zweitlesung bereits erfasster Ankündigungen oder ‚Lesen‘ für bereits mindestens zweimal korrigierte Theaterzettel.

Abb. 2: Screenshot der Erschließungsmaske eines Theaterzettels.
9 Die Erfassungs- und Prüfmaske der Theaterzettel zeigt, ähnlich wie bei den Brieftranskriptionen, links das Digitalisat des Druckes mit Zoom-Funktionalität, rechts aber eine strukturierte Erfassungsmaske. Die detaillierten Erschließungsregeln sind am Ende des Formulars verlinkt (vgl. Abb. 2). Nicht alle auf der Ankündigung auffindbaren Daten werden hierbei erschlossen. Welche Daten übernommen werden, ergibt sich aus dem Formular bzw. den Editionsrichtlinien. Wenn möglich, werden das aufgeführte Werk und die mit der Aufführung verbundenen Personen mit Einträgen in der Gemeinsamen Normdatei (GND) verlinkt. Für die Verlinkung werden die BenutzerInnen angeregt, die Suche in der Online-GND (OGND) des Bibliotheksservice-Zentrums Baden-Württemberg (BSZ) durchzuführen. Womöglich wäre eine Integration von lobid-gnd und insbesondere dem einfach zu implementierenden Autovervollständigungsmodus6 eine lohnende Erweiterung und Hilfestellung für die Bearbeitung.

10In welchem Datenformat die Werte aktuell erfasst werden, ist nicht bekannt und lässt sich auch im Quelltext oder in der Netzwerkkommunikation nicht eruieren. Nach Abschluss des Projektes sollen die Daten gleich dem Volltext der Korrespondenzen in den Online-Sammlungen integriert und recherchierbar sein.

11Allen Projekten gleich ist der Umstand, dass ein Objekt nicht durch eine Person allein vollständig transkribiert bzw. erschlossen werden muss; es können auch jederzeit Zwischenstände gespeichert werden. Es werden dann separate Versionen des Transkripts erzeugt, welche in einer ‚Historie‘ der Bearbeitung abgerufen, aber nicht vergleichend dargestellt werden können.

Grundlagen der Mitwirkung und Benutzerführung

12Um am Projekt mitarbeiten zu können, ist eine einmalige Registrierung durch Angabe von E-Mail und frei gewähltem Benutzernamen nötig. Das Login ist für das gesamte Crowdsourcing-Portal gültig und erlaubt das Mitwirken an allen aktiven Projekten der Plattform. Als minimales Gamification-Element können die ‚Ranglisten‘ der ‚Beiträger*innen‘ gelten, welche auf den jeweiligen Einstiegsseiten der einzelnen Projekte verlinkt sind. Die Reihung erfolgt dabei entsprechend der Summe an Erst- und Zweitbearbeitungen.

13Ein Benachrichtigungsbereich erlaubt den Kulturinstitutionen Mitteilungen an die BenutzerInnen zu senden. Gleichzeitig werden Benachrichtigungen an die BearbeiterInnen übermittelt, wenn Änderungen oder Korrekturen an Objekten durchgeführt wurden, von denen man selbst zumindest eine Version erstellt hat. Diese drei Benachrichtigungskategorien sind optional wählbar.

14Begleitend zum virtuellen Arbeiten an den bereitgestellten Bibliotheksbeständen bietet die Wienbibliothek auch Präsenztreffen zum Austausch und zur Vernetzung zwischen Institution und Crowd und somit auch für die Crowd untereinander an. In sogenannten ‚Crowd-Cafés‘ besteht die Möglichkeit, die Bibliothek kennenzulernen und Feedback zum Projekt einzuholen. Auch wurden Kurrent-Leseworkshops angeboten; sicherlich ein wertvoller Beitrag, um Wissen und Fertigkeiten zur Transkription teilweise wohl sicherlich nicht einfacher Korrespondenzen zu teilen und aufzubauen (Egger 2023b, 97).

Technologische Aspekte

15Technologisch scheint die Plattform eine für das Projekt von den beteiligten Gedächtnisinstitutionen in Auftrag gegebene und durch externe PartnerInnen eigens entwickelte Software zu sein. Weder im Impressum oder in anderen Credits, noch im Quellcode der Webseite lassen sich Verweise auf standardisierte oder offene (Editions-)Systeme erkennen. Im Gegenteil, in den verlinkten Javascripts wird bspw. das Copyright eines der beauftragten Webentwicklungsunternehmen angegeben. Demnach basiert crowdsourcing.wien auf einer proprietären Software.7

16Die Digitalisate in der Crowdsourcing-Plattform sind mit den Quellen in der Online-Sammlung der Wienbibliothek verlinkt. Transkripte aus dem ersten Briefprojekt ‚Briefe 1914–1919‘ sind bereits in der Online-Sammlung eingespielt und dort auch als Volltextelement in das Retrieval integriert. Die Volltexte sind maschinenlesbar und auch in den METS-Dateien der jeweiligen Objekte verlinkt.8 Interessanterweise ist auf der Landing Page des Objektes in der Online-Sammlung auch eine ALTO-XML-Datei verlinkt, die allerdings als Dimensionsangaben für alle Wörter nur ‚0‘ aufweist, da im Projekt kein koordinativer Zusammenhang zwischen Text und Bild ermittelt wird.9 Das Rückspielen der Ergebnisse des Crowdsourcing in die Digitale Sammlung ist allerdings sehr vorbildhaft und ehrt das Projekt und die BenutzerInnen für ihren Einsatz.

Rechtliche Aspekte

17Für die durch Crowdsourcing entstandenen Daten wird eine umfassende Nutzungsrechteabtretung formuliert.10 Durch die projekthafte Struktur der Plattform können diese Rechte grundsätzlich je Projekt anders gestaltet werden. Gegenwärtig sind diese aber in den vorliegenden Projekten identisch. Sämtliche Werknutzungsrechte werden vollumfänglich an die Wienbibliothek abgetreten. Während hingegen angegeben wird, dass beim digitalisierten Textmaterial bereits Gemeinfreiheit besteht, wird den ‚gecrowdeten‘ Inhalten keine offene Lizenz zugeführt. Im Gegensatz dazu legt die strikte Nutzungsrechteabtretung eher die Vermutung nahe, dass seitens der PlattformbetreiberInnen diesen Inhalten Urheberrecht und Schöpfungshöhe zugemessen wird. Ob dies überhaupt der Fall ist oder sein kann, dass reine Abschriften von bereits gemeinfreien Textinhalten (bzw. bei Inhalten, die ohnedies womöglich nie Schöpfungshöhe erreicht haben – vgl. Theaterzettelprojekt) urheberrechtlichen Schutz erwirken, ist zweifelhaft: „Die Zurverfügungstellung einer reinen Transkription wird hingegen nur als Vervielfältigung eines bestehenden Werkes gelten können.“ (Scholger 2021) Hier wäre es sowohl unstrittig als auch für alle Beteiligten vorteilhafter, würden die Nutzungsrechtebedingungen vorsehen, dass alle durch die Crowd erstellten Inhalte im Zuge des Abspeicherns automatisch unter einer freien Lizenz, bspw. CC0, stehen. Gewissermaßen paradox wird die Situation dann noch durch die Einspielung in die Online-Sammlungen, denn dort werden die Objekte wie bspw. der zuvor schon beispielhaft verlinkte Brief11 korrekt mit der Public Domain ausgezeichnet, was demnach auch unzweifelhaft den Volltext mitumfasst.

18Für die Anmeldung auf der Plattform ist die Angabe einer E-Mail-Adresse, eines beliebigen Benutzernamens und eines Passwortes nötig. Demnach ist eine anonyme Teilnahme am Portal realisierbar. Der Benutzername ist auf der Plattform öffentlich sichtbar und wird mit den getätigten Erschließungsaktivitäten verknüpft. BenutzerInnen können ihren Account mit ausgewählten Social-Media-Plattformen verlinken, ohne dass eine nennenswerte Funktionalität damit verbunden wäre. Die angegebene E-Mail-Adresse wird über einen per E-Mail verschickten Verifizierungslink bestätigt. Eine weiterführende (persönliche) Akkreditierung der BenutzerInnen findet nicht statt.

Conclusio

19Mit crowdsourcing.wien haben die beiden lose miteinander verbundenen Wiener Kulturinstitutionen ‚Wien Museum‘ und ‚Wienbibliothek im Rathaus‘ ein ansprechendes Portal lanciert, mit dem die spannenden und teils für die Wiener Stadtgeschichte wertvollen Bestände dem allgemeinen Publikum nicht nur zur Betrachtung, sondern zur ureigenen Mitwirkung und Bearbeitung vorgelegt werden. Die Resonanz durch die hohe Erschließungsgeschwindigkeit und -frequenz lässt die berechtigte Hoffnung zu, dass noch weitere Bestände aus den digitalen Sammlungen zur Bearbeitung durch die Crowd angeboten werden oder sich weitere Wiener Institutionen des Portals bedienen. Dass die gewonnenen Daten auch in das Retrieval auf den Quellsystemen einfließen, ist vorbildhaft und mit Sicherheit nicht nur für das Auffinden, sondern auch für jedwede weitere wissenschaftliche wie populäre Nutzung der Bestände zweckdienlich.



Anmerkungen

[1]   Wien Museum 2025, hier: https://sammlung.wienmuseum.at/suche/?themes=144547, abgerufen am 22. März 2024.

[2]   Wien Museum 2025, hier: https://sammlung.wienmuseum.at/objekt/617835-elisabeth-bruecke-mit-karlskirche/, abgerufen am 22. März 2024.

[3]   Wien Museum 2025, hier: https://web.archive.org/web/20250211235426/https://sammlung.wienmuseum.at/ueber-uns/.

[4]   Wien Museum 2025, hier: https://web.archive.org/web/20240329200335/https://sammlung.wienmuseum.at/ueber-uns/.

[5]   Wien Museum und Wienbibliothek im Rathaus 2025, hier: https://web.archive.org/web/20240718140358/https://wienbibliothek.crowdsourcing.wien/theaterzettel/erfassungsregeln/.

[6]   https://web.archive.org/web/20240329200508/https://lobid.org/gnd/api#auto-complete.

[7]   Wien Museum und Wienbibliothek im Rathaus 2025, hier: https://web.archive.org/web/20240323192155/https://wienbibliothek.crowdsourcing.wien/briefe-1920-1934/_app/immutable/entry/start.cd53cb5e.js.

[8]   Wienbibliothek im Rathaus 2025, hier: https://web.archive.org/web/20240329200427/https://digital.wienbibliothek.at/wbrobv02/oai/?verb=GetRecord&metadataPrefix=mets&mode=view&identifier=3863124.

[9]   Wienbibliothek im Rathaus 2025, hier: https://web.archive.org/web/20240329200730/https://digital.wienbibliothek.at/wbrobv02/download/ftpack/alto/3863124.

[10]   Wien Museum und Wienbibliothek im Rathaus 2025, hier: https://web.archive.org/web/20240329200517/https://wienbibliothek.crowdsourcing.wien/theaterzettel/nutzungsbedingungen/.

[11]   Wienbibliothek im Rathaus 2025, hier: https://web.archive.org/web/20240329200657/https://digital.wienbibliothek.at/wbrobv02/3863124.


Bibliographie

Egger, Alexandra. 2023a. „An der Geschichte mitschreiben – Crowdsourcing an der Wienbibliothek im Rathaus.“ Bibliothekskongress 2023, Universität Innsbruck. https://web.archive.org/web/20260118144527/https://www.uibk.ac.at/congress/bibliothek2023/programm/abstracts-donnerstag-vormittag/an-der-geschichte-mitschreiben–crowdsourcing-an-der-wienbibliothek-im-rathau.html.

Egger, Alexandra. 2023b. „An der Geschichte mitschreiben – Crowdsourcing an der Wienbibliothek im Rathaus.“ Zeitschrift für Bibliothekswesen und Bibliographie 70 (2): 95–98. https://doi.org/10.3196/186429502070247.

Scheller, Evi, Sándor Békési und Peter Stuiber. 2021. „Crowdsourcing bei Ansichtskarten. Transkribieren, übersetzen, kontrollieren.“ Interviewt von Petra Stuiber. Wien Museum Magazin. https://web.archive.org/web/20260118143919/https://magazin.wienmuseum.at/crowdsourcing-bei-ansichtskarten.

Scholger, Walter. 2021. „Urheberrecht.“In: KONDE Weißbuch. Hrsg. v. Helmut W. Klug unter Mitarbeit von Selina Galka und Elisabeth Steiner im HRSM Projekt „Kompetenznetzwerk Digitale Edition.“ http://hdl.handle.net/11471/562.50.44.

Wienbibliothek im Rathaus. 2022. „Neue Plattform crowdsourcing.wien und die »Briefe 1914–1919«  | Wienbibliothek im Rathaus.“ https://web.archive.org/web/20240130132155/https://www.wienbibliothek.at/ueber-uns/presse/neue-plattform-crowdsourcingwien-briefe-1914-1919.

Wienbibliothek im Rathaus. 2025. „Wienbibliothek Digital.“ https://web.archive.org/web/20250301103100/https://digital.wienbibliothek.at/.

Wien Museum. 2025. „Online Sammlung.“ https://sammlung.wienmuseum.at.

Wien Museum und Wienbibliothek im Rathaus. 2025. „crowdsourcing.wien.“ https://web.archive.org/web/20250317052654/https://crowdsourcing.wien/.


Abbildungen

Abb. 1: Screenshot der geöffneten Bearbeitungsmaske zur Volltexttranskription eines Briefes (https://web.archive.org/web/20240323195531/https://wienbibliothek.crowdsourcing.wien/briefe-1920-1934/object/4936713/).

Abb. 2: Screenshot der Erschließungsmaske eines Theaterzettels.