Rezension der Deutschsprachigen Wikisource

Wikisource (deutsch), Wikimedia Foundation (ed.), 2003-2018. https://de.wikisource.org (Last Accessed: 13.02.2018). Reviewed by Susanne Haaf (Berlin-Brandenburg Academy of Sciences and Humanities), haaf@bbaw.de. ||

Abstract

The German Wikisource project evolved from a multilingual Wikimedia venture for the digitization of historical text sources. As a sub-project of the Wikimedia Foundation it is substantially based on the non-profit work of voluntarily engaged people. The objective is to digitize German, mostly historical works according to high-standard guidelines and to provide these texts to the public under free licenses. At the moment, the German Wikisource counts 120 active contributors who have digitized about 39,416 works manually or semi-automatically comprising more than 400,000 sub-pages in total. Apart from the the amount of digitized texts, major achievements of the project are the focus on text transcription quality, elaborate documentation and catering to the community of collaborators. In spite of the project’s own scholarly entitlement, there are limitations though for scholarly (out-of-the-box) reuse and there remain desiderata regarding established standards and best-practises for scholarly text digitization und publication. This, however, doesn’t diminish the fact that here a community of volunteers contributes greatly to the digitization of historical works, something scholars of various disciplines might benefit from as well.

Projektkonstellation und Zielsetzung

Fig. 1: Wikisource-Statistik zur Anzahl der Bearbeitungen, Seiten und Bearbeiter (https://de.wikisource.org/w/index.php?title=Spezial:Benutzerkonto_anlegen, Stand: 5.1.2018).
Fig. 2: Wikisource-Statistik zur Anzahl der Seiten, Werke und Texte der einzelnen Textsorten (https://de.wikisource.org/w/index.php?title=Wikisource:Statistik&direction=next…, Version vom 2.1.2018, Abschnitt: #Seitenstatistik).

1Die deutschsprachige Wikisource entwickelte sich aus einem im November 2003 gestarteten mehrsprachigen Wikimedia-Projekt zur Erfassung historischer Quellen. Als Teilprojekt der Wikimedia Foundation handelt es sich hierbei um ein gemeinnütziges Projekt, das wesentlich auf der Mitarbeit ehrenamtlich Engagierter basiert. Dabei werden deutschsprachige, i.d.R. historische Texte kollaborativ im Volltext erfasst, mit einfachem strukturellen Markup versehen und frei lizensiert zur Verfügung gestellt. Momentan (Januar 2018) wird von 101 „aktiven“ MitarbeiterInnen (Fig. 1) und 39.416 bereitgestellten Werke gesprochen (Wikisource:Statistik; Fig. 2). Dazu zählen kleine Formen wie Gedichte (9944), aber auch längere Texte wie Märchen und Sagen (6119) oder Romane (120; ebd.). Das Textspektrum umfasst sowohl fiktionale Textsorten als auch Sachliteratur. Darüber hinaus wurden größere Projekte in Angriff genommen, wie die Erfassung der Zeitschrift Die_Gartenlaube1 oder der Allgemeine_Deutsche_Biographie. Insgesamt ergeben sich für die deutschsprachige Wikisource mehr als 400.000 Unterseiten mit Transkriptionen. Damit stellt das Projekt neben dem Deutschen Textarchiv, dem Projekt Gutenberg-DE, der Digitalen Bibliothek bei TextGrid und der Sammlung Zeno.org2 eine der großen, Genre-unabhängigen Sammlungen digitalisierter historischer Werke des Deutschen dar.

2Durch das Engagement der freiwilligen HelferInnen wurde also bis jetzt eine beachtliche Sammlung historischer Quellen im (strukturierten) Volltext zusammengetragen und der Öffentlichkeit unter freien Lizenzen zur Verfügung gestellt. Dabei setzt sich das Projekt ein hohes Ziel:

Wikisource versteht sich als wissenschaftlich fundiertes Qualitätsprojekt, das sich möglichst hohen Standards bei der Textwiedergabe verpflichtet sieht. (Wikisource:Über_Wikisource)

3Tatsächlich wird in der Selbstbezeichnung von „Wikisource-Editionen“ und „Editionsrichtlinien“ gesprochen (Wikisource:Editionsrichtlinien). Dennoch wendet sich das Projekt aber offenbar in erster Linie an interessierte Laien, was auch in einer möglichst gefälligen Präsentation der Texte resultieren soll.3

4In diesem Projekt leistet eine Community von Freiwilligen einen großen Beitrag zur Digitalisierung historischer Werke, von dem auch die Wissenschaft unterschiedlicher Disziplinen zehren kann. Die folgende Betrachtung fragt nach den Möglichkeiten, aber auch den Grenzen des wissenschaftlichen Anspruchs des Projekts und der wissenschaftlichen Nachnutzbarkeit seiner Ergebnisse.

Textauswahl

Prinzipien der Textauswahl

5Die Textauswahl erfolgt basierend auf Vorschlägen der Community. Dabei können kurze Texte ohne Absprache verfügbar gemacht werden, während längere Texte (ab 50 Seiten; Wikisource_Diskussion:Projekte) vorab zur Diskussion gestellt werden sollten. Grundlage für die Textauswahl ist dabei das Interesse potentieller BearbeiterInnen, die freie Verfügbarkeit geeigneter Vorlagen sowie die Durchführbarkeit und Abschließbarkeit des Projekts (z. B. durch ein ausreichend ausgebildetes und starkes Team von MitarbeiterInnen). Das „System“ wird getragen von der Voraussetzung, dass für die Unterstützung bei der Textdigitalisierung im eigenen Projekt auch eine äquivalente Gegenleistung in den Projekten anderer erbracht werden soll.4

6Für die Auswahl der Vorlage wurden Richtlinien verfasst, in welchen die Erstausgabe oder Ausgabe letzter Hand, eine andere Ausgabe, die „in der Forschung als akzeptabel gilt“ (Wikisource:Textgrundlage) oder eine zuverlässige Edition des Textes (ohne Normalisierungen) als Textgrundlage empfohlen wird. Auch wenn damit kein einheitliches Auswahlkriterium formuliert wurde, bieten die Richtlinien doch eine lockere Orientierung und Grundlage für weitere Diskussionen auf den entsprechenden Seiten. Es ist außerdem möglich, dass „mehrere Versionen eines Textes gleichberechtigt dokumentiert werden“ (Wikisource:Über_Wikisource).

7Einen inhaltlich oder zeitlich begründeten Sammlungsschwerpunkt gibt es nicht, sondern der Fokus liegt auf „attraktive[n] oder seltene[n] Texte[n] […], die anderweitig im Internet nicht oder nicht in ausreichender Qualität im Volltext zugänglich sind“ (Wikisource:Über_Wikisource). Zeitlich reichen die Quellen von der jüngeren Geschichte bis in die althochdeutsche Zeit (z. B. Wessobrunner_Gebet). Auch historische Übersetzungen können als Quellen eingebracht werden.

8Dass die BearbeiterInnen also relativ frei entsprechend ihren Interessen Texte wählen können, ist der Bereitschaft zur Mitarbeit sicherlich zuträglich. Daraus ergibt sich jedoch eine opportunistisch zusammengestellte Textsammlung,5 die ggf. für die Nachnutzung in ihrer Zusammensetzung kritisch gesichtet und neu gefiltert bzw. zusammengestellt werden muss und für deren Beurteilung die Dokumentation ausführlicher Metadaten von wesentlicher Bedeutung sind.6

Textaufbereitung und Annotation

Metadaten

9Jeder Titel der Wikisource erhält ein festgelegtes Set an Metadaten, das die wesentlichen Aspekte umfasst: Titel, Autor, Entstehungszeit und -ort, Erscheinungsdatum, etc. (Vorlage:Textdaten). Zu überlegen wäre die Einführung einer Metadatenkategorie „Sprache“, welche die Sprache des transkribierten Textes eindeutig bestimmt. Zwar gibt es eine Kategorie „Sprache“; diese bezieht sich jedoch auf die Sprache des Originals.7 Gerade im Fall von Übersetzungen und Editionen historischer Texte mit neuhochdeutschem Vorwort wäre eine deutlichere Differenzierung hilfreich.

10Meist fehlt ein eindeutiger Hinweis auf das physische Exemplar, das der Transkription bzw. den Bilddateien, auf denen sie basiert, zugrundegelegt wurde. Die Angabe der Quelle erfolgt zwar konsequent durch Verlinkung des zugrundeliegenden Faksimiles, jedoch lassen sich anhand des Faksimiles bzw. des Links Aufbewahrungsort und Signatur häufig nicht mehr nachvollziehen. Der Rückbezug zum physischen Original gestaltet sich daher manchmal schwer (z. B. Hildebrandslied). Teilweise transportieren die Anbieter der Bilder (z. B. Wikimedia Commons) diese Informationen bereits nicht (vgl. z. B. Max_und_Moritz). Das Problem potenziert sich, wenn die gescannte Ausgabe wiederum eine Nachbildung des Originaldrucks darstellt, etwa im Fall von Faksimileausgaben (z. B. Die_Herren_Gehülfen_im_Buchhandel) oder Editionen (z. B. Der_zerbrochene_Krug), deren physischer Ort und physische Vorlage über die gescannten Seiten jeweils nicht identifiziert werden. Es gibt auch positive Beispiele, z. B. Wessobrunner_Gebet, wo allerdings der entsprechende Nachweis (in Ermangelung eines eigenen Metadatenfeldes) im Feld „Herkunft“ erbracht wurde. Die Einführung eines eigenen Metadatenfeldes für diese Angabe wäre aber m.E. zu erwägen.8

Transkriptionsrichtlinien

11Es wurden einige übergeordnete Transkriptionsrichtlinien festgelegt (Wikisource:Editionsrichtlinien), die durch eigene Kriterien für jedes Projekt ergänzt werden können. Dieses Vorgehen ist angesichts der Heterogenität der Quellen sinnvoll. Unschön ist nur, dass sich die projekteigenen Kriterien an unterschiedlichen Orten befinden können (z. B. auf der Index-Seite oder mit auf der Seite des Quellentextes) oder auch ganz fehlen können (z. B. Hildebrandslied), wodurch NutzerInnen nur die wenigen und eher allgemeinen Hinweise der projektübergreifenden Transkriptionsrichtlinien erhalten.

12Für die wissenschaftliche Nachnutzung besonders hervorzuheben ist der Anspruch der Wikisource, eine zuverlässige Erfassung der Quelle zu gewährleisten. Laut Selbstaussage sieht man sich „möglichst hohen Standards bei der Textwiedergabe verpflichtet.“ Normalisierungen und Modernisierungen der historischen Texte sollen grundsätzlich vermieden werden. Sämtliche Texte werden in Text und Bild bereitgestellt, „[u]m das Korrekturlesen zu erleichtern und Lesern die Kontrolle des Wortlauts der Vorlage zu ermöglichen“ (Wikisource:Über_Wikisource). In diesem Punkt folgt das Projekt konsequent dem Prinzip der wissenschaftlichen Überprüfbarkeit. Darüber hinaus wird jeder Text mehrfach von verschiedenen Personen Korrektur gelesen, um Fehler der Transkription zu minimieren. Besonders schwierige Textpassagen (fremd- oder altsprachliches Material, schwer leserliche Stellen in Handschriften) können außerdem zur Begutachtung durch Experten gesondert aufgelistet werden (Wikisource:Spezialisten_gesucht). Hier kann kaum noch mehr Aufwand für die Qualitätssicherung verlangt werden.

13Das Gebot der Nähe zur Quelle wird allerdings beschränkt durch (1) die Regel, „eine ‚pixelgenaue‘ Übernahme des Layoutes der Vorlage“ zu vermeiden, was sicherlich im gegebenen Projektkontext vernünftig ist, und (2) den Wunsch, der Lesbarkeit und einfachen Handhabung des Textes den Vorrang zu geben, was wiederum zu aus philologischer Sicht diskutablen Entscheidungen führt: Warum wird etwa die Abkürzung „dz“ beibehalten, Nasalstrich aber aufgelöst? Warum wagt man stillschweigende Auflösungen von Worttrennungen und „Interpunktionsfehlern“, obgleich solche Eingriffe leicht zu den unerwünschten Modernisierungen führen können? Spricht „das komfortable Lesen an Computern“ (Wikisource:Editionsrichtlinien) wirklich gegen die grundsätzliche Unterscheidung der s-Grapheme (ſ, s)?

14Das Ausmaß editorischer Nähe zur Quelle ist auch innerhalb der Wikisource-Community durchaus ein Diskussionspunkt (vgl. z. B. Diskussion:Hildebrandslied) und lässt sich gerade angesichts der inhaltlichen und historischen Breite sowie der Offenheit des Projekts hinsichtlich wissenschaftlicher Disziplinen wohl kaum abschließend lösen.

15Die Möglichkeit zur Diskussion ist auf jeder Seite der Wikisource gegeben, wird allerdings eher zurückhaltend genutzt – häufig wurde die Diskussionsseite zu einem Werk gar nicht eröffnet, ansonsten sind Diskussionen in der Regel recht kurz und zielorientiert. Dies zeigt, dass die Community hier nicht der Gefahr erliegt, sich in Fragen zur Methodik zu verzetteln, sondern den Weg pragmatischer Entscheidungen präferiert.9 Manchmal wäre etwas mehr Transparenz zur Grundlage bestimmter editorischer Entscheidungen zwar wünschenswert (z. B. Ein_kurtzweilig_lesen_von_Dyl_Vlenspiegel: Warum werden Nasalstrich, d’, v‘, Abkürzungen im Allgemeinen aufgelöst, aber nicht wz und dz?). Generell ist aber davon auszugehen, dass das Projekt von der Zielorientiertheit an dieser Stelle wesentlich profitiert.

16Ansonsten bieten die Diskussionen eine interessante Möglichkeit, den Prozess der Textentstehung teilweise nachzuvollziehen. So enthält z. B. Der_Ackermann_aus_Böhmen eine reichhaltige Diskussionsseite (Diskussion:Der_Ackermann_aus_Böhmen) und wurde auch hinsichtlich der Textqualität, welche die verfügbaren BearbeiterInnen erreichen könnten, im Rahmen der Projektdiskussionen besprochen.10

Annotationsformat und Annotationsrichtlinien

Fig. 3: Kleist: Der zerbrochne Krug. Berlin 1811, S. 9. Digitale Volltext-Ausgabe bei Wikisource. Links Wikisource-Transkription, rechts Scan der Textvorlage. URL: https://de.wikisource.org/w/index.php?title=Seite:Der_zerbrochene_Krug_(Kleist)… (Version vom 5.5.2016)

17Die strukturelle Annotation11 des Textes erfolgt in Wiki-Syntax, wie sie auch für die Wikipedia verwendet wird (Wikipedia/Hilfe:Textgestaltung), womit sich das Projekt den für die Textauszeichnung in den historischen und textbezogenen Wissenschaften etablierten TEI-XML-Richtlinien entzieht.12 Die Wiki-Syntax deckt vielerlei Phänomene ab, um die Textgestalt der Vorlage wiederzugeben, z. B. Inline-Formatierungen (fett, kursiv, unterstrichen, farbig, durchgestrichen), Überschriften, Einrückungen, Tabellen und Listen, Formeln. Über die Layout-Merkmale hinaus können begrenzt auch inhaltliche Phänomene ausgezeichnet werden (z. B. Zitate, Text in Versform, Fußnoten). Das Inventar an inhaltlichen Auszeichnungen bleibt jedoch überschaubar und in der Regel auf kleinere Texteinheiten beschränkt: Es gibt z. B. keine besonderen Auszeichnungen für Dramen (Sprecher, Bühnenanweisungen etc.), Titelblätter, Kolumnentitel oder für Typen von Textabschnitten (Kapitel, Widmung, Gruß, Index etc.). Zwar gibt es nur wenige Festlegungen hinsichtlich der Annotation, jedoch bieten die Editionsrichtlinien Anleitung zum Anlegen von Kommentaren sowie von einigen Spezialtextsorten. Folglich wird z. B. die existierende Vorlage für Gedichtauszeichnungen recht regelmäßig genutzt, i. e. werden Gedichte z. B. durch das <poem>-Tag als solche gekennzeichnet. Das Inventar an Auszeichnungen, welches die Wikisyntax bietet, wird bei der Textaufbereitung jedoch nicht immer ausgeschöpft; oftmals beschränkt es sich auf die Abbildung von Layouteigenschaften (werden z. B. Überschriften nicht eigens als solche gekennzeichnet o. ä.; z. B. 95_Thesen). Darüber hinaus ist es möglich, dass abhängig von individuellen Editionsrichtlinien Layoutmerkmale gegenüber der Vorlage ergänzt werden. So wurde in den Editionsrichtlinien zu Der_zerbrochne_Krug festgelegt, dass Sprecher entgegen der Vorlage fett wiedergegeben werden (Fig. 3).

18Überraschend ist, dass die Auszeichnungsrichtlinien selbst die Einheitlichkeit der Auszeichnung über Texte hinweg nicht einfordern, wenn etwa Kommentare der Wikisource-BearbeiterInnen nur dann als solche gekennzeichnet werden sollen, wenn es zusätzlich historische Anmerkungen in der Quelle gibt (Wikisource:Editionsrichtlinien).

19Die (behutsame) Kommentierung des Textes ebenso wie der Nachweis editorischer Eingriffe in den Text erfolgt seitenweise in Form eines Fußnotenapparats, der von einem ggf. vorhandenen Fußnotenapparat der Vorlage abgetrennt ist (Wikisource:Kommentieren).13

20Hinsichtlich der Textstrukturierung geht die Wikisource über die Möglichkeiten der klassischen Buchausgabe also kaum hinaus. Die Möglichkeiten des digitalen Mediums, in dem formale Beschränkungen wesentlich reduziert sind und der Fokus vielmehr auf inhaltlichen Auszeichnungen liegen kann, werden nicht ausgeschöpft. Dies ergibt sich zum einen aus der Wiki-Syntax, die wesentlich auf Aspekte der typographischen Textgestalt beschränkt ist, zum anderen aus dem Umstand, dass Quellen bisweilen seitenweise wiedergegeben werden, sodass eine Wikisource-Seite einer Buchseite im zugrundeliegenden Druck entspricht (z. B. Die_Gemälde-Galerie_des_Grafen_A._F._v._Schack, S. 20). Die Strukturierungen bleiben also zwar meist auf das Layout bezogen, folgen dabei aber einheitlichen Regeln, sodass das gewählte Markup die Konvertierung der vorhandenen Strukturen in andere (standardisierte) Formate wie z. B. XML ermöglicht. Für eine Konvertierung nach TEI-XML, welche das Potential dieses Formats zumindest grundlegend berücksichtigt (z. B. hierarchische <div>-Strukturen mit beinhaltet), wäre dann jedoch Nacharbeit hinsichtlich der nicht vorhandenen, insbesondere der inhaltlichen Strukturierungen nötig.14

Systematisierung

21Die Systematisierung der deutschsprachigen Wikisource wird im Folgenden genauer betrachtet, da dieser Bestandteil des Projekts einen wichtigen Einstiegspunkt und einen Zugang zu den Texten darstellt.

22Für den systematischen Einstieg werden sämtliche Texte mit Kategorien versehen. Diese ergeben sich vor allem aus Informationen zu 5-6 Facetten (Fachgebiet, Entstehungszeit und -ort, Sprache, Textgattung, [optional:] Herstellungsform) sowie darüber hinaus aus weiteren Informationen zu Thema, Bearbeitungsstand, u. a. Während unter den Facetten die Herstellungsform optional ist, sind alle anderen Facetten mit mindestens einem Wert zu befüllen. Für das Fachgebiet und die Textgattung sind außerdem Mehrfachzuordnungen möglich. Die Zuordnungen erfolgen jeweils im bottom-up-Prinzip, d.h. nicht jede mögliche Kategorie ist vorhanden, sondern andersherum gibt es keine Kategorien, denen nicht auch ein Text zugeordnet werden konnte. Somit muss die Systematik zwar so lange unvollständig bleiben, wie nicht aus jedem Bereich Texte akquiriert wurden, dafür bleibt sie aber immer eng rückgebunden an die Quellen und kann nicht zum Selbstzweck geraten.

Facette „Fachgebiet“

23Als Grundlage für die systematische Wahl eines Fachgebiets dient die Göttinger Online-Klassifikation,15 „ohne diese aber detailgetreu abzubilden“ (Anleitung_für_die_Kategorisierung). Diese Klassifikation umfasst insbesondere zeitgenössische Wissenschaftszweige und Sachgebiete ohne dezidiert historische Perspektive. Das heißt zum einen, dass die Fach- und Sachgebiete ohne Rücksicht auf ihre historische Entwicklung synchron nebeneinander stehen (z. B. Computing neben Mathematics, Maschinenbau neben Bergbau, Brettspiele neben Videospiele), zum anderen, dass bestimmte historische Wissensgebiete, die nicht mehr existieren, nicht realisiert sind (z. B. Alchemie). Darüber hinaus scheint die Klassifikation nicht immer ganz stimmig zu sein: So existiert eine Hauptkategorie „Sport“ mit Unterkategorie „Sportwissenschaft“, aber keine Hauptkategorie „Religion“ oder „Literatur“. Die Kategorie „Kunst“ enthält die Subklasse „Musikwissenschaft“, jedoch keine Subklassen „Literatur“ oder „Musik“.

24Es ist allerdings nicht von der Hand zu weisen, dass bislang keine vollständig in sich stimmige Klassifikation zu Textsorten und Fachgebieten existiert, die zudem in ihrem Umfang und ihren Ambiguitäten so beschränkt ist, dass sie im Kontext der Wikisource problemlos nachgenutzt werden könnte.16 Vielleicht könnte die Textsortenklassifikation der Arbeitsgemeinschaft Alte Drucke (AAD)17 hier mit in Betracht gezogen werden, die jedoch ihrerseits auch Unstimmigkeiten enthält.

25Unstimmigkeiten wie die genannten werden allerdings zum einen durch den bottom-up-Ansatz, zum anderen durch die gelegentliche Lösung von der zugrundegelegten Klassifikation in der Wikisource-Systematik teilweise aufgelöst. So werden etwa fehlende Kategorien wie „Musik“ als Hauptkategorie und „Waffenkunde“ als Subkategorie zur „Technik“ eingeführt. Die BearbeiterInnen sind dabei angehalten, solche ‚Neuzugänge‘ zunächst an geeigneter Stelle zur Diskussion zu stellen.18 Es bleiben jedoch auch in der resultierenden Wikisource-Systematik problematische Aspekte:

  • Wissenschaftszweig vs. Sachgebiet: Die wissenschaftlichen Disziplinen stehen gleichberechtigt neben Sachgebieten und interferieren teilweise mit diesen. So existieren die Hauptkategorien „Musik“ und „Darstellende Künste“, aber nicht die Hauptkategorie „Literatur“. Folglich wurde die Belletristik der Kategorie „Deutsche Philologie“ zugeordnet, was weniger das „Fachgebiet“ des jeweiligen Textes als vielmehr ein Nachnutzungsszenario beschreibt. Ähnliches gilt für die Kategorie „Kulturgeschichte“, die auch feuilletonistische Texte zu kulturellen Aspekten enthält (z. B. Ein_Töpfchen_Bier). Für die Belletristik wäre wohl eine Kategorie „Literatur“ oder „Schöne Literatur“ analog zu den o.g. Kategorien „Musik“ und „Darstellende Künste“ zu erwägen.
  • Zuordnung mindestens eines Fachgebiets: Die Bedingung (constraint), mindestens ein Fachgebiet zu vergeben, resultiert bisweilen in ungewöhnlichen Zuordnungen. So wurde ein Artikel der Gartenlaube zur „Bücher-Preisermäßigung“ mit den Kategorien „Sprach- und Literaturwissenschaft allgemein“ sowie „Geographie“ versehen (Bücher-Preisermäßigung). Auch andere Sachtexte werden Wissenschaften zugeordnet (z. B. der Reisebericht Aus_dem_Harz und der feuilletonistische Text Für_Die_im_Theater_und_Concert den „Bevölkerungs- und Sozialwissenschaften“), was wiederum eher im Bereich der intendierten Nachnutzung zu verorten ist. Da nicht sämtliche Themen und Sachgebiete durch die zugrundeliegende Systematik abgedeckt werden, wäre hier eventuell die Abschaffung dieser entsprechenden Bedingung zu erwägen.
  • Untergliederung: Dem Bottom-up-Ansatz scheint auch geschuldet, dass die Hauptkategorien unterschiedlich stark untergliedert sind. Eine vergleichsweise starke Differenzierung findet sich bei den Kategorien „Geschichte“, „Geowissenschaften“ und „Biologie>Zoologie“. Dagegen wurden die „Religionswissenschaften/Theologie“ sowie die „Rechtswissenschaft“ kaum untergliedert. Der „Theologie“ sind in der Göttinger Systematik sehr viele Unterkategorien zugeordnet, während sich in der Wikisource-Systematik nur die Subklassen „Aberglaube“ und „Israelitisch-jüdische Religion“ finden, sämtliche christlichen Predigten und Gebete hingegen z. B. allgemein unter Theologie eingeordnet sind. Hier wäre angesichts der Differenziertheit religiöser historischer Literatur eine feinere Untergliederung ratsam.

Facetten „Entstehungszeit“ und „Entstehungsort“

Fig. 4: Die alte Heidelberger Liederhandschrift (13. Jh.), hrsg. von Franz Pfeiffer. Stuttgart 1844 (=Bibliothek des Literarischen Vereins in Stuttgart IX). Digitale Volltext-Ausgabe bei Wikisource, URL: https://de.wikisource.org/w/index.php?title=Die_alte_Heidelberger_Liederhandsch… (Version vom 14.2.2012).

26Ab dem 18. Jh. soll bzgl. der Entstehungszeit eine genauere Unterteilung in Jahrzehnte vorgenommen werden.19 Faktisch wird dies auch bereits für die Texte des 17. Jhs. durchgeführt, und der Nutzer darf fragen, warum nicht für die gesamte Zeit ab dem Beginn des Buchdrucks eine solche Unterteilung sinnvoll wäre. Mit dem Buchdruck stieg bekanntlich auch die Buchproduktion stark an (vgl. z. B. Beutin u. a. 2001: 69). Gerade auch das 16. Jh. ist z. B. reich an Flugschriften und dabei durch historisch-politische Faktoren so stark geprägt und in sich gegliedert, dass eine genauere zeitliche Einordnung auch Einblicke in die geistesgeschichtliche Verortung eines Werks erlauben würden (vor-/nach-reformatorische Zeit, Zeit ab dem Schmalkaldischen Krieg, etc.).

27Ungewöhnlich ist bisweilen die zeitliche Einordnung der Werke. Die Metadaten sehen Felder für die Entstehungszeit und das Erscheinungsjahr der Texte vor. Somit können die Texte der Alten Heidelberger Liederhandschrift aus dem 12. Jahrhundert, die einer buchstabengetreuen Ausgabe des 19. Jhs. entnommen wurden, adäquat eingeordnet werden (Die_alte_Heidelberger_Liederhandschrift, 20 Fig. 4).

28Komplexere Sachverhalte lassen sich jedoch so nur schwer abbilden. Für das Drama „Der zerbrochene Krug“ (Der_zerbrochne_Krug) wurde eine Edition von 1997 digitalisiert, die sich auf die Druckausgabe von 1811 bezieht. Der Text entstand 1806. Die Metadaten geben nun die Jahre 1806 (Entstehungsdatum) und 1997 (Erscheinungsdatum) an, jedoch nicht das Jahr des Drucktextes, auf dem die Quellenausgabe eigentlich beruht, der hier also transkribiert wurde. Aus linguistischer Sicht wäre dies jedoch die relevanteste Angabe, denn sie gibt Auskunft über den Sprachstand, der in dem Text produziert wurde. Für die Edition der Goldenen Bulle in Frühneuhochdeutscher Sprache (Goldene_Bulle_(Frankfurter_Übersetzung)) wurde der ähnliche Fall innerhalb der Kategorie „Entstehungsdatum“ näher erläutert:

Entstehungsdatum: 1356, frühneuhochdeutsche Übersetzung spätestens vor Mai 1365 Erscheinungsdatum: 189721

29Weiterhin gibt es Texte mit einer vermeintlichen Entstehungszeit in vorchristlichen Jahrhunderten. Diese Datierungen beziehen sich jedoch auf die antiken Vorlagen späterer Übersetzungen (Goldene_Verse 22, Jannes_und_Mambres 23, Didos_Tod 24). Diese Eigentümlichkeit der Titel-Metadaten wird fortgeführt durch die „Kategorie:Entstehungszeit“, die noch zusätzliche solcher Zuordnungen beinhaltet und für den ersten Sucheinstieg über die Entstehungszeit ausgewertet wird (z. B. Aus_Shakespears_Much_ado_about_nothing). Eine Präzisierung, dass hier die Entstehungszeit der Vorlage gemeint ist, wäre vonnöten.

30Für die Angabe des Entstehungsorts werden die Grenzen der historischen Territorien (in vernünftigem Maß) mit einbezogen.25 So werden in der Kategorie „Historisches Territorium“ z. B. „DDR“, „Deutscher Bund“, „Deutsches Reich“, „Heiliges Römisches Reich“26 oder „Römisches Reich“ geführt. Was als „Entstehungsort“ übertitelt ist, gibt jedoch nicht immer den Ort der Entstehung eines Werks wieder, sondern bisweilen vielmehr den Ort der Entstehung einer ggf. anderssprachigen Vorlage, die in der Wikisource gar nicht wiedergegeben ist (Kópakonan 27), den Ort, über den in einem Text berichtet wird (Ein_Besuch_bei_dem_persischen_Hofe 28) oder der für ein Werk auf andere Weise wesentlich ist (Italische_Vignetten 29). Die Vorgabe für den Entstehungsort lautet zwar: „angegeben wird der Entstehungsort des Originals“.30 Diese Regel wurde jedoch in der konkreten Umsetzung aufgeweicht. Auch hier wäre eine größere Trennschärfe erfreulich; wenn dies nicht geleistet werden kann, müsste wohl für den Terminus des „Entstehungsorts“ eine allgemeinere Bezeichnung gefunden werden.

Facetten „Textgattung“ und „Herstellungsform“

31Interessant ist die Unterteilung der Facetten in „Gattung“, „Fachbereich“ und „Herstellungsform“. Dadurch wird die Problematik der Benennung von Textsorten mit alltagssprachlichen Textsortenbegriffen31 abgeschwächt, weil diese in dem übergeordneten Raster vorsortiert werden. Die Gattung „Plakat“ wäre allerdings wohl eher der „Herstellungsform“ als der „Textgattung“ zuzuordnen.32

32Gut nachvollziehbar ist auch die Regel, dass die Facetten „Fachbereich“ und „Gattung“ jeweils mehrfach vergeben werden können.33 Somit kann dem Fall der Textsortenmischung oder sonstigen Überschneidung von Kategorien problemlos begegnet werden, ohne dass Sammelkategorien neu eröffnet werden müssen. Fraglich ist, warum nicht auch bei der „Herstellungsform“ Mehrfachnennungen explizit erlaubt werden. Hier werden z. B. „Einblattdrucke“ und „Flugschriften“ benannt, die einander jedoch nicht ausschließen bzw. nicht streng voneinander abgrenzbar sind. Im Falle der „Zeitung“ und „Zeitschrift“ von einer Herstellungsform zu sprechen ist ungewöhnlich, aber wohl nicht abwegig. Besonders fragwürdig ist jedoch, warum die Facette der Herstellungsform nur gelegentlich vergeben werden soll und zwar:

Herstellungsform – Diese Facette ist optional. Diese Facette wird nur eingefügt, wenn auch die in Wikisource verwendete Textgrundlage einer der Herstellungsformen entspricht. So wird ein Brief, der uns im Original als Handschrift vorliegt in die Kategorie:Handschrift einsortiert. Würde uns derselbe Brief als Ausgabe in einem gedruckten Editionsband vorliegen, dann würde diese Facette nicht vergeben werden. (Anleitung_für_die_Kategorisierung)

Community-basiertes Arbeiten

Anreize für die Mitarbeit

33Wikisource lebt von einer Community an ehrenamtlich Engagierten, die Texte für die Allgemeinheit bereitstellen wollen. Um Interessierte zur Mitarbeit anzuregen, wird die Mitarbeit auf unterschiedliche Weisen intensiv unterstützt, werden Anreize geschaffen und der Ersteinstieg möglichst vereinfacht.

34So ist es möglich, eigene Transkriptionen in die Wikisource einzubringen und der Qualitätskontrolle durch die Community anheimzustellen sowie größere Projekte vorzuschlagen und durchzuführen. Der Motor hierbei ist das Prinzip der Gegenleistung: Für die Mithilfe anderer in den eigenen Projekten ist ein äquivalenter Umfang eigener Mithilfe in anderen Projekten gefordert.

35Der Neueinstieg in die Wikisource-Gemeinschaft wird erleichtert durch Schritt-für-Schritt-Anleitungen und umfangreiche Dokumentationen zu den einzelnen Aspekten der Textaufbereitung (Textauswahl und Editionskriterien, Kodierung der Metadaten und Textdaten, Kategorisierung, Interaktion mit der Wikisource-Community) sowie durch Vorlagen für bestimmte Kodierungen (z. B. Metadatensätze). Auf der „Spielwiese“ können neue Nutzer die Funktionalitäten der Wikisource für sich austesten. Eine Vielzahl an unterschiedlichen Diskussionsforen ermöglicht den Kontakt unter den MitarbeiterInnen, so etwa das „Skriptorium“, die „Technikwerkstatt“, die „Auskunft“ oder die Option eigener Diskussionsseiten auf allen Wikisource-Seiten. Selbst ein eigener Chat-Kanal wurde eingerichtet. Interessant sind darüber hinaus die „Korrekturen des Monats“ bzw. „Projekte des Monats“, die eine Anregung darstellen, wo Engagement nützlich und nötig wäre.34

36Das Dickicht der Dokumentations- und Hilfeseiten ist vielleicht auf den ersten Blick schwer zu durchschauen und selbstkritisch wird von der „(mitunter mangelhaften) Vernetzung“ gesprochen (Wikisource:FAQ). Jedoch sind die Hilfeseiten damit so umfassend, dass kaum eine Frage zum allgemeinen Procedere offen bleibt. Der Nutzer, der sich bereitwillig auf dieses Angebot einlässt, wird in beispielhafter Weise umfassend informiert und mit vertretbarem Aufwand in die Lage versetzt, selbständig an dem Projekt mitzuarbeiten. Orientierung innerhalb der Hilfeseiten bieten zudem verschiedene Überblicksseiten, z. B. auch die FAQs.

Fig. 5: Wilhelm Heinrich Kolster: Geschichte Dithmarschens. Nach F. C. Dahlmanns Vorlesungen im Winter 1826. Wilhem Mauke, Leipzig 1873, Seite 77. Digitale Volltext-Ausgabe bei Wikisource, URL: https://de.wikisource.org/w/index.php?title=Seite:Geschichte_Dithmarschens_Kols… (aufgerufen am 2.2.2018)

37Die Texte können in einer Korrekturumgebung bearbeitet werden, die Text und Bild nebeneinander stellt (Fig. 5). Der Bearbeitungsstand ist jeweils deutlich über die Projektseite erkennbar. Doppelt korrekturgelesene (i. e. fertig bearbeitete) Texte werden gegenüber nicht angemeldeten und neuen Benutzern für die Bearbeitung gesperrt. Durch die Schlichtheit der Wiki-Syntax wird das schnelle Erlernen der Kodierung von Wikisource-Texten ermöglicht, was für diese Form des Community-basierten Arbeitens sicher wesentlich ist.

Qualitätssicherung

38Die Qualitätssicherung wird, wie bereits erwähnt, für die Textdaten sehr ernst genommen. Das Verfahren der doppelten Korrektur, das Vorhandensein allgemeiner Editionskriterien und ein etabliertes Verfahren bei der Dokumentation werkspezifischer Aufbereitungsrichtlinien ermöglichen die hohe Qualität der transkribierten Texte.

39Wünschenswert wären entsprechende, stärkere Kontrollinstanzen bei den Metadaten inkl. der Kategorisierungen, denn die Metadaten sind als Ersteinstieg zu den Quellen kaum zu überschätzen. Hier kommt es zwischen den Quellen zu Uneinheitlichkeiten und Unsicherheiten bei der Vergabe von Kategorien, was die Filterung nach Texten fehleranfällig macht. Stellenweise wären Schärfungen der Definition von Metadatenfeldern oder deren weitere Ausdifferenzierung zu überlegen (s. oben). Angemessen wäre außerdem auch hier vielleicht das Verfahren der doppelten Korrektur.

Nutzung und Nachnutzung

Lizensierung

40Die Texte der Wikisource werden erfreulicherweise sämtlich unter freien Lizenzen (GFDL, CC-BY, CC-BY-SA) oder als gemeinfreies Material angeboten. Somit wird die Nachnutzung nicht oder kaum eingeschränkt.

Fig. 6: Heinrich von Kleist: Der zerbrochne Krug. Berlin: Realschulbuchhandlung Reimer, 1811. Startseite und Leseansicht der digitalen Volltext-Ausgabe bei Wikisource, URL: https://de.wikisource.org/w/index.php?title=Der_zerbrochne_Krug&oldid=3087366 (Version vom 28.1.2018).

41Über die Dokumentationsseiten wird zudem ein Bewusstsein für lizenzrechtlich angemessene Vorlagen geschaffen. Die bereitgestellten Quellen oder Quelleneditionen sollten gemeinfrei oder frei lizensiert sein. Die Aufnahme geschützter Texte unter freier Lizenz bedarf der Vorabdiskussion. Auch Bildmaterial, das in das Angebot eingebunden wird, soll hinsichtlich der Bildrechte überprüft werden.

Zugänglichkeit und Nutzung über die Plattform

42Jedes Werk bzw. jeder Teiltext in größeren Werken ist auf einer eigenen Seite repräsentiert. Sie enthält eine Leseansicht sowie die Metadaten. Ihr zugeordnet ist eine Indexseite mit einer Übersicht zu sämtlichen Unterseiten und weiteren Informationen. Über die Leseansicht wird jeweils die Text-Bild-Ansicht einer Seite verlinkt, welche die Überprüfung der Transkription ermöglicht und außerdem zur Korrekturumgebung führt (Fig. 6).

43Eingebettet in die Texte sind oftmals Abbildungen, welche den Textfluss auflockern sollen:

Wikisource möchte nicht nur riesige langweilige Textwüsten liefern, die kein Mensch lesen mag. Daher ist es ausdrücklich erwünscht, die Quellentexte, aber auch die Autoren-, Orts- und Themenseiten mit multimedialen Inhalten anzureichern. (Wikisource:Über_Wikisource)

Tatsächlich ergibt sich auf diese Weise ein angenehmes Erscheinungsbild der Texte.

44Ungewöhnlich ist, dass die URLs der Subseiten eines Werkes nicht regelmäßig sein müssen. So ist die Hauptseite der Schedelschen Weltchronik unter der Kennung Schedel’sche_Weltchronik35 erreichbar, die „abgeleiteten Seiten“ heißen jedoch dann: Die_Schedelsche_Weltchronik_(deutsch):[Seitenzahl].36 Zur Hauptseite

Curieuse_und_sehr_wunderbare_Relation,_von_denen_sich_neuer_Dingen_in_Servien_erzeigenden_Blut-Saugern_oder_Vampyrs

wurden Unterseiten mit Zahlen-Kennung vergeben, z. B.:

Seite:75-705460E_001.jpg

Die Leseansicht zu

Seite:Der_zerbrochene_Krug_(Kleist)_008.jpg.

findet sich unter der Kennung

Der_zerbrochne_Krug,

der auch die Indexseite folgt:

Index: Der_zerbrochne_Krug.

45Die Kennungen zu Werken können in ihrer Zusammensetzung und Länge stark variieren. Die festgelegten Namenskonventionen scheinen hier nicht immer zugrunde gelegt worden zu sein (Wikisource:Namenskonventionen). Als Kennungen können (nahezu) ungekürzte historische Titel dienen, z. B.:

Vertrag_nach_entstandenem_Auflauf_zwischen_dem_Rathe_zu_Schweinfurt_an_einem,_und_dann_der_Gemeinde_daselbst_andern_theils_durch_derselben_Reichsamptmann_und_andere_verordnete_Kaiserliche_Commissarien_aufgericht,

ebenso wie rekonstruierte ausführliche Titelangaben, z. B.:

Die_vier_Rheinischen_Kurfürsten_und_Herzog_(Kurfürst)_Rudolf_III_von_Sachsen_verbünden_sich_zur_Wahl_eines_neuen_Römischen_Königs,

gekürzte historische Titel, z. B.:

Von_abtuhung_der_Bylder,

oder „Populartitel“, z. B:

95_Thesen.37

Fig. 7: Martin Luther: 95 Thesen. Hans Lufft, Wittenberg 1557, Seite 9v. Digitale Volltext-Ausgabe bei Wikisource, URL: https://de.wikisource.org/w/index.php?title=Seite:95_Thesen.pdf/1&oldid=2825529 (Version vom 14.5.2016).

46Hilfreich sind allerdings die Empfehlungen zur Zitierweise am Schluss jeder Seite zu einem Werk (Fig. 7). Allerdings sind sie leider nicht immer vollständig, etwa im Falle von Stücken aus Sammelwerken oder Zeitschriften,38 oder sie können ganz fehlen (z. B. Max_und_Moritz).

47Die Nutzung der Texte auf der Wikisource-Seite wird erleichtert durch Seiten zum systematischen Einstieg, welche aufgrund von Metadaten-Informationen generiert sind. Hierbei ist der Einstieg über Themen, Autoren, Orte, Textsorten etc. möglich (Näheres s. oben). Darüber hinaus wird eine Volltextsuche angeboten, die auf verschiedene Weisen anpassbar und über jede Seite erreichbar ist. Interessant und hilfreich ist in diesem Zusammenhang auch das Angebot PetScan,39 das eine leicht bedienbare Oberfläche für die Recherche u. a. in der deutschsprachigen Wikisource anbietet. Im Gegensatz zum systematischen Einstieg auf der Wikisource-Seite, der die Filterung nach jeweils genau einer Kategorie ermöglicht, können mit PetScan-Kategorien in Kombination abgefragt werden, sowohl in Koexistenz (X UND Y) als auch einander ausschließend (X ABER NICHT Y).40 Für jede Abfrage wird eine PID erzeugt, mittels derer die Abfrage auch später abgerufen werden kann.41

48Für die Zitation von Werken und Seiten der Wikisource wird für jede Webseite der Plattform eine Versionshistorie erstellt, auf die jederzeit zurückgegriffen werden kann. Die Zitation kann also für eine ganz bestimmte Version erfolgen. Die jeweiligen URLs enthalten die eindeutige Versionsnummer, die somit persistent identifiziert werden kann.

Download und Nachnutzung

49Für jede Seite ist ein Download in verschiedenen Formaten (als PDF, EPUB, HTML, ad hoc Druckversion) möglich. Dabei kann z. B. das annotierte HTML für eine Transformation in andere Formate zugrundegelegt werden, sodass die Annotationen aus der Wikisyntax auch im Download weiter transportiert werden. Schön wäre zusätzlich die Möglichkeit, ein komplettes Werk in Wikisyntax direkt herunterzuladen. Jedes Werk („multi-part item“) kann darüber hinaus mithilfe der Funktion „Buch erstellen“ per Mausklick in Gänze als komfortabel lesbares PDF oder reine Textdatei erstellt werden (diese Funktion wird momentan überarbeitet). Leider fehlen beiden Formaten ebenso wie dem PDF-Download der Seite Angaben zu den Metadaten. Die EPUB-Fassung enthält zwar einen Hinweis auf die Wikisource sowie einige Titelinformationen, jedoch ebenfalls nicht die vollständigen Metadaten.

50Eine eigene OAI-Schnittstelle für die Metadaten wurde seinerzeit diskutiert, jedoch bislang offenbar nicht umgesetzt (Wikisource:Metadaten, Abschnitt: #OAI-Schnittstelle). Über die Wikimedia sind außerdem regelmäßige Datenbank-Dumps unterschiedlichen Umfangs erhältlich (aktuelle Versionen aller Wikisource-Seiten, Versionshistorien, nur Titelseiten, Statistiken, etc.), welche zweimal monatlich erzeugt werden.42

Fazit

51Begutachtet wurde hier ein umfangreiches Projekt, das sich im Prinzip aus vielerlei individuellen Projekten zusammensetzt, für die sich viele Freiwillige engagieren. Es ist bei dieser Konstellation schwierig, ein umfassendes i. S. v. vollständiges Bild des Projekts zu präsentieren. Vielmehr bleiben die begutachteten Stücke Stichproben und die angeführten Stellen Auszüge und Beispiele aus einem weit umfassenderen Konvolut an Texten.

52Dieses Bild spricht einerseits gegen die Rezensierbarkeit dieses Projekts: Fehler bleiben oftmals individuell, Inkonsistenzen sind einer gewissen Freiheit der Bearbeiter geschuldet, die auch dem Wunsch entspricht, Bearbeiter zu finden und weiter zu motivieren. Der Kritiker wäre im Übrigen jederzeit selbst aufgerufen, durch eigenes Engagement zur Verbesserung der Kritikpunkte beizutragen.

53Die Leistung des Projekts ist zudem unverkennbar und uneingeschränkt zu konstatieren: Eine große Menge hochwertiger Transkriptionen historischer Texte werden jedermann (der Wissenschaft ebenso wie der Allgemeinheit) zur freien Nutzung und Nachnutzung zur Verfügung gestellt.

54Die wissenschaftliche Nachnutzung, die explizit intendiert ist, unterliegt je nach Ausrichtung jedoch einigen Einschränkungen. Während die qualitative Arbeit mit den Einzeltexten über die Wikisource-Plattform und deren Zitation sehr gut unterstützt wird, erscheinen für die quantitative Nutzung der Wikisource-Daten oder die Nachnutzung der Textdaten in anderen Projektkontexten gerade die erwähnten Inkonsistenzen problematisch: Zwar wurden für die einzelnen Schritte der Textausgabe (Wahl von Vorlagen, Gestaltung der Transkription etc.) jeweils Richtlinien angeboten, die Orientierung bieten. Diese sind allerdings recht breit aufgestellt und lassen vergleichsweise viel Raum für individuelle Ausformungen, was einerseits die Texterfassung erleichtert, andererseits die Einheitlichkeit der Texte beeinträchtigt. Die Nutzer sind daher genötigt, jeden nachgenutzten Text hinsichtlich seiner Vorlagen, Metadaten, Transkriptions- und Annotationsspezifika etc. individuell zu prüfen.

55Die wissenschaftliche Weiterverwendung der Daten außerhalb der Wikisource-Plattform wird ‚out-of-the-box‘ wohl für die wenigsten Anwendungen möglich sein. Dazu fehlt es auch an wissenschaftlichen Standards (sowohl bei der Text- als auch bei der Metadatenauszeichnung), ggf. an einer wissenschaftlich fundierten Textauswahl und Einschränkung des Materials sowie jedenfalls an einer übergeordneten Kontroll- und Vereinheitlichungsinstanz, die die Einhaltung der Richtlinien und folglich die Homogenität der Sammlung sicherstellt. Hier muss der Nachnutzung eine Evaluation und ggf. Vereinheitlichung der Daten durch die NutzerInnen selbst vorangestellt werden.

56Es wäre also zu überlegen, ob das Projekt der Wissenschaft weiter entgegenkommen könnte, z. B. durch die Generierung standardisierter Formate, durch verfeinerte Auszeichnungsrichtlinien, besonders aber im Bereich der Metadaten durch die Etablierung einer zusätzlichen Kontrollinstanz sowie eventuell auch durch die Einführung differenzierterer Kategorisierungen. Im Prinzip stellt sich aber die Frage, ob sich die Wikisource am Ziel der wissenschaftlichen Fundiertheit nicht überhebt. Vielleicht wäre es auch für die Wikisource-Community selbst hilfreicher, sich dem Ziel der hohen Textqualität zu verpflichten, ohne Wissenschaftlichkeit zu verlangen, die teilweise von (philologischen und editionswissenschaftlichen) Laien erbracht werden müsste. Gerade für Texte älterer Sprachstufen werden hier große Hürden aufgebaut, die das Projekt angesichts seiner Grundkonstellation kaum nehmen kann. Auch fehlt dabei der Anschluss an den editionswissenschaftlichen Diskurs.

57Die Nachnutzung bestehender Texte ist jedoch nur ein Aspekt dieses Projekts. Viel wesentlicher ist vielleicht, dass hier eine Infrastruktur bereitsteht, die es jedem, auch WissenschaftlerInnen, ermöglicht, die für die eigenen Interessen wichtigen Texte zusammen mit einer Community hochwertig aufzubereiten. Der persönliche Erfolg ist dabei abhängig von dem, was der bzw. die Nutzende an die Community zurückzugeben bereit ist. Die Ergebnisse sind bereits jetzt bemerkenswert gut und könnten durch das Engagement weiterer Freiwilliger noch weiter verbessert werden. Darüber hinaus könnten bereits im Rahmen wissenschaftlicher Projekte entstandene Texttranskriptionen über die Wikisource-Plattform verfügbar gemacht werden, wodurch nicht allein die Sammlung weiter bereichert würde, sondern auch die digitalisierten Werke weiter gestreut und sichtbar werden könnten.

Anmerkungen

1. Verweise auf Seiten der Wikisource werden im Folgenden durch die entsprechenden Seiten-Identifizierer angegeben. In der Form: https://de.wikipedia.org/w/index.php?title=[Seiten-Identifizierer] ergibt sich die jeweils zugehörige URL (hier: https://de.wikipedia.org/w/index.php?title=Die_Gartenlaube). Für genauere bibliographische Nachweise und permanente Links zur genutzten Version s. unten: Wikisource-Quellen.
2. Deutsches Textarchiv: http://www.deutschestextarchiv.de/; Projekt Gutenberg: http://gutenberg.spiegel.de, http://www.projekt.gutenberg.de/; Digitale Bibliothek bei TextGrid: https://textgrid.de/digitale-bibliothek; Zeno.org: http://www.zeno.org.
3. Vgl. die Empfehlung, die Werke mit multimedialen Inhalten anzureichern, um „nicht nur riesige langweilige Textwüsten [zu] liefern“(Wikisource:Über_Wikisource).
4. Vgl. Wikisource_Diskussion:Projekte, Abschnitt: #Regel_f.C3.BCr_neue_Projekte.
5. Hier verwendet im korpuslinguistischen Sinne eines „opportunistischen“ Korpus, i. e. „ein Korpus, welches ohne vorher festgelegte Designprinzipien danach zusammengestellt wird, welche Texte gerade verfügbar sind“, (Lemnitzer/Zinsmeister 2010: 189).
6. „[…] the best opportunistic corpus is also the one that is documented in the most comprehensive way.“ (Teubert/Cermakova 2007: 70). Die Autoren schließen hier die Dokumentation von Genres, Wissensbereichen und Textsorten ein, aber auch andere Metadaten wie Publikationsdatum, Autor, Titel und andere bibliographische Informationen (ebd.).
7. Vgl. Wikisource:Systematik, Abschnitt: #Sprache.
8. „Herkunft“ umfasst eigentlich „Übergeordnetes Werk (Werkausgabe, Sammelband, Gedichtsammlung, Quellensammlung, Zeitschrift etc.) dem der Text entnommen wurde, inklusive der vollständigen bibliografischen Angaben und der Seitenzahlen, wo der Text in diesem übergeordneten Werk zu finden ist“, und enthält folglich eigentlich die Angabe eines übergeordneten Sammelbandtitels o. ä. (vgl. Hans_im_Glück_(1837)).
9. Im Kontext der Gestaltung der Hilfeseiten wird folglich auch auf „vergleichsweise wenige Aktive“ hingewiesen, „die lieber Texte erfassen oder korrigieren statt Hilfeseiten gestalten“ (Wikisource:FAQ).
10. Vgl. Wikisource_Diskussion:Projekte, Version vom 23.8.2017: https://de.wikisource.org/w/index.php?title=Der_Ackermann_aus_Böhmen.
11. Der Terminus „Annotation“ bezieht sich hier und im Folgenden auf Markup (z. B. von Layout- und logischen Strukturen), das an den Text bzw. Untereinheiten des Textes angebracht wird.
12. Schon länger wird aus vielerlei Richtungen von der TEI als De-facto-Standard für die Aufbereitung digitaler Texte gesprochen, vgl. z. B. Sahle 2013: 314, Pierazzo/Stokes 2010: 397, Mauritsch/Koch 2013: 262.
13. Für eine Kommentierung seitens der Wikisource-Herausgeber vgl. Dienstanweisung_an_Angehörige_der_Spezialeinheit_des_MfS_innerhalb_der_Grenztruppen_der_DDR_(Schießbefehl).
14. Vgl. die „P5: Guidelines for Electronic Text Encoding and Interchange” der Text Encoding Initiative, Kap. 4: Default Text Structure (http://www.tei-c.org/release/doc/tei-p5-doc/en/html/DS.html) und Kap. 3: Elements available in all TEI documents (http://www.tei-c.org/release/doc/tei-p5-doc/en/html/CO.html).
15. Göttinger Online-Klassifikation: https://www.sub.uni-goettingen.de/goettinger-online-klassifikation/.
16. Offen bleibt bislang auch die Frage, ob sich eine solche umfassende Klassifikation überhaupt realisieren ließe, vgl. z. B. von linguistischer Seite Stede 34-36.
17. AAD Gattungs- und Sachbegriffe: http://aad.gbv.de/empfehlung/aad_gattung.pdf.
18. „Im Zweifelsfall oder bei Unsicherheit sollten neue Unter-Kategorien auf der Seite Diskussionsseite des Systematischen Einstiegs zur Diskussion gestellt werden.“ (Wikisource_Diskussion:Systematik)
19. Vgl. Wikisource:Systematik, Abschnitt: #Entstehungszeit.
20. Die Wahl dieser Ausgabe von Franz Pfeiffer ist hier zu begrüßen, hält er sich doch zumindest in Bezug auf den Text (nicht das Layout) eng an die zugrundeliegende Kleine Heidelberger Liederhandschrift (cpg 357); vgl. auch Schweikle1995: 64. Da die Handschrift selbst nun vollständig digitalisiert vorliegt (urn:nbn:de:bsz:16-diglit-1645), würde sich eventuell auch die Verknüpfung mit dem Original anbieten.
21. Dieser Text lässt sich dennoch nicht unbesehen als frühneuhochdeutscher Text des 14. Jhs. nutzen, da das Vorwort aus dem 19. Jh. hier aus nachvollziehbaren Gründen mit übernommen wurde.
22. Vgl. Goldene_Verse: „Entstehungsdatum: 6. Jh. v. Chr.
Erscheinungsdatum: 1862
Kategorie: 6. Jahrhundert v. Chr.“
23. Vgl. Jannes_und_Mambres: „Entstehungsdatum: 1. Jahrhundert n. Chr.
Erscheinungsdatum: 1928
Kategorie: 1. Jahrhundert“
24. Vgl. Didos_Tod: „Erscheinungsdatum: 1792
Kategorie: 1. Jahrhundert v. Chr.“
25. Vgl. Wikisource:Systematik, Abschnitt: #Entstehungsort.
26. Korrekter müsste wohl vom „Heiligen Römischen Reich Deutscher Nation“ gesprochen werden.
27. Vgl. Kópakonan mit Kategorie „Faröer“: Hier wird der ursprünglich isländische Text der Vorlage nicht transkribiert, sondern in neuhochdeutscher Sprache (Übersetzung von 2007) wiedergegeben.
28. Vgl. Ein_Besuch_bei_dem_persischen_Hofe: Hier geht es um einen Bericht über den persischen Hof in der Zeitschrift „Das Ausland“, der mit der Kategorie „Iran“ getaggt ist.
29. Vgl. Italische_Vignetten: Es handelt sich um deutsche Gedichte des 19. Jhs., welche mit der Kategorie „Italien“ versehen wurden.
30. Vgl. Wikisource:Systematik, Abschnitt: #Entstehungsort.
31. Vgl. dazu z. B. Meier 2007: 140, Stede 2007: 35.
32. Vgl. Wikisource:Systematik, Abschnitt: #Textgattung.
33. Vgl. Anleitung_für_die_Kategorisierung, Abschnitt: #Regeln_für_die_Kategorisierung_von_Texten.
34. Referenzierte Seiten in diesem Absatz: Einstieg zu den Hilfeseiten: Wikisource:Hilfe; Spielwiese: Wikisource:Spielwiese; Skriptorium: Wikisource:Skriptorium; Technikwerkstatt: Wikisource:Technikwerkstatt; Auskunft: Wikisource:Auskunft; Chat: Wikisource:Chat; Frequently Asked Questions: Wikisource:FAQ; Korrekturen des Monats: Wikisource:Korrekturen_des_Monats; Projekte des Monats: Vorlage:Reviewtext.
35. Vgl. https://de.wikisource.org/wiki/Schedel%E2%80%99sche_Weltchronik.
36. Z. B. https://de.wikisource.org/w/index.php?title=Schedel’sche_Weltchronik&oldid=2115… (Version vom 30. November 2013)
37. Zur Bezeichnung „Populartitel“ vgl. ebd. (https://de.wikisource.org/wiki/95_Thesen): Untertitel.
38. Z. B. fehlt die Angabe des Heftes bei Artikeln der Zeitschrift „Die Gartenlaube“, vgl. etwa Seite:Die_Gartenlaube_(1853)_151.jpg.
39. Die Verlinkungen Wikisource:Systematik/Abfragen sind offenbar veraltet (Fehler 403).
40. Bsp.: Finde alle Flugschriften der 1630er Jahre in der Wikisource: https://petscan.wmflabs.org/?psid=1235184.
41. Bsp.: Abfrage nach Texten der deutschsprachigen Wikisource mit Kategorie „14. Jahrhundert“, aber ohne die Kategorie „Latein“: https://petscan.wmflabs.org/?psid=1235161.
42. Vgl. https://dumps.wikimedia.org/dewikisource/. Es wäre eventuell zu überlegen, diese Seite von der Wikisource-Hauptseite aus zu verlinken.

Bibliographie

Wikisource-Quellen

    Forschungsliteratur

  • Beutin, Wolfgang/Klaus Ehlert/Wolfgang Emmerich/Christine Kanz/Bernd Lutz/Volker Meid/Michael Opitz/Carola Opitz-Wiemers/Ralf Schnell/Peter Stein/Inge Stephan: Deutsche Literaturgeschichte. Von den Anfängen bis zur Gegenwart. Sechste, verbesserte und erweiterte Auflage mit 524 Abbildungen. Stuttgart/Weimar 2001.
  • Koch, Monika/Peter Mauritsch: Marmor, Stein und Eisen bricht – Abklatsche leider auch. Alte und neue Wege der Langzeitarchivierung am Beispiel der Epigraphischen Sammlung Graz. In: Florian M. Müller (Hg.), Archäologische Universitätsmuseen und -sammlungen im Spannungsfeld von Forschung, Lehre und Öffentlichkeit. Münster, 2013, S. 255-266.
  • Lemnitzer, Lothar/Heike Zinsmeister: Korpuslinguistik. Eine Einführung. 2., durchgesehene und aktualisierte Auflage, Tübingen: Narr, 2010.
  • Meier, Jörg: Gebrauchsgrammatiken und Sprachratgeber des 16. Jahrhunderts. In: Peter Wiesinger (Hrsg.): Textsorten und Textallianzen vom 16. bis zum 18. Jahrhundert. Beiträge zum Internationalen Sprachwissenschaftlichen Symposion in Wien vom 22. bis 24. September 2005. Berlin 2007 (=Berliner Sprachwissenschaftliche Studien 8), S. 129-146.
  • Pierazzo, Elena/Peter A. Stokes: Putting the Text back into Context: A Codicological Approach to Manuscript Transcription. In: Kodikologie und Paläographie im Digitalen Zeitalter 2/Codicology and Paleography in the Digital Age 2, hrsg. v. Franz Fischer, Christiane Fritze, Georg Vogeler (Schriften des Instituts für Dokumentologie und Editorik 3), Norderstedt 2010, S. 396-430.
  • Sahle, Patrick: Digitale Editionsformen: Textbegriffe und Recodierung. Teil 3: Textbegriffe und Recodierung. Norderstedt 2013. (Schriften des Instituts für Dokumentologie und Editorik 9).
  • Stede, Manfred: Korpusgestützte Textanalyse. Grundzüge der Ebenen-orientierten Textlinguistik. Tübingen 2007.
  • Teubert, Wolfgang/Anna Čermáková: Corpus Linguistics. A Short Introduction. London: Athenaeum, 2007.