Literaturaufbereitung 03 – Grundlagen zur Umsetzung von Texten

Die hauptsächliche Arbeit stellt die Adaption von Texten dar.
Für die Anpassung ist entscheidend, für welche Nutzergruppe die Dokumente überarbeitet werden sollen.

Grundlagen: Programme und Tools

In der Vergangenheit waren viele Programme und Makros notwendig, um zum Beispiel den Inhalt eines PDF-Dokumentes aufzubereiten.
Die wichtigsten Programme heute sind:

  • LibreOffice (Writer & Draw) für die Erstellung der Dokumente und tastbaren Grafiken
  • LaTeX (TeXLive oder MikTeX samt Editor)
  • Gimp oder ein anderes Fotobearbeitungsprogramm für kontrastreichere Bilder
  • Inkscape (optional zur besseren Vektorisierung)
  • Texterkennung (Omnipage oder Abbyy Finereader)
  • notwendige Blindenschriftarten für taktile Grafiken

Für Blinde

Ziel ist es, aus dem Ausgangsmaterial eine Word-Datei im .doc-Format zu erstellen.

Warum eine .doc-Datei?
Blinde Nutzer können sich über Tastenkombinationen strukturierte Informationen ausgeben lassen. Zudem können nicht alle Screenreader gut mit .docx umgehen.

Extrahieren von Text aus Originaldokument

Microsoft Word Vorlage (.doc)

Liegt das Dokument im .doc-Format vor, kann sofort mit der Umsetzung begonnen werden.

Gescannte Vorlage (JPG, BMP, gescannte PDFs)

Hier muss OCR verwendet werden, um Text zu extrahieren.

Elektronisch erstelltes PDF

Kann direkt mit Tools wie dem ACCESS@KIT PDF-Konverter extrahiert werden.
Bei Zeichenkodierungsproblemen sollte die Datei in LibreOffice mit Unicode (UTF‑8) geöffnet werden.

Originaldokument ist eine LaTeX-Datei

Zwei Wege sind möglich:

  1. TeX-Datei öffnen, LaTeX-Code entfernen, als Text speichern
  2. TeX in PDF umwandeln und OCR bzw. Textextraktion nutzen

Umsetzen des erhaltenen Textes

Folgende Punkte sind wichtig:

  1. XML-Tags
    Strukturierungselemente wie <box>, <seite>, etc. werden genutzt.
  2. Schriftstil „Standard“
    Formatierungen werden mit Tags umgesetzt:
    fett<f> fett </f>
    kursiv<k> kursiv </k>
    unterstrichen → <u> unterstrichen </u>
  3. Korrektur lesen
    OCR-Fehler und falsche Umbrüche müssen bereinigt werden.
  4. Seitenzahlen einfügen
    Beispiel:
   <seite>12</seite>
  1. Sprungmarken/Überschriften
    Mit Formatvorlagen definieren.
  2. Kein Inhaltsverzeichnis in LibreOffice
    Dies verursacht Screenreader-Probleme.
  3. Keine Kopf- oder Fußzeilen
  4. Fußnoten
    Beispiel:
   <fußnote> *: Erklärung </fußnote>
  1. Bilder und Grafiken
    Umsetzung erfolgt separat.
  2. Boxen
    Beispiel:
   <box> Inhalt </box>
  1. Anmerkungen
    Beispiel:
   <anmerkung> Hinweis </anmerkung>
  1. Auflistungen
    Listen sollen klar strukturiert sein.
  2. Tabellen
    Tabellen benötigen <tabelle>-Tags und dürfen keine leeren Felder enthalten.
  3. Tabulatoren vermeiden
  4. Formeln und Sonderzeichen
    Formeln werden in LaTeX-Schreibweise in Dollarzeichen gesetzt:
   $c^2=\sqrt{a}\cdot b\leq d$
  1. URLs
    Werden als Hyperlinks mit <url>-Tag gesetzt.
  2. Fachspezifisches (Code, UML, Petri-Netze)
    Beispiel:
   <code>
   ...
   </code>
  1. Lückentext
    Mit _..._ und <lückentext>-Tag.

Abspeichern der fertigen Umsetzung

Namenskonventionen

Beispiel:
LA1-Übung4.doc

Dateiformat

Als Word 97–2003 (.doc) speichern.

Hochladen der umgesetzten Dokumente

Das Dokument wird in BSCW in den Ordner fertig hochgeladen.
Eine E-Mail an den Studierenden und material@access.kit.edu ist notwendig.

Umsetzungsbeispiele

Beispiele verschiedener Vorlesungen zeigen typische Umsetzungen, u. a. Codebeispiele, Listen, Seiten-Tags und Anmerkungen.

Für Sehbehinderte

Ziel ist eine individuelle Anpassung des Dokuments. Wichtige Punkte:

  • Schriftart Arial
  • Schriftgröße nach Bedarf, oft 16 pt
  • Hervorhebungen beibehalten
  • Bilder kontrastreich aufbereiten
  • Linksbündig ausrichten
  • Hoch-/Tiefstellung in normaler Schriftgröße

Abspeichern

Wie bei der Umsetzung für Blinde.

Hochladen

Wie zuvor beschrieben.

Ziel: Barrierefreie PDF

Langfristig soll ein Dokument entstehen, das für Blinde, Sehbehinderte und Sehende gleichermaßen geeignet ist.
Dazu gehören:

  • konfigurierbare Schriftgrößen
  • kontrastreiche oder beschreibende Bildvarianten
  • anpassbare Anzeigeoptionen

Eine vollständige Automatisierung ist schwierig, aber ein modularer Aufbau wäre ein realistisches Ziel.

Nach oben scrollen