Titel


Titelseite

Inhalt Teil I

Inhalt Teil II


Anhang L4 - URL-Konventionen

(Anhang zu Kapitel 5, Abschnitt 5.2)
(Datei url_konv.doc in der Benutzer-Dokumentation)


BGBM-Homepage
URL-Konvention: Problem der Sonderzeichen und Umlaute bei Verzeichnis- und Dateinamen

Autor: Dörthe Hildebrandt


Sonderzeichen dürfen nicht in URL´s enthalten sein bzw. besitzen dort eine andere Bedeutung !

Insbesondere sind das die folgenden Zeichen: # % & / : < > ? ” sowie Leerzeichen und Umlaute (das Fragezeichen wird z.B. beim Script-Aufruf zur Parameterübergabe verwendet: script.pl?parameter).

Das bedeutet:
  1. Der Datei- oder Verzeichnisname darf
    • die folgenden Zeichen enthalten:
      Ziffern 0-9, Großbuchstaben A-Z und Kleinbuchstaben a-z, Dollar-Zeichen $, Bindestrich -, Unterstrich _ , Punkt . und Plus +
    • ein langer Dateiname sein.
    • Umlaute Ä, ä, Ö, ö, Ü, ü und ß (sowie weitere nicht unter 2. genannte Sonderzeichen) enthalten.
      aber: Diese müssen aber für die URL-Angabe durch besondere URL-Ersatzzeichen ersetzt werden, damit sie richtig als Teil des URL interpretiert werden können (sie dazu weiter unten).
  2. Der Datei- oder Verzeichnisname darf nicht
    • Leerzeichen enthalten.
      Anstelle der Leerzeichen verwendet man üblicherweise das Pluszeichen + , z.B. \Walter+G+Berendsohn. Dieses wird bei der automatischen Erstellung von Listen (wie z.B. der Mitarbeiterliste oder der Liste zu den Pflanzen des Jahres) durch ein Script für die Anzeige im Browser automatisch entfernt. (Es wurde festgelegt, bei den Verzeichnissen für die Mitarbeiter die Punkte bei den Namenskürzeln o.ä. sowie alle Titel wegzulassen).
    • eines der folgenden Zeichen enthalten: # % & / : < > ? ”

URL-Ersatzzeichen

Umlaute müssen z.B. im URL-Aufruf kodiert mittels URL-Ersatzzeichen angegeben werden. Diese Ersatzzeichen bestehen aus dem Prozentzeichen % und einem zwei Zeichen umfassenden Hexadezimal-Code aus dem Standard ASCII-Zeichensatz. Hier die wichtigsten Zeichen-Kodierungen:

  • Ä = %C4 (196)
  • ä = %E4 (228)
  • Ö = %D6 (214)
  • ö = %F6 (246)
  • Ü = %DC (220)
  • ü = %FC (252)
  • ß = %DF (223)
  • é = %E9 (232)
  • á = %E1 (225)

Die Buchstaben können groß oder klein geschrieben werden, d.h. %df bedeutet dasselbe wie %DF. Die Zahlen in Klammern sind die (dezimalen) Code-Positionen des ISO-8859-1 (Latin-1)-Zeichensatzes (werden z.B. in HTML mit &#xxx; - Notation geschrieben, z.B. ü =&#252;). Bei den automatisch erstellten Listen übernimmt diese Kodierung ein Script. Erstellen Sie selbst aber neue HTML-Dateien mit einem Namen, der Umlaute enthält, müssen Sie in der Fußzeile der Vorlage die Angabe *DATEINAME* durch den Dateinamen in kodierter Form ersetzen.

Beispiele

1. Sie erstellen eine neue Datei zum Thema Blume des Jahres mit dem Namen:
/BGBM/PR/Pflanzen/Blume+des+Jahres/
1999+Gänseblümchen+-+Lateinischer+Name.htm

Die URL-Angabe in der HTML-Seite sieht dann so aus:
http://www.bgbm.org/BGBM/PR/Pflanzen/Blume+des+Jahres/
1999+G%E4nsebl%FCmchen+-+Lateinischer+Name.htm

In der automatischen Liste der Pflanzen des Jahres steht dann unter Blumen die Zeile:
1999 Gänseblümchen - Lateinischer Name

2. Ihr persönliches Mitarbeiterverzeichnis heißt:
/BGBM/STAFF/Tech/Dörthe+Hildebrandt

Die URL-Angabe in der HTML-Seite (und auf der Visitenkarte) sieht dann so aus:
http://www.bgbm.org/BGBM/
STAFF/Tech/D%F6rthe+Hildebrandt

In der automatischen Mitarbeiterliste steht dann die Zeile:
Dörthe Hildebrandt

Druckt ein Mensch irgendwo auf der Welt eine solche HTML-Seite aus, so kann er durch das Eintippen genau dieser in der Fußzeile angegebenen kodierten URL in einen Browser (Open Location) die Seite wieder aufrufen (falls er sie nicht als Bookmark gespeichert hatte). Tippt man dagegen eine URL mit Umlauten ein, erscheint eine Fehlermeldung beim Aufrufer. Solche Fehlermeldungen sollte man tunlichst vermeiden, will man sich nicht den daraufhin entstehenden und verständlichen Ärger der Aufrufer zuziehen. Das macht einen schlechten Eindruck (Image !), und die betreffenden Leute werden keinen weiteren Versuch unternehmen, sich Ihre Seite anzuschauen.

Sie müssen in Ihrer URL immer die enthaltenen Zeichen überprüfen und diese ggf. mit der auf der vorigen Seite angegebenen %-Notation kodieren, bevor Sie Ihre Seite weltweit zugänglich machen !

Seitenanfang