Universität Koblenz-Landau
Platzhalter
 
[Hauptdokument]
[Inhalt]
[Glossar]
[Links]
[Literatur]
 
Baustelle
Platzhalter Rund ums Web: Version 1.0 vom 12. Juli 2000, Autor: Andreas Pidde
 
Bottom

Uniform Resource Locator (URL)

Der Uniform Resource Locator (URL) ist eine Zeichenfolge, die eine vereinheitlichte explizite Zugriffsanweisung zu einer Ressource im Internet angibt. Die Zugriffsanweisung ist transient, d.h. die referenzierte Resource muss im Augenblick nicht unbedingt durch die Zugriffsanweisung ansprechbar sein.

Es gibt absolute und zu dem URL eines Basisdokuments relative URLs. Da der URL den Zugriffspfad zu einer Ressource (z.B. einer Datei) enthält, wird der URL oft als Adresse bezeichnet. Anwendung finden absolute URLs u.a. als Eingabe in die Adress-Eingabezeile eines Web-Browsers, um die adressierte Ressource anzusprechen. In einem HTML-Dokument können absolute und relative URLs als Ziele von Hyper-Links angegeben werden.

Der Aufbau des URLs leitet sich aus der generischen generischen Syntax für Unified Resource Identifier (URI) ab. Spezifiziert ist die Syntax in dem [RFC 3986]. Dieses Dokument ersetzt die spezielleren RFCs über absolute URLs [RFC 1738] und relative URLs [RFC 1808]. Weitere UR* Terme sind Uniform Resource Names (URNs) und Uniform Resource Characteristics (URCs). URCs sind in RFC 3986 noch nicht erwähnt.

Ein URL setzt sich aus dem Schema (besagt, wie auf eine Ressource zugegriffen werden soll), gefolgt von einem Doppelpunkt und dem schemaspezifischen Teil zusammen. Der schemenspezifische Teil ist jeweils nur für den Dienst von Bedeutung, der mit dem jeweiligen Schema verbunden ist. Es ist durchaus möglich, dass eine Ressource mehrere URLs besitzt. Zum einen kann eine Ressource durch Spiegelung physikalisch an mehreren Stellen zu finden sein, zum anderen kann sie durch unterschiedliche Protokolle, angegeben durch den Schema-Namen, angesprochen werden. Bsp.: Eine Datei kann durch http und ftp referenziert werden.

Ganz allgemein ist ein URL also als <schema>:<schemaspezifischer Teil> aufgebaut. Ein URL Muster mit derzeit gängigen Teilausdruck-Typen sieht so aus:

<scheme>://<user>:<password>@<host>:<port>/<path>?<query>;<argument>=<value>&<argument>=<value>#<fragment>

Die Teilausdrücke sind je nach Schema anwendbar und zum größten Teil optional. Die Schemata aus RFC 1738 sind in der folgenden Tabelle zusammengefasst. In diesem RFC ist auch die Syntax der URLs in der Backus Naur Form (BNF) beschrieben. Weitere Schemata können jederzeit registriert werden.

Schema Bezeichnung Schemaspezifische Angaben
ftp File Transfer Protocol Benutzername, Kennwort, FTP-Hostname, Port, Zugriffspfad, Typcode
gopher Das Gopher Protokoll Gopher-Server, Portnummer, Pfad (Gopher wird kaum noch unterstützt)
http Hypertext Transfer Protocol Web-Hostname, Port, Zugriffspfad, Anfrage, Fragment
mailto E-Mail Adresse E-Mail Adresse, Argument-Wert-Paare, Beispiel-Muster: "mailto:<mailaddr>?subject=<subject>&cc=<mailaddr>"
news USENET news Newsgroup-Artikel oder News-Gruppen
nntp USENET news mit Network News Transfer Protocol Host-Name, Portnummer, Newsgruppe, Artikel in dieser Gruppe
prospero Prospero Host-Name, Portnummer, Host-spezifisches Objekt, Feld, Wert
telnet Für interaktive Sitzungen Benutzername, Kennwort, Host-Name, Portnummer
wais Wide Area Information Servers Hostname, Portnummer, Datenbank, Abfrage
file Host-spezifische Dateipfade Host-Name, Dateipfad auf diesem Host
Tab. 1: Schema-Namen

Das bekannteste Schema ist das für den HTTP-Zugriff zum Anfordern von Web-Seiten. Der Schema Name ist http, gefolgt von dem Doppelpunkt und zwei Schrägstrichen, einem Servernamen (<host>) mit optionaler Portnummer (:<port>), einem weiteren Schrägstrich und einem Zugriffspfad (<path>). Der Zugriffspfad ist der Pfad zu einer Datei oder zu einem Verzeichnis und kann auch leer sein, optional können zusätzliche Anfrage für z.B. CGI-Skripte (?<query>) oder ein Fragment (#<fragment>) folgen. Die Pfadangaben der URL werden vom Web-Server ausgewertet, die Queries z.B. vom CGI-Skript, Fragmente hingegen erst vom Web-Client.

http://<host>:<port>/<path>
http://<host>:<port>/<path>?<query>
http://<host>:<port>/<path>#<fragment>

Beispiele für HTTP-URLs:

  • "http://www.uni-koblenz-landau.de:80/", URL mit explizitem Port (80 ist Standard)
  • "http://141.26.64.18/index_extern.html", URL mit HTML-Datei, Hostname in der numerischen Form
  • "http://www.w3.org/Addressing/", URL mit Verzeichnisnamen
  • "http://www.uni-koblenz.de/%7epidde/lupe/url.html#Links", URL mit Fragment/Anker (Textstelle innerhalb eines HTML-Dokuments, die Tilde ('~') wurde im Hexazimal-Code '%7e' angegeben)
  • "http://www.ucc.ie/cgi-bin/acronym?url", URL mit Abfrage - wird einem CGI-Skript als Argument übergeben, sucht in diesem Fall den vollen Namen zum Acronym url.

Falls Sie eigene Dateien ins Web stellen, sollten Sie darauf achten, dass Ihre Pfadangaben nur Kleinbuchstaben, Zahlen und evtl. noch den Unterstrich ('_') enthalten. Umlaute und Sonderzeichen führen zu Problemen bei nicht-deutschen Tastaturen, sind auch zum Teil nicht zugelassen (wenn nicht ASCII). Einige Zeichen können zudem eine spezielle Bedeutung als Trenner haben. Das Prozent ('%') leitet eine zweistellige Code-Sequenz ein, mit der der ASCII Code eines Zeichens als Oktett (8-Bit Zahl) hexadezimal eingegeben werden kann. Trennzeichen verlieren dann ihre spezielle Bedeutung. Leerzeichen (%20) sollten Sie generell nicht verwenden. Die Tilde ('~') ist zwar auch ein Sonderzeichen, hat sich aber für Basisverzeichnisse eingebürgert. Da an Stelle eines Zeichens auch die zweistellige Hexadezimal-Codierung verwendet werden darf, kann statt der Tilde der Code '%7e' verwendet werden - z.B. wenn die Tilde auf der Tastatur fehlt.

Web-Browser können normalerweise auch etwas mit ftp-URLs anfangen. Unterstützt wird das anonyme Anmelden als Benutzer anonymous, optional mit E-Mail Adresse als Kennwort (meist zum Herunterladen von Dateien) und die Anmeldung mit einem bestimmten Benutzernamen (z.B. zum Übertragen der eigenen Web-Seiten an einen Datei-Server) via File Transfer protocol (FTP). Ein Eingabemuster einer solchen URL sieht dann so aus:

ftp://<user>:<password>@<host>:<port>/<path>;type=<typecode>

Benutzername und Kennwort (<user>:<password>@ und :<password>), Portnummer (:<port>, Standard ist 21) und Typ (;type=<typecode>) Teilausdrücke sind optional, der Zugriffspfad (/<path>) kann leer sein. Sie werden vom Web-Client normalerweise sinnvoll ergänzt. Speziell das Kennwort (password) sollte außer bei der anonymen Anmeldung aus Sicherheitsgründen tunlichst nicht explizit in einer URL aufgeführt werden. Web-Browser fragen das Kennwort bei Bedarf ab. Allerdings wird das Kennwort in diesem Fall anschließend unverschlüsselt durchs Internet geschickt.

Relative URLs entsprechen in etwa den bekannten relativen Pfadangaben in Dateipfaden. Sie können in Hyperlinks in HTML-Dokumenten verwendet werden. Hat das aktuelle Dokument den URL "http://www.uni-koblenz.de/~pidde/lupe/url.html" dann verweist der relative URL "../index.html" auf die Ressource in einer Verzeichnisebene höher: "http://www.uni-koblenz.de/~pidde/index.html". Der relative URL "images/internet.gif" verweist auf die Ressource "http://www.uni-koblenz.de/~pidde/lupe/images/internet.gif". Ein Fragment "#Links" schließlich verweist auf die Verknüpfungsliste im gleichen Dokument. Das Schema http bleibt erhalten. Durch die Verwendung von relativen URLs, wird es möglich, zusammenhängende Web-Dokumente unabhängig von Ihrer absoluten Adresse zu gestalten. Für das ftp-Schema und file-Schema gilt ähnliches. Nicht mit allen Schemata lassen sich relative URLs bilden (Bsp.: mailto).

Anm.: Die URLs werden normalerweise anwendungsspezifisch ausgewertet. Nicht jeder Browser interpretiert jeden URL-Typ und die, die er interpretiert auch nicht unbedingt vollständig. Beim Microsoft Internet Explorer wird zum Beispiel beim Schema telnet nur der Rechnername ausgewertet und eine externe Applikation gestartet. Wird ein URL nicht vollständig eingegeben, versuchen Web-Browser normalerweise das Beste aus der Eingabe zu machen, bevor sie einen Fehler melden. Sie ergänzen beispielsweise nicht vollständige URLs. Normalerweise werten Browser die URL-Schematas: http, ftp, file, mailto, news, nntp und evtl. noch gopher und telnet aus.

Top Bottom

Verknüpfungsliste

Top Bottom

Weiterführende Links

Top
 

© 2000 Andreas Pidde, pidde@uni-koblenz.de
[Zu meiner Homepage]
Erstellt mit:
Ulli Meybohm's HTML Editor
Baustelle
 
[Hauptdokument]
[Inhalt]
[Glossar]
[Links]
[Literatur]
 
Platzhalter
Valid HTML 4.0!