Das Internet und seine Dienste

Einführung in DV und digitale Medien
Dr. Martin Warnke

Themen

  1. Relevanz, Entstehung und Charakteristika des Internet
  2. Funktionsweise des Internet
  3. Der Dienst TELNET
  4. Der Dienst FTP
  5. Der Dienst E-Mail
  6. Der Dienst World-Wide-Web
  7. weitere

Relevanz, Entstehung und Charakteristika des Internet

Von 4 auf 30.000.000 in 18 Jahren:

Internet Host Count 2004:

 

Trends:

Es entwickelt zum zentralen Kommunikationsmedium auch im Wirtschafts-, Wissenschafts- und Kulturbetrieb.

Die Industrie arbeitet daran, eine Integration von Radio, Fernsehen und Tageszeitung auf Grundlage des Internet zu etablieren.

Was man leicht an den Unausgegorenheiten sieht.

Grundlagen des Internet (Entstehung, Protokoll, Zugang)

Das Internet ist ein weltumspannendes Netz, in dem sich lokale Computernetzwerke zusammengeschlossen haben: ein Netz von Netzen. Akteure sind stattliche Einrichtungen (ursprünglich das US-amerikanische Department of Defense), Hochschulen, Firmen, mittlerweile auch Privatleute.

Motive für die Entwicklung des Vorläufers des Internet, des Arpanet, waren der Wunsch nach:

Die technischen Merkmale, die immer noch nachwirken, sind

1969 entstand das Arpanet: erste telnet- und ftp-Sitzungen

Funktionsweise des Internet

1973/74 wurde das tcp/ip-Protokoll normiert und damit die Vereinbarung getroffen, die allen Rechnern, die sich daran halten, die Internet-Nutzung ermöglicht. TCP/IP ist die Normung der Kommunikationskonventionen zwischen Rechnern unterschiedlicher Hersteller.

ip: normiert die Adressierung von Rechnern und die Aufteilung des Datenstroms in Pakete, die über unterschiedliche Wege den Empfänger erreichen können. Die Paketgröße beträgt max. 64 kByte. Jedes Paket enthält unter anderem auch die Sender- und Empfängeradresse. Ein Paket kann weiter fragmentiert (zerstückelt) sein. Jedes Stück enthält seine laufende Nummer, kann also wieder richtig eingeordnet werden.

Damit paßt sich das Protokoll an verschiedene Netzwerktypen an. Es gibt eine Angabe über das "Verfallsdatum" eines Fragments: wird es zu lange herumgereicht, wird es gelöscht. Der Absender wird davon unterrichtet.

tcp: gaukelt den Internet-Anwendungen (Diensten) einen permanenten Datenstrom zwischen zwei Teilnehmern vor, eine Verbindung, die in Wirklichkeit nicht existiert. Von Paketen merkt man nichts mehr, es gibt Sicherung der Übertragung und Empfangsquittungen sowie geregelten Auf- und Abbau von Verbindungen. tcp benutzt dazu ip.

Es entstseht so eine Punkt-zu-Punkt-Kommunikation über verschiedene Netzwerktypen, dabei aber ohne Direktverbindung, sondern durch Versand von Paketen über wechselnde Netzknoten (Router).

Jeder Router (Relaisstation) benutzt Tabellen, die angeben, an welche alternativen anderen Router ein Paket an eine bestimmte Adresse weiterzuleiten ist. Wegen der Alternativen können so Netzüberlastungen und -ausfälle ausgeglichen werden.

Resultierende Merkmale des Internet sind:

tcp/ip kann auf erschiedenen Netzwerktypen (-protokollen) funktionieren

Die Infrastruktur des Internet besteht aus den Netzverbindungen und den Routern, den Servern und den Clients. Die Topologie und Topographie der Netzverbindunbg läßt sich visualisieren:

http://www.cybergeography.org/atlas/atlas.html

Welt-Infrastruktur v. uunet

Netz-Infrastruktur in den USA

NSF-Backbones seit Mitte der 80er: 45 MBit/sec , jetzt 622 Mb/s

http://www.uu.net/lang.en/network/

Deutschland

DFN-Verein bietet pauschalierten Zugang (WIN)

Haupttrassen haben eine Bandbreite von 1000 MB/s

Internationale Anbindung

TEN 155 (Europa)

Es gibt keine zentrale Administration, nur Verwaltung der IP-Nummern über das NIC (Network Information Center) und Namens-Verwaltung über Network Solutions. Inc., die durch ICANN abgelöst werden soll, eine gemeinnützige Einrichtung.

Netztechnik

Kosten

Hochschulen und andere öffentliche Einrichtungen zahlen pauschale Fixkosten für einen Anschluß einer bestimmten Qualität. In 2002:

Personal- sowie Hard- und Softwarekosten tragen typischerweise die Rechenzentren. Für Privatleute erledigen das kommerzielle Internet-Provider, die wechselnde Gebühren nehmen: Telekom, Arcor, … . Der Internet-Zugang über Call-by-Call-Wählverbindungen ist oft schon in den Telefongebühren enthalten (ca. 4 Pfg./Minute). Ansonsten kostet ein Internet-Anschluß mit Web-Space und E-Mail-Adressen einige 10 DM/Monat.

Im lokalen Netz gibt es Hosts (Gastgeber), die Dienste zur Verfügung stellen.

Jeder Dienst wird von einem Programmpaket erledigt, den man Server nennt, etwa für eMail, ftp, telnet, WWW. Ein Host kann mehrere Server beherbergen.

Ein Nutzer ist ein Client. Er hat seinen Rechner irgendwo auf der Welt und muß einerseits den gewünschten Server finden, andererseits sich selbst ausweisen können.

Adressierung von Internet-Teilnehmern

tcp/ip-Nummern sind so aufgebaut: ###.###.###.###

wobei ### eine ganze Zahl zwischen 0 und 255 darstellt.

Bsp.: 193.174.46.24

IP-Nummern-Gruppen werden zu Netzen unterschiedlicher Größen-Klassen zusammengefaßt: Class A, B oder C-Netze: große, mittlere oder kleine Netze

Class A: 1. Zifferngruppe identifiziert das Netz, der Rest den Rechner: 16 Mio Rechner

Class B: zwei Zifferngruppen identifieren das Netz, der Rest den Rechner: 65.535 Rechner.

Class C: drei Zifferngruppen identifizieren das Netz, die letzte den Rechner: 255 Rechner

Namen (Domain Name Service, DNS)

Der Domain Name Service ist ein erster Dienst auf dem Internet. Seine Server identifizieren Namen mit Nummern, so daß man meist mit Namen arbeiten kann

Beispiele

top-level-domains

Unter-domains stehen links vom top-level (Hierarchie)

Bei E-Mail steht links vom @ die Benutzerkennung.

Für jede Domain-Ebene gibt es Name-Server, die ein Verzeichnis der untergeordneten Domains bzw. Benutzer führen oder Adressen anderer Name-Server besitzen, die spezielle Verzeichnisse führen.

Mit TraceRoute vorführen

Warum skaliert das Internet so gut (kann es die enorme Steigerung der Nutzerzahlen verkraften)?

Anwendungen (Dienste auf TCP/IP)

telnet

TELNET ermöglicht durch Nutzung des Internet den Anschluß eines Terminals an einen Großrechner. Es erfolgt keine Verarbeitung der Daten, sondern lediglich die Steuerung eines entfernten Rechners. Tastaturbefehle werden an den Rechner weitergeleitet, die Bildschirmanzeige kommt zurück.

Alle Rechenprozesse laufen auf dem entfernten Rechner, der eigene Rechner hat nur die Simulation eines Standard-Terminals (VT 100 normalerweise) zu bewerkstelligen. Alles sieht aus wie in guten (schlechten?) alten Zeiten, als es noch keine graphischen Benutzungsoberflächen gab.

Warum macht man das?

Telnet ist die einfachste Methode, einen Rechner für die Benutzung aus der Entfernung verfügbar zu machen: Anstatt eines Kabels vom Zentralrechner zum Terminal gibt es das Internet. Eine besondere Aufbereitung der Daten und Programme für die Internet-Nutzung ist nicht erforderlich, alles kann auf dem Zentralrechner laufen wie gewohnt. Damit ist die Nutzung von Datenbeständen und Programmen aus Zeiten vor dem Internet-Boom möglich: vor allen von Online-Bibliotheks-Catalogen (OPACs).

Wie macht man das?

Man startet eine TELNET-Anwendung und folge den Anweisungen auf dem Bildschirm.

Normalerweise muß man eine Kennung eingeben.

Das Betriebssystem des angewählten Rechners ist meistens UNIX. Hacker-Angriffe werden meist über telnet gemacht.

OPACs (Online Public Access Catalogues)

Bsp.:

open opac.uni-lueneburg.de

ftp

… ermöglicht über das Internet die Auswahl und das Kopieren von Dateien von Rechner zu Rechner. Es erfolgt keine Verarbeitung der Daten, lediglich Transfer.

Dieser Dienst ist weitestgehend bereits in die Web-Browser integriert (s.u.).

Mit dem File Transfer Protocol lassen sich dafür präparierte Festplatten-Verzeichnisse durchstöbern und Dateien von einem Rechner auf den anderen transportieren.

Die wichtigsten FTP-Kommandos:

z.B.: ftp.uni-lueneburg.de

z.B.: anonymous oder guest

oder als registrierter user

z.B. E-Mail-Adresse bei anonymem ftp (s.u.)

z.B.: pub

anonymous ftp (aFTP): Zugriff für jeden. Username ist "anonymous" (typischerweise), Paßwort ist die eigene E-Mail-Adresse.

Packen und Entpacken

Dateien auf ftp-Servern liegen oft komprimiert und gepackt vor, müssen nach dem Download entpackt werden.

E-Mail

Electronic Mail ermöglicht Versandt und Empfang von Texten und angehängten Dateien. Dieser Dienst ist einer der beliebtesten und ältesten.

Eine E-Mail besteht aus Header und Body:

Der Header umfaßt

Der Body enthält den eigentlichen Text der Mail, z.B.:

Es findet manchmal statt das Sonderzeichenmassacker: nur die ersten sieben Bit der acht Bit eines Byte, das ein Zeichen kodiert, sind vom E-MailProtokoll genormt (7-Bit-ASCII). Diese mit den ersten sieben Bit kodierbaren Zeichen umfassen nicht die Sonderzeichen, die außerhalb des Englischen verwendet werden: äüß u.s.w.

Daher ist nicht klar, wie ein Zeichen, das acht Bit zu seiner Kodierung benötigt, am anderen Ende der E-Mail-Übertragung ankommt. Also haben sich viele E-Mailer angewöhnt, Sonderzeichen nicht zu benutzen, sondern

Schoene Gruesse aus Lueneburg

zu schicken.

Mail-Attachments

Man kann ganze Dateien in Form von Attachments einer Mail beifügen. Dabei werden die acht Bit jedes Byte der Datei bitweise nach verschiedenen Verfahren in 7-Bit-ASCII eingebettet, so daß auch wirklich alle Bits richtig übertragen werden.

Die gängigsten Verfahren heißen

Falls es zu Übertragungsfehlern bei Attachments kommt, liegt das meist daran, daß Absender und Empfänger nicht dasselbe Verfahren verwenden. Das muß dann per Mail ausgehandelt und bei beiden Partnern richtig eingestellt werden.

WWW

Entstehung und Grundeigenschaften des WWW

Das WWW mit seinem Protokoll HTTP (HyperText Transfer Protocol) war bei seiner Erfindung 1989 ursprünglich gedacht als Dokumentationswerkzeug für die Entwicklung von Hochenergie- (Elementarteilchen-) Versuchanordnungen am CERN in Genf. Teile der Dokumentationen sollten unabhängig voneinander entstehen können und dennoch leicht zu einem Ganzen verknüpfbar sein: dabei stand die Hypertext-Idee Pate, also eine nur noch am Computer schreib- und lesbare Textform mit Querverweisen, denen der Rechner bei Auslösen automatisch nachgeht.

Die WWW-Dokumente besitzen Anker (Absprungstellen, entsprechen Fußnotenzeichen), die mit der Maus anwählbar sind. Wird ein Anker angeklickt, so wird das entsprechende Objekt von dem Server geholt, auf dem es liegt, nicht typischerweise derselbe Server, von dem der Anker kommt. So geht es weiter: auch das angeforderte Objekt wird wieder Anker besitzen, die auf Objekte zeigen, die auf weiteren Servern liegen.

Beispiel

Jeder Rechnertyp kann einen für ihn optimalen Client benutzen: je nach Rechnerplattform gibt es die möglichen Formatierungstechniken, die der Rechner bereitstellt (unterschiedliche Zeichensätze oder nur Einrückung, Farben oder nur Numerierung, …).

Es wird im wesentlichen die Struktur des Dokuments festgelegt, nicht das Layout.

Bestandteile des WWW

URLs

URLs bestehen aus den Zeichenketten, die auf WWW-Objekte zeigen, sie adressieren: Menüpunkte, Texte, Bilder, …

Bsp.: http://info.cern.ch/hypertext/WWW/TheProject.html

Anfangs wird das Protokoll bezeichnet (hier http), danach steht die Internet-Adresse nach üblichem Schema, dann weiter die Kette von Verweisen, ähnlich wie beim Verzeichnispfad einer Datei.

Auch ftp-Server lassen sich so adressieren:

ftp://info.cern.ch/hypertext/WWW/TheProjekt.html

Der Präfix http oder ftp z.B. legt fest, wie die Referenz aufzufassen ist. Der adressierte Server interpretiert dann die Zeichenkette, die hinter seiner Adresse steht, als Verweis auf ein Objekt, möglicherweise auf einem anderen Server. Bei ftp müßte die Zeichenkette als Serveradresse und Dateipfad interpretiert werden.

HTTP

Über dieses Protokoll verständigen sich Client und Server zunächst, welche Dateiformate vom Client interpretierbar sind, nur diese sendet der Server. HTTP setzt mindestens voraus, daß Text, Hypertext und Graphiken interpretierbar sind. Andere Formate können zwischen Servern und Clients vereinbart werden, ohne deshalb unbedingt ein weltweiter Standard zu sein.

Unter http wird die Verbindung nur solange aufrechterhalten, wie die Bearbeitung der aktuellen Anfrage dauert. Das ist günstig, weil oft die nächste Anfrage an einen anderen Server gerichtet ist, die auch direkt vom Client aus abgehen kann.

HTML

HTML ist das Format, in dem die Hypertext-Strukturen beschrieben werden.

Unter der Randbedingung, daß diese prinzipiell von jedem Rechnertyp interpretierbar sein müssen, können sie sich nur auf den niedrigsten gemeinsamen Standard stützen, den alle Rechner interpretieren können: 7-Bit-ASCII

Strukturen sind etwa die Einteilung in Überschriften, Unter-Überschriften, Textkörper, Listen, Hypertext-Anker, …) Sie werden durch ASCII-Zeichen codiert (markiert).

Bsp.: HTML-Quelltext dieses Dokuments: man wähle unter "Ansicht" "Seitenquelltext".

WWW-Browser

Browser sind Programme, mit denen man html-Dokumente anfordern und ansehen kann. Sie sind die "Clients" (user agents), die den Dienst vom "Server" abfordern.

Bsp.: Netscape Navigator, Microsoft Internet Explorer

Java

HTML-Dokumente sind statisch, sie sind keine Programme, die auf Benutzereingaben reagieren können.

Eine höhere Programmiersprache, die dieselbe plattform-übergreifende Gültigkeit hat wie html ist "Java". Java-Programme werden in html-Seiten aufgerufen und dann von einem Server auf den Rechner geladen und ausgeführt, auf dem das html-Dokument angezeigt wird.

Recherche im WWW

Das WWW besteht 1999 etwa aus mehreren TeraByte (10 hoch 12 oder 1 Million Millionen) Byte, deren Standorte und Inhalte sich ständig ändern. Nur durch automatische und halbautomatische Verschlagwortung kann man hier noch finden, was man sucht.

Es gibt daher Suchmaschinen, die eine Volltextindizierung vornehmen, und Kataloge, die menschliche Redakteure beschäftigen, die Webseiten kategorisieren.

Eine bekannte Suchmaschine ist www.google.com mit dem deutschen Ableger .de, www.altavista.com/ mit dem deutschen Ableger … .de, ein bekannter Katalog ist www.yahoo.com, wieder mit dem Ableger … .de

Eine interessante Suchmaschine ist Vivisimo, die Suchergebnisse geordent anzeigt.

Meta-Suchmaschinen listen Suchmaschinen auf und werten sie teilweise parallel aus.

Beispiele hierfür sind

Weitere Dienste

news

- ermöglicht Teilhabe an weltweit verfügbaren Anschlagbrettern: Anheften von Mitteilungen, Lesen aller angehefteten Mitteilungen, thematisch gruppiert.

chat

- sind Schwatzecken, in denen man virtuell mit anderen textuell verkehren kann.

Internet-Telefonie (Voice over IP, VoIP)

- ermöglicht das Führen von Telefonaten über das WWW. Hier sind dann nur die Telefongebühren bis zum Internet-Provider zu zahlen.

Internet-Teleconferencing

- überträgt zusätzlich ein kleines von einer WebCam aufgenommenes Bild.

Zum Thema "Bugs und Viren" geht es hier.