So lassen sich Internetdaten mit der WebClient-Klasse migrieren

Bei Bildern bietet sich das Herunterladen der kompletten Datei an. Dagegen interessiert bei Webseiten vielleicht eher der Textinhalt. Dieser Vorgang wird häufig als „Screen Scraping“ bezeichnet. Die Methode OpenRead der WebClient-Klasse ermöglicht den Zugriff auf die Inhalte einer Datei über ein Stream-Objekt. Dieses lässt sich dann in eine Datei abspeichern. Je nach Anforderung kann man aber auch mit seinen Inhalten arbeiten.

Das folgende Beispiel greift auf die TechRepublic-Homepage in Textform zu und zeigt jeweils eine Zeile an. Der Code überspringt leere Zeilen der Seite. Er fügt außerdem HTTP-Header zu der Datei-Anfrage hinzu. Standardmäßig umfasst der Dateizugriff über die WebClient-Klasse keine HTTP-Header. Allerdings können manche Websites Header verlangen, so dass eine Anfrage sich identifizieren muss. Die Headers-Eigenschaft der WebClient-Klasse umfasst eine Add-Methode für das Hinzufügen von Header-Informationen zur Anfrage.


Hier der entsprechende Code in VB.NET:


Bleibt anzumerken, dass der andere Ansatz für den Zugriff auf Webdaten ein Byte-Array umfasst. Der folgende Beispielcode zeigt, wie dieses zur Anzeige der Inhalte einer Webseite eingesetzt wird. Die im Namensraum System.Text befindliche Encoding-Klasse wird verwendet, um die von den Seitendaten benutzte Kodierung über das Byte-Array-Objekt festzulegen.


Der entsprechende VB.NET-Code sieht so aus:


Welche Aspekte des .NET-Framework sind Ihnen in letzter Zeit bei der Arbeit an einem Projekt besonders aufgefallen? Teilen Sie doch Ihre Gedanken und Erfahrungen im Forum mit.

Themenseiten: Anwendungsentwicklung, Software

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu So lassen sich Internetdaten mit der WebClient-Klasse migrieren

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *