So lassen sich Internetdaten mit der WebClient-Klasse migrieren

Bei Bildern bietet sich das Herunterladen der kompletten Datei an. Dagegen interessiert bei Webseiten vielleicht eher der Textinhalt. Dieser Vorgang wird häufig als „Screen Scraping“ bezeichnet. Die Methode OpenRead der WebClient-Klasse ermöglicht den Zugriff auf die Inhalte einer Datei über ein Stream-Objekt. Dieses lässt sich dann in eine Datei abspeichern. Je nach Anforderung kann man aber auch mit seinen Inhalten arbeiten.

Das folgende Beispiel greift auf die TechRepublic-Homepage in Textform zu und zeigt jeweils eine Zeile an. Der Code überspringt leere Zeilen der Seite. Er fügt außerdem HTTP-Header zu der Datei-Anfrage hinzu. Standardmäßig umfasst der Dateizugriff über die WebClient-Klasse keine HTTP-Header. Allerdings können manche Websites Header verlangen, so dass eine Anfrage sich identifizieren muss. Die Headers-Eigenschaft der WebClient-Klasse umfasst eine Add-Methode für das Hinzufügen von Header-Informationen zur Anfrage.

Hier der entsprechende Code in VB.NET:

Bleibt anzumerken, dass der andere Ansatz für den Zugriff auf Webdaten ein Byte-Array umfasst. Der folgende Beispielcode zeigt, wie dieses zur Anzeige der Inhalte einer Webseite eingesetzt wird. Die im Namensraum System.Text befindliche Encoding-Klasse wird verwendet, um die von den Seitendaten benutzte Kodierung über das Byte-Array-Objekt festzulegen.

Der entsprechende VB.NET-Code sieht so aus:

Welche Aspekte des .NET-Framework sind Ihnen in letzter Zeit bei der Arbeit an einem Projekt besonders aufgefallen? Teilen Sie doch Ihre Gedanken und Erfahrungen im Forum mit.

Page: 1 2 3

ZDNet.de Redaktion

Recent Posts

Google stopft schwerwiegende Sicherheitslöcher in Chrome 124

Zwei Use-after-free-Bugs stecken in Picture In Picture und der WebGPU-Implementierung Dawn. Betroffen sind Chrome für…

6 Tagen ago

Studie: 91 Prozent der Ransomware-Opfer zahlen Lösegeld

Die durchschnittliche Lösegeldzahlung liegt bei 2,5 Millionen Dollar. Acht Prozent der Befragten zählten 2023 mehr…

6 Tagen ago

DMA: EU stuft auch Apples iPadOS als Gatekeeper ein

Eine neue Analyse der EU-Kommission sieht vor allem eine hohe Verbreitung von iPadOS bei Business-Nutzern.…

6 Tagen ago

Chips bescheren Samsung deutlichen Gewinnzuwachs

Das operative Ergebnis wächst um fast 6 Billionen Won auf 6,64 Billionen Won. Die Gewinne…

7 Tagen ago

Chrome: Google verschiebt das Aus für Drittanbietercookies

Ab Werk blockiert Chrome Cookies von Dritten nun frühestens ab Anfang 2025. Unter anderem gibt…

1 Woche ago

BAUMLINK: Wir sind Partner und Aussteller bei der Frankfurt Tech Show 2024

Die Vorfreude steigt, denn BAUMLINK wird als Partner und Aussteller bei der Tech Show 2024…

1 Woche ago