So lässt sich HTML-Code mit dem Browser parsen und verarbeiten

Das Webbrowser-Steuerelement zeigt die „gängigsten“ Attribute von Elementen an. Es ist wirklich schade, dass man nicht daran gedacht hat, das ziemlich häufig verwendete Klassenattribut bereitzustellen. E ist wichtig, denn Blogspot vergibt kein ID-Attribut an alle Elemente, nach denen gesucht wird. Stattdessen identifiziert es viele Elemente nur durch die Klasse.

Um das Klassenattribut zu erhalten (und alles andere, das nicht in die .NET-Klasse gepackt ist), muss man das Ganze in den COM-Modus bringen. Einige Eigenschaften der Browser-Komponente haben eine DomElement-Eigenschaft, die sich mit der richtigen Schnittstelle konvertieren lässt, um die vollständigen Eigenschaften zu erhalten. Zum Beispiel lässt sich auf die Elemente im Dokument die DomElement-Eigenschaft mit IHTMLElement anwenden, was einem dann den vollständigen Zugriff auf das Element gewährt. Tatsächlich scheint es, als wären nur Attribute bereitgestellt worden, die alle Elemente besitzen können, so dass man hiermit ziemlich schnell vertraut wird.

Ein weiteres, wenn auch geringfügiges Problem ist, dass die Style-Eigenschaft der HtmlElement-Klasse einen Fehler in der Dokumentation hat. Die Stile werden durch ein Semikolon getrennt (wie bei CSS), nicht durch ein Komma, wie in der Dokumentation angegeben. Daran muss man denken, wenn man sie modifiziert.

Diese Anwendung ist kurz und einfach (und am Ende kommen wirklich einige reguläre Ausdrücke heraus). Wer sich die vollständige Anwendung und den Quellcode anschauen möchte, findet sie unter der MIT Licence (der Quellcode wird in einem Verzeichnis unter dem Installationspunkt installiert).

Themenseiten: Software, Webentwicklung

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

3 Kommentare zu So lässt sich HTML-Code mit dem Browser parsen und verarbeiten

Kommentar hinzufügen
  • Am 16. Mai 2010 um 11:46 von Marker

    Nur für Windows mit Internet Explorer geeignet
    Die Überschrift „…mit dem Browser parsen…“ ist irreführend, weil die beschriebene Methode offenbar die Verwendung des Internet Explorer voraussetzt. Bei allen Rechnern mit den Betriebssystemen wie z.B. MacOS X oder Linux wird es nicht funktionieren.

  • Am 23. Mai 2010 um 19:17 von Marcel Reuter

    Schlechter Artikel
    Ich kann leider beim besten Willen nicht erkennen, an welcher Stelle des Artikels auf das eigentliche Parsen respektive einer Alternative zu reg. Ausdrücken eingegangen wird.

  • Am 9. Juni 2010 um 11:59 von Stephan

    Vorteile?
    Der Artikel hebt anfangs darauf ab, dass reguläre Ausdrücke „nicht ganz die richtige Herangehensweise“ seien, ohne dies im Weiteren auch nur mit einer Zeile zu begründen.

    Im Gegenteil „am Ende kommen wirklich einige reguläre Ausdrücke heraus“!?
    Was soll die eigentliche Aussage des Artikels sein? Dass man den Quellcode durchararbeitet?

    Tut mir leid – ein wirklich schwacher Artikel :-(

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *