Das Webbrowser-Steuerelement zeigt die „gängigsten“ Attribute von Elementen an. Es ist wirklich schade, dass man nicht daran gedacht hat, das ziemlich häufig verwendete Klassenattribut bereitzustellen. E ist wichtig, denn Blogspot vergibt kein ID-Attribut an alle Elemente, nach denen gesucht wird. Stattdessen identifiziert es viele Elemente nur durch die Klasse.
Um das Klassenattribut zu erhalten (und alles andere, das nicht in die .NET-Klasse gepackt ist), muss man das Ganze in den COM-Modus bringen. Einige Eigenschaften der Browser-Komponente haben eine DomElement-Eigenschaft, die sich mit der richtigen Schnittstelle konvertieren lässt, um die vollständigen Eigenschaften zu erhalten. Zum Beispiel lässt sich auf die Elemente im Dokument die DomElement-Eigenschaft mit IHTMLElement anwenden, was einem dann den vollständigen Zugriff auf das Element gewährt. Tatsächlich scheint es, als wären nur Attribute bereitgestellt worden, die alle Elemente besitzen können, so dass man hiermit ziemlich schnell vertraut wird.
Ein weiteres, wenn auch geringfügiges Problem ist, dass die Style-Eigenschaft der HtmlElement-Klasse einen Fehler in der Dokumentation hat. Die Stile werden durch ein Semikolon getrennt (wie bei CSS), nicht durch ein Komma, wie in der Dokumentation angegeben. Daran muss man denken, wenn man sie modifiziert.
Diese Anwendung ist kurz und einfach (und am Ende kommen wirklich einige reguläre Ausdrücke heraus). Wer sich die vollständige Anwendung und den Quellcode anschauen möchte, findet sie unter der MIT Licence (der Quellcode wird in einem Verzeichnis unter dem Installationspunkt installiert).
Neueste Kommentare
3 Kommentare zu So lässt sich HTML-Code mit dem Browser parsen und verarbeiten
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.
Vorteile?
Der Artikel hebt anfangs darauf ab, dass reguläre Ausdrücke „nicht ganz die richtige Herangehensweise“ seien, ohne dies im Weiteren auch nur mit einer Zeile zu begründen.
Im Gegenteil „am Ende kommen wirklich einige reguläre Ausdrücke heraus“!?
Was soll die eigentliche Aussage des Artikels sein? Dass man den Quellcode durchararbeitet?
Tut mir leid – ein wirklich schwacher Artikel :-(
Schlechter Artikel
Ich kann leider beim besten Willen nicht erkennen, an welcher Stelle des Artikels auf das eigentliche Parsen respektive einer Alternative zu reg. Ausdrücken eingegangen wird.
Nur für Windows mit Internet Explorer geeignet
Die Überschrift „…mit dem Browser parsen…“ ist irreführend, weil die beschriebene Methode offenbar die Verwendung des Internet Explorer voraussetzt. Bei allen Rechnern mit den Betriebssystemen wie z.B. MacOS X oder Linux wird es nicht funktionieren.