Skip to content

AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext.

License

Notifications You must be signed in to change notification settings

THWillert/_HTML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

_HTML

Übersicht

AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext, mit folgenden Funktionen:

Funktion Beschreibung
_HTML_ExtractURLVar Extrahiert eine URL-Variable aus einer URL.
_HTML_Get Liefert einen Wert, anhand Verschiedener Atrribute wie: class, id, title usw.
_HTML_GetAllLinks Gibt ein Array mit allen Links zurück.
_HTML_GetImageSrc Gibt die Quelle eines Bildes zurück.
_HTML_GetLink Gibt ein URL zurück, die den Parametern entspricht.
_HTML_GetSource Liefert den Quelltext einer Seite zurück. Scripte werden herausgefiltert.
_HTML_GetTable Liefert den Inhalt einer Tabelle als 2D-Array.
_HTML_GetText Gibt den reinen Text eines Bereiches zurück.
_HTML_GetURLVar Liefert eine URL-Variable aus einer URL.
_HTML_ImageSave Speicher das angebene Bild ab.
_HTML_Search Durchsucht den reinen Text einer Quelle.

Globale Suchparameter:

$_HTML_SEARCHMODE = 1
;(RegExp: 0 = Compare / 1 = Substring) (String: 2 = Compare / 3 = Substring)

Voraussetzungen

AutoIt

Installation

In das AutoIt Include Verzeichnis kopieren.

Diskussion / Vorschläge

...

ToDo

Die Reihenfolge entspricht keiner Priorität.

  • Funktion zum Auslesen von Tabellen verbessern.

Author

Thorsten Willert

Homepage

Lizenz

Das ganze steht unter der Apache 2.0 Lizenz. .

About

AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext.

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Languages