Hallo,
ich versuche bestimmte <div> Blöcke aus einem HTML Quelltext heraus zu parsen. Die Blöcke sehen wie folgt aus:
Die Blöcke lassen sich hauptsächlich durch "<div data-id="11" data-type="11"" indentifizieren, wobei natürlich die id unterschiedlich ist. Zur Weiterverarbeitung durch mein Programm würde mir als Result eines Regex der markierte Bereich genügen. Optimal wäre es, wenn ich eine Liste mit allen Matches bekommen würde. Ich habe bereits versucht mir die Grundlagen über die Regex Funktion anzueignen, jedoch halfen mir da selbst ähnliche Lösungsansätze nicht weiter.
Vielen Dank im Voraus!
ich versuche bestimmte <div> Blöcke aus einem HTML Quelltext heraus zu parsen. Die Blöcke sehen wie folgt aus:
HTML-Quellcode
- <div data-id="11" data-type="11" class="slot slot-11 slot-align-right item-quality-4" style=" top: 290px; right: 0px;">
- <div class="slot-inner">
- <div class="slot-contents">
- // Ab hier
- <a href="/item/90859" class="item" data-item="e=4360&re=138&s=166291392&u=445"><img src="http://media.server/icons/56/inv.jpg" alt="" /><span class="frame"></span></a>
- <div class="details">
- <span class="name-shadow">Objektname vorhanden</span>
- <span class="name color-q4">
- <a href="/item/90859" data-item="e=4360&re=138&s=166291392&u=445">Objektname vorhanden</a>
- </span>
- <span class="enchant-shadow">
- Objektname vorhanden
- </span>
- <div class="enchant color-q2">
- <span class="tip" data-sp="103462">Objektname vorhanden</span>
- </div>
- <span class="zlevel">489</span>
- </div>
- // Bis hier
- </div>
- </div>
- </div>
Die Blöcke lassen sich hauptsächlich durch "<div data-id="11" data-type="11"" indentifizieren, wobei natürlich die id unterschiedlich ist. Zur Weiterverarbeitung durch mein Programm würde mir als Result eines Regex der markierte Bereich genügen. Optimal wäre es, wenn ich eine Liste mit allen Matches bekommen würde. Ich habe bereits versucht mir die Grundlagen über die Regex Funktion anzueignen, jedoch halfen mir da selbst ähnliche Lösungsansätze nicht weiter.
Vielen Dank im Voraus!