Forum
Tipps
News
Menu-Icon

Andere: Bash: Problem: Abschnitt aus einem Text herausfiltern

Hallo,
mein Problem, weil ich nicht genau weiß wie ich das mit grep und sed lösen kann:

Ich muss aus einer HTML Seite einen bestimmten Abschnitt herausfiltern. Es wird ein Keyword (hier ein Datum) vorgegeben und
es muss der darunter folgende Abschnitt bis zum nächsten Keyword herausgefiltert werden.

Hier mal Code um das zu verdeutlichen:


<html>
<head> </head>
<body>


<table>
<tr>
<td>
28.09.2007
</td>
</tr>
</table>

<p class="aatext">
<a href="irgendwas"> Text 1 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 2 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 3 </a>
</p>



<table>
<tr>
<td>
29.09.2007
</td>
</tr>
</table>

<p class="aatext">
<a href="irgendwas"> Text 4 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 5 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 6 </a>
</p>



</body>
</html>



Wenn der 28.09.2007 vorgegeben wird, dann muss Text 1, Text 2 und Text 3 ausgegeben werden.
Wie stelle ich das jetzt an? Bin für jede Hilfe dankbar.
Hinweis: Im GNU Grep gibt es das Flag -P nicht, was die Sache vereinfachen würde (nutze Ubuntu 7.10)

Mit freundlichen Grüßen
Basti, [email protected]

« Suse: Suse: DruckertreiberSuse: Kernel »
 

Schnelle Hilfe: Hier nach ähnlichen Fragen und passenden Tipps suchen!

Fremdwörter? Erklärungen im Lexikon!
HTML
HTML steht für Hyper Text Markup Language, ist die Sprache, mit der Internetseiten kodiert werden. Es handelt sich dabei um ASCII Text, in den die HTML Befehle einge...

XHTML
Die Extensible Hypertext Markup Language, kurz XHTML, ist eine textbasierte Auszeichnungssprache zur semantischen Auszeichnung von Bildern, Texten und Hyperlinks in Dokum...

Quellcode
Ein Quellcode, auch als Quelltext bekannt, bezeichnet den unkompilierten Programm-Code einer Software. Quell- oder Programm-Code ist der auch für Menschen lesbare Co...