Hallo,
nach einem Tag Crash Kurs Regex und Suchen im Forum wende ich mich an Euch und hoffe das mir jemand helfen kann.
Ausgangssituation:
In meiner Firma gibt es für die MAs keinen Internetzugang.
Ich möchte Ihnen gerne die BBC Newsseite zur Verfügung stellen.
Also lese ich den Quelltext der Seite in ein String.
Nun möchte ich
1. alle Links herausfiltern (Headlines)
2. die Quelltexte dieser Links ( News-Inhalt) auslesen und abspeichern
3. die gefilterten Links ersetzen durch lokale Links (namen der Dateien die die Unterseiteninhalte enthalten).
Mein Problem liegt derzeit bei 1.
Mein Regex lautet:
&(\<a.+(href)\s*=(\"|')+).(.*(\"|\'\>)*)&is
Dieser gibt in einem subpattern zwar den Link aus, hängt aber noch ein wenig vom Folgetext dran. Könnt ich zwar mit substr. etc. abschneiden, ich möchte aber gerne den regex verändern, so daß nur der Link in der variable steht....
Kann mir jemand sagen was an meinem regex falsch ist ???
Vielen Dank im Voraus...
nach einem Tag Crash Kurs Regex und Suchen im Forum wende ich mich an Euch und hoffe das mir jemand helfen kann.
Ausgangssituation:
In meiner Firma gibt es für die MAs keinen Internetzugang.
Ich möchte Ihnen gerne die BBC Newsseite zur Verfügung stellen.
Also lese ich den Quelltext der Seite in ein String.
Nun möchte ich
1. alle Links herausfiltern (Headlines)
2. die Quelltexte dieser Links ( News-Inhalt) auslesen und abspeichern
3. die gefilterten Links ersetzen durch lokale Links (namen der Dateien die die Unterseiteninhalte enthalten).
Mein Problem liegt derzeit bei 1.
Mein Regex lautet:
&(\<a.+(href)\s*=(\"|')+).(.*(\"|\'\>)*)&is
Dieser gibt in einem subpattern zwar den Link aus, hängt aber noch ein wenig vom Folgetext dran. Könnt ich zwar mit substr. etc. abschneiden, ich möchte aber gerne den regex verändern, so daß nur der Link in der variable steht....
Kann mir jemand sagen was an meinem regex falsch ist ???
Vielen Dank im Voraus...
Kommentar