hallo zusammen.
ich habe nun folgenden regex-ausdruck
edit: natürlich steht da auch ein backslash vor dem "s" (das forum hats rausgeschmissen)
wie man erkennt werden also wörter in $words aufgeteil und zwar immer bei leerzeichen umbrüchen etc.
so wird also:
$words = "hallo ihr da";
zu einem array
$split[0] = "hallo"
$split[1] = "ihr"
usw.
das ist auch alles kein thema. jetzt kommt aber eine ausnahme: wenn ich im string wortgruppen habe (also: "ich 'bin eine wortgruppe'"), dann soll diese gruppe NICHT gesplittet werden.
zu prüfen ist also: kommt ein " oder ' dann nicht mehr splitten, kommt aber wieder eins dann auch wieder splitten.
dann soll also eine zeichenkette
$words = "ich beinhalte 'eine wortgruppe' zum splitten";
so im array stehen
$split[0] = "ich";
$split[1] = "beinhalte";
$split[2] = "'eine wortgruppe'"; // ist egal ob die ' noch mit drin sind
$split[3] = "zum";
$split[4] = "splitten";
alles klar ??
ich hoffe ihr wisst mehr als ich
mfg und danke schonmal
gerrit
(ich überprüfe jetzt werder rechtschreibung noch zeichensetzung)
ich habe nun folgenden regex-ausdruck
PHP-Code:
$split = preg_split("/[\s]+/", $words, -1, PREG_SPLIT_NO_EMPTY);
wie man erkennt werden also wörter in $words aufgeteil und zwar immer bei leerzeichen umbrüchen etc.
so wird also:
$words = "hallo ihr da";
zu einem array
$split[0] = "hallo"
$split[1] = "ihr"
usw.
das ist auch alles kein thema. jetzt kommt aber eine ausnahme: wenn ich im string wortgruppen habe (also: "ich 'bin eine wortgruppe'"), dann soll diese gruppe NICHT gesplittet werden.
zu prüfen ist also: kommt ein " oder ' dann nicht mehr splitten, kommt aber wieder eins dann auch wieder splitten.
dann soll also eine zeichenkette
$words = "ich beinhalte 'eine wortgruppe' zum splitten";
so im array stehen
$split[0] = "ich";
$split[1] = "beinhalte";
$split[2] = "'eine wortgruppe'"; // ist egal ob die ' noch mit drin sind
$split[3] = "zum";
$split[4] = "splitten";
alles klar ??
ich hoffe ihr wisst mehr als ich
mfg und danke schonmal
gerrit
(ich überprüfe jetzt werder rechtschreibung noch zeichensetzung)
Kommentar