Hallo,
ich stehe vor folgendem Problem.
Für meinen Webshop habe ich eine Schnittstelle zur Google Base API geschrieben, welche auch einwandfrei funktioniert.
Bei manchen Artikeln scheinen aber soviele Sonderzeichen bzw. sonstige HTML Formatierungen drin zu sein, dass ich folgende Fehlermeldung bekomme:
Ich habe versucht mit folgendem Code eigentlich die Beschreibung so gut wie von allem zu befreien und als UTF-8 zu übertragen, aber anscheinend bleiben halt bei einigen Artikeln Rückstände zurück:
Hat jemand noch eine Idee wie ich den String bis auf den eigentlichen Text bereinigen kann?
Leider bekomme ich von der Google API keine konkrete Fehlerbeschreibung, um welches Zeichen es sich konkret handelt, was er bemängelt.
Zusammenfassend ist zu sagen, dass ich einen UFT-8 validen String brauche.
Oder hat auch jemand eine Idee wo man einen String auf UTF-8 Validität prüfen kann?
Vielen Dank und Grüße
Michael
ich stehe vor folgendem Problem.
Für meinen Webshop habe ich eine Schnittstelle zur Google Base API geschrieben, welche auch einwandfrei funktioniert.
Bei manchen Artikeln scheinen aber soviele Sonderzeichen bzw. sonstige HTML Formatierungen drin zu sein, dass ich folgende Fehlermeldung bekomme:
Code:
<error type="data" field="description" reason="There is a problem with the character encoding of this attribute." /> </errors>
PHP-Code:
$tags = '<p><a><br><br /><table><tr><td><ul><ol><li><img><center><h1><h2><h3><div>'
$content = utf8_encode(
html_entity_decode(
str_replace(' ', '',
strip_tags(
preg_replace('/\<(i|p|span|font)\s.*?\>/im', '<\1>',
stripslashes($products_array[$i]['products_description']
)
),
$tags)
)
)
);
Leider bekomme ich von der Google API keine konkrete Fehlerbeschreibung, um welches Zeichen es sich konkret handelt, was er bemängelt.
Zusammenfassend ist zu sagen, dass ich einen UFT-8 validen String brauche.
Oder hat auch jemand eine Idee wo man einen String auf UTF-8 Validität prüfen kann?
Vielen Dank und Grüße
Michael
Kommentar