Export to GitHub

smuto - issue #4

filmweb.xml scraper


Posted on Nov 4, 2010 by Happy Elephant

Mama mały problem z tym scraperem. To znaczy w XBMC w wersji PC nie ma problemu, ale chciałem go wykorzystać w wersji dla XBOX'a no i pojawił się mały problem z polskimi literkami w opisach. A dokładniej pojawiają się krzaczki. Jeśli wyrzucę z expression atrybuty noclean i fixchars lub tylko atrybut fixchars to w tekście zamiast literki "ó" pojawia się "ó" a reszta literek polskich jest ok, natomiast jeśli zostawię fixchars to mam literkę "ó", ale zamiast innych polskich są krzaczki.

Prosiłbym o kontakt i pomoc jak to ogarnąć bo średnio mi idzie z xml'em

Pozdrawiam

Comment #1

Posted on Nov 4, 2010 by Swift Camel

xml nic do tego nie na chętnie pomogę, pytanie brzmi - Czy jest sens?

smuto

Comment #2

Posted on Nov 5, 2010 by Happy Elephant

Jeśli to sprawa jednej poprawki w pliku to tak, jeśli trzeba głębiej grzebać to nie ;)

Comment #3

Posted on Nov 5, 2010 by Swift Camel

niestety nie jest to tylko poprawka w xml tak ogólnie chodzi właśnie o atrybut fixchars jest on potrzebny nie tylko do zamiany ó ale wszystkich znaków kodowanych jako encje i nie tylko w opisie ale też w powiązanych linkach i tak naprawdę to wesje dla xboxa - albo nie mają możliwości używania tego atrybutu ( patrz Camelot) albo mają go w zakresie ascii (patrz xbmc4xbox)czyli jak tyko użyjemy fixchars xbmc myśli, że tekst jest w ascii i konwertuje go do utf, a utf konwertowany do utf daje nam te fantastyczne krzaczki

smuto

Comment #4

Posted on Nov 5, 2010 by Happy Elephant

To rzeczywiście zaczyna tracić sens. Szkoda, że support dla xboxowej wersji XBMC tak się zmniejszył drastycznie. U mnie xbox jako kombajn multimedialny sprawdza się wyśmienicie, nie działa tylko Tuxbox, reszta to drobiazgi. W każdym razie dzięki za odpowiedź i zainteresowanie. Pozdrawiam

Status: WontFix

Labels:
Type-Defect Priority-Medium