Dirk Hartstein Posted February 25, 2012 Posted February 25, 2012 Hallo zusammen, seit dem Update auf RS 1.9.4 ist mir aufgefallen, dass die Umlaute in den EPG Dateien nicht mehr korrekt angezeigt werden. ----- General] Version=1.1 [Media] Created=24.02.2012 13:13:03 Channel=Fox HD (deu) [0] Id=5271 Date=24.02.2012 Time=13:15:00 Duration=00:45:00 Title=Medium - Nichts bleibt verborgen Info=Wenn Köpfe rollen Series= Description=Die Ermittlungen im Mordfall von Walter Paxtons Ehefrau laufen auf Hochtouren, nachdem sich herausgestellt hat, dass ein Serienkiller frei herumläuft. Als Medium Allison Dubois Staatsanwalt Devalos und Detective Scanlon unterstützt, glaubt sie zu wissen, wer sein nächstes Opfer ist: ihre neue Freundin Debra...|USA 2006, mit Patricia Arquette, Miguel Sandoval, Sofia Vassilieva. 42 Min.|[16:9] [H.264] [HD]|[AC-3] [deu]|[AC-3] [deu]|Minimum age: deu 16, gbr 16, ita 16 Charset=255 Content=21 MinimumAge=16 TimerID={A1CFF629-9F95-4E9C-AC50-94615A00DDDE} [stats] Errors=0 Size=4,30 GB (4615703996 bytes) Avr. Datarate=1,288 MB/s Device=USB 2.0 BDA DVB-S Tuner (1) ----- LG Dirk support.zip Fox HD (deu)_Medium - Nichts bleibt verborgen_01.txt
Lars_MQ Posted February 25, 2012 Posted February 25, 2012 Da ist nichts falsches. Das ist schon seit ewigkeiten UTF-8.
Dirk Hartstein Posted February 26, 2012 Author Posted February 26, 2012 Da ist nichts falsches. Das ist schon seit ewigkeiten UTF-8. Also liegt es dann an Windows 7, dass es falsch dargestellt wird?
Lars_MQ Posted February 26, 2012 Posted February 26, 2012 Mist, Du hast Recht, da hab ich nen bug eingebaut. Ich hab das nicht gemerkt, weil mein editor automatisch umschaltet. Ich korrigiere das gleich.
test Posted February 26, 2012 Posted February 26, 2012 (edited) wo wir hier gerade bei Umlauten sind, Frage: warum wird manchmal UTF-8 und manchmal UTF-16 benutzt? $ file *.txt | awk -F'txt:' '{ print $NF }' | sed 's/^[ \t]*//;s/[ \t]*$//' | sort -f | uniq -c 9 Little-endian UTF-16 Unicode text, with CRLF, CR line terminators 34 Little-endian UTF-16 Unicode text, with very long lines, with CRLF, CR line terminators 31 UTF-8 Unicode text, with very long lines, with CRLF line terminators 2 UTF-8 Unicode text, with very long lines, with CRLF, CR line terminators Edited February 26, 2012 by test
Lars_MQ Posted February 26, 2012 Posted February 26, 2012 Die letzte version erstellte utf-16 (widestrings) dateien. Normalerweise soll es aber UTF-8 sein. Deswegen ja das update.
majstang Posted February 26, 2012 Posted February 26, 2012 Nice spotting, Dirk...big thanks That probably spared me hours of tedious correction work
test Posted February 26, 2012 Posted February 26, 2012 (edited) Die letzte version erstellte utf-16 (widestrings) dateien. Normalerweise soll es aber UTF-8 sein. Deswegen ja das update. hmm das scheints dann aber schon länger zu machen?! test@thinkpad:/tmp/test$ file 20101101-0000\ -\ Iron\ Man\ \(RTL\).txt 20101101-0000 - Iron Man (RTL).txt: Little-endian UTF-16 Unicode text, with very long lines, with CRLF, CR line terminators test@thinkpad:/tmp/test$ ls -lsa 20101101-0000\ -\ Iron\ Man\ \(RTL\).txt 4 -rwx------ 1 test None 1868 1. Nov 2010 20101101-0000 - Iron Man (RTL).txt Edited February 26, 2012 by test
test Posted February 26, 2012 Posted February 26, 2012 und wo wir gerade bei den Text Files sind: wie kommt es, daß ich manchen Text Files 'Created=30.12.1899' steht? Ich bezweifel, daß ich 1899 schon lebte und auch, daß es da den RecordingService schon gab' ;-)
Lars_MQ Posted February 26, 2012 Posted February 26, 2012 Das ist der wert für interner datumswert=0 (sprich unbekannt). Hängt mit der art und weise, wie datumswerte berechnet werden zusammen.
hawkes Posted February 27, 2012 Posted February 27, 2012 Danke Lars_MQ für den Fix. Hatte mich gestern schon gewundert, warum mein python script die Files nicht korrekt parsen konnte. Aber der Fehler gab endlich mal den Anstoss es auf direkten sqlite Zugriff umzubauen.
Recommended Posts