Jump to content

Japanische Schriftzeichen im EPG falsch dargestellt


Recommended Posts

Leider funktioniert die Darstellung der japanischen Schriftzeichen im EPG bei mir nicht.

(Der Versuche eine Datei aufzunehmen und den Dateinamen aus dem EPG zu generieren, erzeugt auch keine korrekte Zeichenwiedergabe)

 

Der Effekt bestand schon bei Version 4.9.5.0, ist leider in der aktuellen Version 4.9.6.11 immer noch vorhanden.

 

Statt der korrekten japanischen Zeichen werden unzusammenhängende chinesische Zeichen dargestellt.

 

So zum Beispiel:

 

Folgende Zeichen sind im EPG angegeben: 赴纃緕粤齦鈬 (hat im Japanischen keine Bedeutung)

Richtig wäre: 美男(イケメン)ですね〈終〉

 

Oder ein weiteres Beispiel aus EPG: 囂辣纈・囈鱚續 (völlig wirre Zeichen)

Richtig wäre der folgende Sendungstitel: 世界ふれあい街歩き

 

Ich habe ein paar Bilder meiner Originalmeldung an die Entwickler vom letzten Jahr angehängt. Damals habe ich auch einen Kanaldump der EIT, PAT und PMT Tabellen mit transedit erstellt, der allerdings mit 1244 kb zu lang ist, um hier angehängt zu werden, aber vielleicht reichen ja auch die Screenshots.

 

Ob der Fehler im Programm, beim Provider (oder eventuell bei mir) liegt wäre schonmal eine Hilfe. Im Endeffekt würde mir auch eine manuelle Codeumschaltung reichen. Da aber auch die Übertragung in die Filenamen hakt, vermute ich stark einen verdeckten Programierfehler aufgrund impliziter Typkonvertierung oder ähnlichem (ob beim DVBViewer oder dem Provider, der den Sender ins Kabelnetz stellt kann ich nicht beurteilen). Eine Auswertung des Header Dumps könnte da Aufschluß geben, ist aber wohl noch nicht erfolgt.

 

Für Hilfe, die EPG Daten korrekt anzuzeigen, wäre ich dankbar.

 

Edit: Mißverständliche Stellen deutlicher ausformuliert, Rechtschreibfehler korrigiert.

support.zip

post-124197-0-47311900-1335207373_thumb.jpg

post-124197-0-13273100-1335207491_thumb.jpg

post-124197-0-64735200-1335207526_thumb.jpg

post-124197-0-89703600-1335207566_thumb.jpg

Edited by afjap
Link to comment

So,

 

ich habe von der Sendung: 囂辣纈・囈鱚續 (richtig:世界ふれあい街歩き) gerade ein kleineres transedit-Recording gemacht welches ein .ts und ein .csv File ergeben hat.

 

Leider kann ich die Files nicht anhängen: "Error You aren't permitted to upload this kind of file".

 

Naja, muß dann halt auch so gehen.

 

Danke, vorab.

Link to comment
Leider funktioniert die Darstellung der japanischen Schriftzeichen im EPG und damit die Übernahme in die Aufnahmedatei bei mir nicht.

Wie sieht die Darstellung der EPG-Daten im TransEdit Analyzer aus? Bitte dazu die aktuelle Version verwenden (3.8.4) und den EIT-Zweig in der Baumansicht ausklappen. Was wird dort als Zeichensatz-Information angegeben (Eintrag über dem Text, falls vorhanden)? Um welchen Anbieter handelt es sich? Wird gemäß der japanischen ISDB-Norm gesendet, oder ist es DVB-C/T nach der europäischen DVB-Norm?

 

der allerdings mit 1244 kb zu lang ist, um hier angehängt zu werden

Du erhälst gleich eine PM.

Link to comment

Wird sofort gemacht und dann gleich hier eineditiert.

 

Irgendwie komme ich mir gerade vor wie eine "Null", die es nichtmal schafft, den richtigen "Full Edit Button" zu finden.

 

Jetzt hab ichs. Naja, beim nächsten mal dann.

Edited by afjap
Link to comment

Ich glaube ich weiss, wo das problem liegt. Der EPG decoder sieht "jpn" als sprache und sagt sich "ah der japanische standard" und decodiert die eigentlich englischen einträge fröhlich als japanische schriftzeichen...

 

Ich bezweifle extrem, dass ein Deutscher kabelanbieter japanisches EPG sendet...

 

Die frage ist, was passiert bei wirklich japanischem EPG, wenn wir da was ändern... :(

Link to comment

Der Short Event Descriptor sagt ja "Latin alphabet No.5" und die TranseditML Version macht es ja auch korrekt.

Der Zeichensatz muß ja nicht unbedingt mit der Sprache kongruent gehen, es gibt ja fast in jede Richtung Transkriptionssysteme.

 

Warum zeigt denn diese Beta-Version die "richtigen" Zeichen?

Link to comment

Weil sie japanisch noch nicht versteht.

 

Das problem dabei ist, die sender legen den standard manchmal sehr grosszügig aus.

Als wir den japanischen decoder einbauten, hatten wir diverse samples, die sich nur an der sprachangabe "jpn" festmachen liessen. D.h. es gab keine einheitliche "markierung", die die Daten als japanisches EPG auswiesen.

 

Letztendlich ist das bei Dir Schlamperei von unimedia. Normalerweise müssten sie gemäß der spezifikationen die sprache "eng" angeben, da sich die sprache nicht auf den inhalt des senders sondern auf den speziellen descriptor bezieht.

 

Wir haben jetzt den schwarzen peter und müssen sehen, wie wir das vereinbaren, ohne dass irgendwas dabei schief läuft.

Link to comment

Das ist natürlich klar. Und ich sehe Euere mißliche Lage. Auf welche Version müßte ich denn "Downgraden", um die lateinischen Zeichen zu erzwingen? (Schließlich macht es keinen Sinn für nur eine Person eine Art "Manual Override" einzuführen. Wobei interessant wäre, ob ähnliches auch für die arabischen Sender gilt, wo es sicher mehr Nutzer gibt.)

 

Im Grunde ist es mir völlig unverständlich, warum man die englischen Daten einspeist. Ich habe keine Zehntelsekunde daran gedacht, daß das die Ursache sein könnte. Schließlich aboniert man ja nicht so einen Sender, wenn man die Sprache nicht wenigstens annähernd versteht. Und leider haben die englischen Namen manchmal nur wenig mit dem Originaltitel zu tun.

 

Jedenfalls schonmal besten Dank für die Diagnose des Problems!!

Edited by afjap
Link to comment
Auf welche Version müßte ich denn "Downgraden", um die lateinischen Zeichen zu erzwingen?

Mal nicht so schnell. Lass griga und meine wenigkeit das erst nochmal beraten.

Und selbst wenn es sich nicht lösen lässt, könnten wir einen tweak einbauen, der das umgeht.

 

Oder im ideal fall kriegen wir unitymedia dazu das zu ändern. ;)

Link to comment
Sollte da nicht der Tweak "EPG-Daten in den lokalen Zeichensatz konvertieren" helfen? >

Nein, der greift da nicht. Das ARIB EPG für Japan wird gesondert behandelt.

Link to comment

Ergebnis der Analyse: Es lässt sich eine bessere Unterscheidung treffen, die diesen Fall richtig behandelt. Sie beruht im wesentlichen darauf, dass DVB und ISDB verschiedene Steuerzeichen (ohne Überschneidung) für die Zeichensatzwahl verwenden. Wenn das Steuerzeichen für Latin No. 5 am Anfang steht, kann es nicht ISDB sein, auch wenn die Sprachkennung jpn ist.

 

@Lars: Programmtechnische Details kommen per Mail...

 

DVB und ISDB lassen sich jedoch nicht perfekt auseinanderhalten, da es oft genug Strings ohne verwertbare Sprachinformation und Zeichensatzkennung gibt. Letztendlich wird nur bleiben, eine manuelle Konfigurationsmöglichkeit für japanisches und zusätzlich lateinamerikanisches ISDB vorzusehen.

 

Bemerkenswert in dem Sample sind noch die Extended Event Deskriptoren für Pink Extra in der EIT. Zunächst dachte ich, ein Bug in TransEdit verursacht den angezeigten Schrott, aber ein manuelles Parsen im Hex-Editor zeigte, dass die Deskriptoren einfach syntaktisch falsch gesendet werden >_<

Link to comment

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Unfortunately, your content contains terms that we do not allow. Please edit your content to remove the highlighted words below.
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

×
×
  • Create New...