in meiner Exportdatei macht Probleme

In einer alltäglichen Situation des Export und Import in Essbase bekam ich eine Fehlerbotschaft. Der Import der Daten lief auf ein Zeichen, welches nicht akzeptiert wurde und mir dieses dann auch prompt anzeigte. Weil es immer mal wieder vorkommt, habe ich einen Beitrag geschrieben, was die Gründe sind, und wie dieses Problem gelöst werden kann.

Hintergrund

Die Zeichenfolge  in einer Textdatei hat einen technischen Hintergrund. Es ist ein Byte Order Mark (BOM) für eine UTF-8 formatierte Datei. Am Anfang einer Datei kann es Unicode-Zeichencodierung geben. Dann stehen dort möglicherweise einige Bytes, die das Unicode-Zeichen U+FEFF BYTE ORDER MARK (abgekürzt BOM) darstellen. Das BOM ist bei korrekter Verwendung unsichtbar und führt nicht zu Problemen.

So auch bei meiner Datei: in meinen Augen eine ganz normale .csv Datei. Wenn ich die Datei in einem Text Editor öffne, dann sehe ich diese Zeichen nicht (und kann sie auch nicht entfernen). Aber wenn ich diese Datei dann in MS Excel öffne dann kann ich diese Zeichen in der ersten Zeile sehen.

Datei in MS Notepad:

CompanyID,AccountID,AccountDescription,Accounting_Year,Accounting_Period,PreviousEndingBalance,DebitAmount,CreditAmount,EndingBalance

Datei in MS Excel:

CompanyID,AccountID,AccountDescription,Accounting_Year,Accounting_Period,PreviousEndingBalance,DebitAmount,CreditAmount,EndingBalance

Bei UTF-8 ist kein BOM erforderlich aber das BOM kann dennoch in UTF-8-codiertem Text auftreten, entweder als Nebenprodukt einer Umwandlung der Zeichencodierung oder weil es durch ein Editorprogramm hinzugefügt wurde, um den Inhalt als UTF-8 zu markieren.

Wenn es dann ein Programm trifft, welches dieses dann nicht unterdrückt, dann gibt es eine Zeichenfolge mit der nichts gemacht werden kann.

 

Was ist die Lösung?

Wenn Sie das BOM entfernen müssen, überprüfen Sie, ob Ihr Editor ermöglicht einzustellen, ob beim Speichern ein BOM hinzugefügt wird bzw. erhalten bleibt. Solch ein Editor erlaubt es Ihnen, auf einfache Weise das BOM zu entfernen: die Datei einlesen und wieder speichern. Editoren wie bspw. Notepad++ bietet eine Kodierung mit und ohne BOM an.

Abbildung 1: Notepad ++ mit der Option die Kodierung anzupassen.

Auch kann dort eine Datei in ein Format „UTF-8 ohne BOM“ konvertiert werden. Praktisch ist es, um immer mit dem richtigen Werkzeug zu arbeiten, denn oft kommen solche Probleme, wenn mal etwas „anderes“ verwendet wird.

 

Ihr Philip Hulsebosch.

Veröffentlicht unter Essbase Getagged mit: , , ,

Schreibe einen Kommentar

  • Ein Fehler ist aufgetreten – der Feed funktioniert zur Zeit nicht. Versuche es später noch einmal.