機種依存文字(姓・名)のインポートについて

Question

ＪＭＵＧの皆さまお世話になっております。京セラドキュメントソリューションズ 小川と申します。初めての投稿にて恐縮です。"郞"や"髙"といった機種依存文字を含んだcsvファイルをインポートしようとすると永久的に処理が実行され、リロードするとエラーとなり、結果敵にインポートできません。また、数百行リードがある場合は、どの行がエラーなのかをマルケトには表示されないため、目視などで対応が必要なようです。皆さまは、どのように対応されておりますでしょうか？※なお、弊社では、とりあえずは以下の360文字を含むリードが含まれていないかをエクセル関数にて検知し、　該当リードを除外してインポートするようにしております。【みんなの知識 ちょっと便利帳】使いたいときの HTML特殊文字 & 機種依存文字 - 漢字 (360文字)何卒、よろしくお願い致します。

Taishi_Yamada · Accepted Answer

@Yusaku Ogawa さん、こんにちはこの文字コード問題。意外と正しい答えに行き着くのが難しい話のと、知らないでor楽観して運用していると恐るべき事に陥る罠の１つなのでご注意ください。そんな私はマルケト運用初期のころに、悪夢の３万リード文字化け事件という経験をし、そこから気をつけるようになりました。もしかしたら結論として「UTF-8変換はした上での症状ですよ」ということかもしれませんがその際はご了承ください。コメントされた安藤さんも、もしや、まだ危険地帯におられるかもしれない。。。という気もしたので、私からもコメントさせて頂きます。まず、大丈夫という認識はあったのですが、一応心配になったので、試しに「髙」の文字をFirst NameにしたListを作ってImportしましたが、特に問題なく処理されました（List Importは常に慎重)。下記の通りです。UIは英語ですけど、そこは動作に関係ないです。さて、これですが、"文字コード"は残念ながら今でも気をつけなければ行けない日本語の悩みの１つです。そして、私もそうですが、なまじ長くコンピュータを触ってきた方ほど、今時の文字コードの扱いでハマる(=誤解がある)かもしれません。「半角英数字は１バイト、全角は２バイト」と、思っている方！（＝私も長らくそうでしたけど）。危険です。ご注意ください。今の常識は「全角は３バイト（だいたい）」です。そして、全角３バイトなおかげで、昔は機種依存文字だったものの多くが、依存文字のレッテルを剥がされています。細かい話は長くなるので割愛しつつの説明ですが、Importに使うファイルをExcelで作業されたあとに文字コードをUTF-8に変更する処理を別途されていますか？マルケト含めて、今時のモダンなシステムは文字コードにUTF-8を使っています。UTF-8の場合、漢字の「髙」などもしっかりコードが割り振られているので文字が化けることは基本ありません。こちら、その該当部分のMarketo Docsです。下記は英語の注意書き。Import a List of People - Marketo Docs - Product Docs 同じ部分の日本語版の注意書きです。後半に一行たされてますね。残念ながらExcelはファイル保存時に直接文字コードをUTF-8にしてCSVを保存することができません。そのため、CSVに保存した後で、そのファイルを別のツールでShift-JIS→UTF-8に変換してあげる必要があります。一番簡単なのは、Windowsなら「メモ帳」で可能です。メモ帳でCSVファイルを開いて、保存時に「UTF-8」というオプションが選べるのでそれで保存すればUTF-8形式のCSVファイルが完成します。変換が面倒。。。ということであれば、Excelで"unicode形式"で保存したファイルを使う手段もあります（この場合、全ての文字が１文字４バイト）。それで読み込んでもImportできます。ただし。。。。私は気味が悪いので、手間ですがUTF-8に自前で変換したファイルをImportに使うようにしています。なぜなら、Marketoからアウトプットする（Webやメールなど）ときに使われる文字コードがUTF-8なので素直にそのままデータが流れてくれる（はずだ）からです。色々なトラウマがあるので慎重です。最後に、メールの送り先、Webの閲覧時などで、無事に入れた文字が正しく表示されるか？という心配についてですが、B2Bならちょっと昔のPCやスマートフォン程度なら問題ないので、そこまで心配しなくても良いかなと割り切ってます。B2Cでという場合、私はキャリアメールなどの今時事情に詳しくないので、そのあたりは分かりません（B2Bの担当なもので。。。）。以上、ご参考までに。最後に「Excelでunicode形式で保存したファイルそのまま多数Importしてるけど問題ないよ！」という方おられましたら教えてください。-Yamada

Anonymous · Answer

小川さま、はじめまして。株式会社メジャースの安藤と申します。MarketoでもMarketo以外のシステムでも数え切れないほどデータインポートをしてきた経験があり、機種依存文字で苦い思い出も多々あります。直接の回答にはならないと思うので恐縮ですが、何かお役に立つことがあれば幸いです。基本的に、機種依存文字が幸いインポートできたとしても、その後思わぬトラブルを招くことがあり、私は極力排除するようにしています。例えば、はしごの"髙"は姓に多くありますが、トークン設定したメール内で「髙橋さま」としたい場合、Marketoでは上手く表示できても「髙橋さま」ご本人が受領したメールでは「？＄％＃橋さま」という残念な文字化け現象でクレームが発生することは十分に考えられます。機種依存文字である限り、あくまでメーラーに依存するので仕方ない現象です。（クレームがないのはこれまで見過ごしてくれてラッキー、という程度と思います）株式会社をPCで変換した際に出る略称の㈱も同じく依存文字なので、このような文字はインポート手前のデータ整理の段階で、一般的な文字に置換してからインポートしています。㈱⇒株式会社姓名を勝手に修正するのは、ご本人が名乗る実際の漢字ではないのでそれはそれで失礼だと思うのですが、データ管理上、しかたない妥協と割り切っています。標準化した名前でメールを受け取るのと、文字化けした名前でメールを受け取るのでは、また標準化されている方が心理的にましと思いますし・・・ただ、何でもかんでも毎回機種依存文字の修正は手間がかかり、インポート作業は頻繁に発生するので工数に対し効果が低いと思います。そのため私は機種依存文字は本当に頻繁に見かける文字「㈱」など以外は、あまり気にせずインポートしています。その代わり、メールで姓名のトークンをしない、など、リードとのコミュニケーションフローの中で少しでもリスク排除できるプロセスを常に検討しています。（その方が圧倒的に楽なので・・・）また、Marketoに読み込めないのはサポートデスクにフォローアップしていただいた方が良いと思います。

Sign up

Login with SSO

Login to the community

Login with SSO

Scanning file for viruses.

This file cannot be downloaded