顧客によって作成され、アップロードされる、会社名などの値にコンマが含まれる可能性がある CSV ファイルの処理方法についての提案を探しています。
私たちが検討しているアイデアには、引用符で囲まれた識別子 (値 "、"、値 "、" など) や、コンマの代わりに | を使用する方法などがあります。最大の問題は、簡単にできないと顧客がそれをやってくれないことです。
ベストアンサー1
実際にCSV形式の仕様があり、RFC 4180カンマの扱い方:
改行 (CRLF)、二重引用符、カンマを含むフィールドは二重引用符で囲む必要があります。
RFC4180 は、RFC 2233 の翻訳文書を翻訳したものです。
したがって、値foo
とを得るにはbar,baz
、次のようにします。
foo,"bar,baz"
考慮すべきもう 1 つの重要な要件 (これも仕様から):
フィールドを囲むために二重引用符が使用されている場合、フィールド内に表示される二重引用符の前に別の二重引用符を置いてエスケープする必要があります。例:
"aaa","b""bb","ccc"