Pandasでタブ区切りファイルを読み取る - Windowsでは動作しますが、Macでは動作しません質問する

Question

最も大きな手がかりは、すべての行が 1 行で返されていることです。これは、行末文字が無視されているか、存在しないことを示しています。

csv_reader の行末文字を指定できます。Mac を使用している場合、作成される行は\rLinux 標準ではなく、で終わります\n。Windows のサスペンダーとベルトのアプローチでは、がより適切です\r\n。

pandas.read_csv(filename, sep='\t', lineterminator='\r')

コーデックパッケージを使用してすべてのデータを開くこともできます。これにより、ドキュメントの読み込み速度は低下しますが、堅牢性は向上します。

import codecs

doc = codecs.open('document','rU','UTF-16') #open for reading with "universal" type set

df = pandas.read_csv(doc, sep='\t')

Answer 1

最も大きな手がかりは、すべての行が 1 行で返されていることです。これは、行末文字が無視されているか、存在しないことを示しています。

csv_reader の行末文字を指定できます。Mac を使用している場合、作成される行は\rLinux 標準ではなく、で終わります\n。Windows のサスペンダーとベルトのアプローチでは、がより適切です\r\n。

pandas.read_csv(filename, sep='\t', lineterminator='\r')

コーデックパッケージを使用してすべてのデータを開くこともできます。これにより、ドキュメントの読み込み速度は低下しますが、堅牢性は向上します。

import codecs

doc = codecs.open('document','rU','UTF-16') #open for reading with "universal" type set

df = pandas.read_csv(doc, sep='\t')

おすすめ記事