CsvKitを使用してCSV列を切り捨てる

Question

〜のようにr_31415の返信ただし、変更するフィールド以外のフィールド名を指定したり、フィールドの順序を覚えたりする必要はありません。エマ・ルーオの答えこれに関して）：

csvsql --query 'UPDATE stdin SET "Second Header" = substr("Second Header",1,2); SELECT * FROM stdin' <file

JSON認識ツールを接続してデータに必要な変換を実行するための、より柔軟なアプローチです。

csvkitを使用してcsvjsonCSVデータのJSON配列を作成します。
jqJSONデータを読み取り、Second Header値を2文字に切り捨てるために使用されます。
csvkitを使用してin2csvJSONを読み込み、CSVを作成します。

csvjson file | jq 'map(."Second Header" |= .[:2])' | in2csv -f json

問題のCSVデータを考慮すると、の出力はcsvjson次のとおりです。

[
  {
    "First Header": "foo",
    "Second Header": null
  },
  {
    "First Header": "foo",
    "Second Header": "b"
  },
  {
    "First Header": "foo",
    "Second Header": "bar"
  },
  {
    "First Header": "foo",
    "Second Header": "bar"
  },
  {
    "First Header": "foo",
    "Second Header": "\"bar"
  },
  {
    "First Header": "foo",
    "Second Header": "\nbar"
  }
]

の出力はjq次のとおりです。

[
  {
    "First Header": "foo",
    "Second Header": null
  },
  {
    "First Header": "foo",
    "Second Header": "b"
  },
  {
    "First Header": "foo",
    "Second Header": "ba"
  },
  {
    "First Header": "foo",
    "Second Header": "ba"
  },
  {
    "First Header": "foo",
    "Second Header": "\"b"
  },
  {
    "First Header": "foo",
    "Second Header": "\nb"
  }
]

最終出力：

First Header,Second Header
foo,
foo,b
foo,ba
foo,ba
foo,"""b"
foo,"
b"

Answer 1

〜のようにr_31415の返信ただし、変更するフィールド以外のフィールド名を指定したり、フィールドの順序を覚えたりする必要はありません。エマ・ルーオの答えこれに関して）：

csvsql --query 'UPDATE stdin SET "Second Header" = substr("Second Header",1,2); SELECT * FROM stdin' <file

JSON認識ツールを接続してデータに必要な変換を実行するための、より柔軟なアプローチです。

csvkitを使用してcsvjsonCSVデータのJSON配列を作成します。
jqJSONデータを読み取り、Second Header値を2文字に切り捨てるために使用されます。
csvkitを使用してin2csvJSONを読み込み、CSVを作成します。

csvjson file | jq 'map(."Second Header" |= .[:2])' | in2csv -f json

問題のCSVデータを考慮すると、の出力はcsvjson次のとおりです。

[
  {
    "First Header": "foo",
    "Second Header": null
  },
  {
    "First Header": "foo",
    "Second Header": "b"
  },
  {
    "First Header": "foo",
    "Second Header": "bar"
  },
  {
    "First Header": "foo",
    "Second Header": "bar"
  },
  {
    "First Header": "foo",
    "Second Header": "\"bar"
  },
  {
    "First Header": "foo",
    "Second Header": "\nbar"
  }
]

の出力はjq次のとおりです。

[
  {
    "First Header": "foo",
    "Second Header": null
  },
  {
    "First Header": "foo",
    "Second Header": "b"
  },
  {
    "First Header": "foo",
    "Second Header": "ba"
  },
  {
    "First Header": "foo",
    "Second Header": "ba"
  },
  {
    "First Header": "foo",
    "Second Header": "\"b"
  },
  {
    "First Header": "foo",
    "Second Header": "\nb"
  }
]

最終出力：

First Header,Second Header
foo,
foo,b
foo,ba
foo,ba
foo,"""b"
foo,"
b"

CsvKitを使用してCSV列を切り捨てる

ベストアンサー1

おすすめ記事