みんな
以前はこの質問を申し訳ありませんが、一度試してみます。
次の形式のテーブル(タブ区切りのテキストファイル)があります。
Species1 Species2 Species3
Gene 1 Value Value Value
Gene 2 Value Value Value
Gene 3 Value Value Value
.
.
.
次の形式に変更する必要があります。
Gene 1 Species 1 Value
Gene 2 Species 1 Value
Gene 3 Species 1 Value
.
.
.
Gene 1 Species 2 Value
Gene 2 Species 2 Value
Gene 3 Species 2 Value
.
.
.
etc.
これを行う特定のUnixコマンドはありますか?それともExcelですぐにできますか?テーブルには約120,000のデータポイントがあるので、これを手動で実行することは不可能だと思います。
おそらくご存知でしょうが、私はこれについて専門家ではありません。
よろしくお願いします。
ベストアンサー1
詳しく見なければなりません凍って苦しむ。 Numpyは、必要な方法で行列を整理するのに役立つ非常に強力なツールです。
次の例を見てください。
>>> import numpy as np
>>> a = np.array([[1, 2, 3], [4, 5,6]])
>>> a
array([[1, 2, 3],
[4, 5, 6]])
>>> a.transpose()
array([[1, 4],
[2, 5],
[3, 6]])
csvやtxtなどのデータファイルからnumpyにデータをインポートすることもできます。
np.genfromtxt('path/to/myfile.csv',delimiter=',',skiprows=1)
使用しているデータスタイルが何であるかを明確に説明していないため、実際に必要なものを見つけるのは難しいですが、始めるのに役立ちます。
numpyに慣れたら、さらに深く掘り下げることができます。パンダ。