リスト内の連続した数字のグループを識別したいのですが、次のようになります。
myfunc([2, 3, 4, 5, 12, 13, 14, 15, 16, 17, 20])
戻り値:
[(2,5), (12,17), 20]
そして、これを実行するための最善の方法は何だろうと考えていました (特に、Python に組み込まれているものがある場合)。
編集: 最初に、個々の数値は範囲ではなく個別の数値として返される必要があることを言及するのを忘れていました。
ベストアンサー1
編集2: OPの新しい要件に答える
ranges = []
for key, group in groupby(enumerate(data), lambda (index, item): index - item):
group = map(itemgetter(1), group)
if len(group) > 1:
ranges.append(xrange(group[0], group[-1]))
else:
ranges.append(group[0])
出力:
[xrange(2, 5), xrange(12, 17), 20]
xrange を range または他のカスタム クラスに置き換えることができます。
Pythonのドキュメントには非常にわかりやすいレシピこのために:
from operator import itemgetter
from itertools import groupby
data = [2, 3, 4, 5, 12, 13, 14, 15, 16, 17]
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
print(map(itemgetter(1), g))
出力:
[2, 3, 4, 5]
[12, 13, 14, 15, 16, 17]
まったく同じ出力を取得したい場合は、次のようにします。
ranges = []
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
group = map(itemgetter(1), g)
ranges.append((group[0], group[-1]))
出力:
[(2, 5), (12, 17)]
編集:この例はすでにドキュメントで説明されていますが、さらに詳しく説明する必要があるかもしれません。
解決の鍵は、連続する数字がすべて同じグループに表示されるように範囲を区別することです。
データが次の場合、[2, 3, 4, 5, 12, 13, 14, 15, 16, 17]
これはgroupby(enumerate(data), lambda (i,x):i-x)
次のものと同等です。
groupby(
[(0, 2), (1, 3), (2, 4), (3, 5), (4, 12),
(5, 13), (6, 14), (7, 15), (8, 16), (9, 17)],
lambda (i,x):i-x
)
ラムダ関数は、要素の値から要素のインデックスを減算します。したがって、各項目にラムダを適用すると、groupby に次のキーが取得されます。
[-2, -2, -2, -2, -8, -8, -8, -8, -8, -8]
groupby は等しいキー値で要素をグループ化します。つまり、最初の 4 つの要素がグループ化されます。
これによって、より読みやすくなると思います。
python 3
このバージョンは初心者には役立つかもしれない
まず必要なライブラリをインポートする
from itertools import groupby
from operator import itemgetter
ranges =[]
for k,g in groupby(enumerate(data),lambda x:x[0]-x[1]):
group = (map(itemgetter(1),g))
group = list(map(int,group))
ranges.append((group[0],group[-1]))