リスト内の連続した数字のグループを識別する質問する

Question

編集2: OPの新しい要件に答える

ranges = []
for key, group in groupby(enumerate(data), lambda (index, item): index - item):
    group = map(itemgetter(1), group)
    if len(group) > 1:
        ranges.append(xrange(group[0], group[-1]))
    else:
        ranges.append(group[0])

出力：

[xrange(2, 5), xrange(12, 17), 20]

xrange を range または他のカスタムクラスに置き換えることができます。

Pythonのドキュメントには非常にわかりやすいレシピこのために：

from operator import itemgetter
from itertools import groupby
data = [2, 3, 4, 5, 12, 13, 14, 15, 16, 17]
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
    print(map(itemgetter(1), g))

出力：

[2, 3, 4, 5]
[12, 13, 14, 15, 16, 17]

まったく同じ出力を取得したい場合は、次のようにします。

ranges = []
for k, g in groupby(enumerate(data), lambda (i,x):i-x):
    group = map(itemgetter(1), g)
    ranges.append((group[0], group[-1]))

出力：

[(2, 5), (12, 17)]

編集：この例はすでにドキュメントで説明されていますが、さらに詳しく説明する必要があるかもしれません。

解決の鍵は、連続する数字がすべて同じグループに表示されるように範囲を区別することです。

データが次の場合、[2, 3, 4, 5, 12, 13, 14, 15, 16, 17]これはgroupby(enumerate(data), lambda (i,x):i-x)次のものと同等です。

groupby(
    [(0, 2), (1, 3), (2, 4), (3, 5), (4, 12),
    (5, 13), (6, 14), (7, 15), (8, 16), (9, 17)],
    lambda (i,x):i-x
)

ラムダ関数は、要素の値から要素のインデックスを減算します。したがって、各項目にラムダを適用すると、groupby に次のキーが取得されます。

[-2, -2, -2, -2, -8, -8, -8, -8, -8, -8]

groupby は等しいキー値で要素をグループ化します。つまり、最初の 4 つの要素がグループ化されます。

これによって、より読みやすくなると思います。

python 3このバージョンは初心者には役立つかもしれない

まず必要なライブラリをインポートする

from itertools import groupby
from operator import itemgetter

ranges =[]

for k,g in groupby(enumerate(data),lambda x:x[0]-x[1]):
    group = (map(itemgetter(1),g))
    group = list(map(int,group))
    ranges.append((group[0],group[-1]))

Answer 1