Python SparkでRDDコンテンツを表示しますか?質問する

Python SparkでRDDコンテンツを表示しますか?質問する

Pyspark でシンプルなアプリを実行します。

f = sc.textFile("README.md")
wc = f.flatMap(lambda x: x.split(' ')).map(lambda x: (x, 1)).reduceByKey(add)

foreach アクションを使用して RDD コンテンツを表示します。

wc.foreach(print)

これは構文エラーをスローします:

SyntaxError: invalid syntax

何が足りないのでしょうか?

ベストアンサー1

Spark 2.0 の場合 (以前のバージョンではテストしていません)。単純に:

print myRDD.take(n)

どこ行数であり、マイRDDトイレあなたの場合。

おすすめ記事