Pyspark でシンプルなアプリを実行します。
f = sc.textFile("README.md")
wc = f.flatMap(lambda x: x.split(' ')).map(lambda x: (x, 1)).reduceByKey(add)
foreach アクションを使用して RDD コンテンツを表示します。
wc.foreach(print)
これは構文エラーをスローします:
SyntaxError: invalid syntax
何が足りないのでしょうか?
ベストアンサー1
Spark 2.0 の場合 (以前のバージョンではテストしていません)。単純に:
print myRDD.take(n)
どこん行数であり、マイRDDはトイレあなたの場合。