Databricks: パンダから Spark データフレームを作成するときに問題が発生する質問する

Question

これは、使用されている Databricks Runtime (DBR) のバージョンに関連しています。DBR 12.2 までの Spark バージョンは、.iteritemsPandas DataFrame から Spark DataFrame を構築するために関数に依存しています。この問題は、DBR 13.x として利用可能な Spark 3.4 で修正されました。

DBR 13.x にアップグレードできない場合は、ノートブックのコマンドを使用して、Pandas を最新の 1.x バージョン (現在は 1.5.3) にダウングレードする必要があります%pip install -U pandas==1.5.3。DBR に同梱されている Pandas バージョンを使用する方がよいですが、DBR 内の他のパッケージとの互換性がテストされています。

Answer 1

これは、使用されている Databricks Runtime (DBR) のバージョンに関連しています。DBR 12.2 までの Spark バージョンは、.iteritemsPandas DataFrame から Spark DataFrame を構築するために関数に依存しています。この問題は、DBR 13.x として利用可能な Spark 3.4 で修正されました。

DBR 13.x にアップグレードできない場合は、ノートブックのコマンドを使用して、Pandas を最新の 1.x バージョン (現在は 1.5.3) にダウングレードする必要があります%pip install -U pandas==1.5.3。DBR に同梱されている Pandas バージョンを使用する方がよいですが、DBR 内の他のパッケージとの互換性がテストされています。

Databricks: パンダから Spark データフレームを作成するときに問題が発生する質問する

ベストアンサー1

おすすめ記事