2018-08-21から1日間の記事一覧

2018-08-21

Spark入門

Sparkのコアのデータ構造は（RDD: Resilient Distributed Dataset）である。pandasのDataFrameのようにデータセットをRDDにロードして、メソッドでデータを扱う。 PythonでSparkを使うにはPySparkを使う。SparkはJavaでできているので Py4Jによって、Javaの…

Machine Morning

機械学習やWebについて学んだことを記録しています。

2018-08-21から1日間の記事一覧

Spark入門