kaggle apiの使い方(入門)
GitHub - Kaggle/kaggle-api: Official Kaggle APIの簡単な要約。
pip install kaggle
でkaggleのコマンドを使えるようにする。
https://www.kaggle.com/<username>/account
にアクセスし、'Create New API Token'を選ぶ。
すると、kaggle.json
がダウンロードされる。これにはユーザー名とAPI Keyが含まれている。
~/.kaggle/kaggle.json
にkaggle.json
を置く。
セキュリティのためにchmod 600 ~/.kaggle/kaggle.json
で、ファイルの読み書きの権限を所有者だけに変更すると良い。
これを行わないとkaggle
コマンドを叩いた際にwarningが表示される。
コマンドラインからは以下のコマンドを実行できる。
kaggle competitions {list,files,download,submit,submissions,leaderboard} kaggle datasets {list, files, download, create, version, init} kaggle config {view, set, unset}
詳細はhttps://github.com/Kaggle/kaggle-api#commandsを参照。
kaggleからデータをダウンロードする
コンペのデータのページからデータを取得するコマンドが簡単に取得できる。
例えば、
https://www.kaggle.com/c/nyc-taxi-trip-duration/data
ではkaggle competitions download -c nyc-taxi-trip-duration
というのがkaggleのapiを叩いてデータをダウンロードするコマンドである。
このコマンドを実行すると、.zipに圧縮されたデータがダウンロードされる。
この例ではsample_submission.zip
, train.zip
, test.zip
の3つのファイルが取得できる。
unzip *.zip
するとそれぞで.csv
の形で解凍される。