Machine Morning

機械学習やWebについて学んだことを記録しています。

その他(技術)

karabinerで単体のcommandが効かなくなる問題の対処

karabinerで日英の入力切り替えをcommandに割り当てると単体のcommandが使えなくなり、他の単体commandによる操作が行えなくなる。筆者の環境ではcheetsheetというアプリを入れていて、command長押しがそのショートカットなっているが、karabinerが悪さをす…

matplotlibは一つのセルで完結させるべき...?

Google Colaboratory上でmatplolibでプロットしていたら、ハマったポイント。 複数セルにまたがって書くと初期化される? pltのインスタンスを作成したら、plt.show()するまでセルを変えない方が良い? Plot disappears after executing cell second time · …

Colaboratoryでグラフをファイルとして保存する

Google Colaboratoryでプロットしたグラフを保存するにはplt.savefig()だけではできない。 import matplotlib.pyplot as plt from google.colab import files # グラフを作成したら plt.savefig("file_name") files.download("file_name") これでローカルの…

Spark入門2

Sparkのインストール SparkはJavaのバーチャルマシン(JVM)上で動くので、JVMを入手する。JVMはJava SE Development Kit(JDK)をインストールすることで手に入る。2018年8月21日現在ではバージョン10が最新だ。以下のリンクから自分のマシンに合ったものを…

Spark入門

Sparkのコアのデータ構造は(RDD: Resilient Distributed Dataset)である。pandasのDataFrameのようにデータセットをRDDにロードして、メソッドでデータを扱う。 PythonでSparkを使うにはPySparkを使う。SparkはJavaでできているので Py4Jによって、Javaの…

SparkとHadoopの違い

この記事は以下の記事の翻訳、要約、及び筆者が調べたことのまとめです。 www.scnsoft.com 両方ともApacheによるOSSである。2017年時点では歴史の長いHadoopがより多く使われているが、Sparkも爆発的に人気を上げていてパフォーマンスもよい。 主な違い Spar…

Google ColaboratryでGoogle Driveからデータセットをインポートする

Google ColaboratoryにはPythonでGoogle Driveを扱うためのPyDriveが標準で入っていないので、初めに!pip install -U PyDriveする。 そしたら必要なライブラリを読み込む。 !pip install -U PyDrive from pydrive.auth import GoogleAuth from pydrive.drive…

はてなで二重線の白抜き文字を書く

実数Rや整数Zなどをやのように書く方法は、 \mathbb{白抜きにしたい文字} である。文字と数字だけを白抜き文字にしてくれる。 例 [tex: \mathbb{R}] [tex: \mathbb{Z}] [tex: \mathbb{0}] [tex: \mathbb{\pi = 3.14}]

Google ColaboratoryにTexを記述する

とても簡単、Textセルの中でTexを$2つでくくるだけ。 https://colab.research.google.com/notebooks/basic_features_overview.ipynb#scrollTo=Id6tDF1HQSHD

はてなに数式(TeX)を記述する方法

数式(TeX)を埋め込む ブログ執筆画面で、Edit => "Markdown"を選択し、 [tex: ここにTeXを記述] と書くだけ。 正規分布の例: [tex: f\left( x\right) =\dfrac {1}{\sqrt {2\pi \sigma ^{2}}}e^{-\dfrac {\left( x-\mu \right) ^{2}}{2\sigma ^{2}}}] と記…