Machine Morning

機械学習やWebについて学んだことを記録しています。

2018-12-01から1ヶ月間の記事一覧

R studioでファイルを読み込む際の文字コードエラー

R

MacのRStudioでcsvファイルを読み込もうとすると以下のようにinvalid multibyte stringというエラーが出てくる。 > df <- read.csv("filename.csv", header=T, sep=",") Error in make.names(col.names, unique = TRUE) : invalid multibyte string at '<94>N…

標準誤差とは

今回は標準誤差について取り上げる。標準偏差との違いがいまいちわからないという人もいると思うが、これらはまったくの別物であり、推定や検定を理解する上で非常に大切なものである。ただし、ここで扱う標準誤差とはSEM(standard error of the mean)、すな…

テイラー展開からオイラーの等式を導く

世界一美しい等式として有名なオイラーの等式を導出する。 導出の手順は以下の通りである。 、、の多項式近似をテイラー展開で求める。 とを足す。 虚数を指数に導入する。 にを代入する。 まず初めに、、、の多項式近似をテイラー展開で求めると以下のよう…

誤解されがちな信頼区間

学部3年時に取った授業内で、「信頼区間(CI: Confidence Interval)の意味理解してる?」という話になり、当時自分も含め大勢の理解がいい加減だったことを思い出したので、今回はこの話題を取り上げる。ちなみにこの話題を振ってくださったのはダートマス…

標本平均の分散はなぜサンプルサイズnで割るのか

標本平均の分散 (ただしは母分散、はサンプルサイズ)がなぜこのような形になっているのか。 結論から言うと、サンプルサイズが大きければ標本平均の分散は0に収束し、標本平均の期待値が母平均に収束するからである。これは大数の法則が主張したいことその…