全数調査 --- 全てのデータを取得できれば統計分析は必要ない, 全てのログデータを使えば機械学習は完全にうまく行く... それらは全て誤りである. 母集団の考え方は意外と教科書でもはっきりと教えていないので, 新しい視点で説明してみた
randomForest::MDSplot() が `ggplot2` で描かれたグラフじゃないのは不便なので作った.
Rグラフで日本語フォントを表示する方法が新旧OSいろいろばらばらだったのでまとめた
まじでメモ まじで情報がない 能書き 主なオプション style natbib sorting, sortlocale backend 結論 補足: 記述例 能書きBibLaTeX はマジで日本語情報が不足してるのでとりあえずメモ. 「BiBLaTeXに移行して日本語文献がうまく出力できないので調べている…
Rデータセットのヘルプドキュメントを一括取得してデータを簡単に探す方法……あまり簡単ではなかった
R Markdown の YAML ヘッダでわかりにくくエラーの原因になりがちな箇所を逆噴射文体で解説する
いまはまだLaTeXをはてな記法に変換することしかできないが, そのうちRStudioからも直接送れるようになる
dplyr (tidyverse) の時代に合った新しい時系列データ処理用パッケージをいろいろ比較した結果……へのリンク
2020/7/10 追記: 更新していろいろ変わった. 特に名前が rmdCJKからrmdjaに変わっている点に注意 2020/9/21 追記: リポジトリ変更こっちの内容は古くなったので R Markdown の日本語テンプレートが欲しい場合や技術的な詳細は GitHub - Gedevan-Aleksizde/rm…
Vehtali et al(2020) で提案されたランクプロットやbulk-ESSに関する解説
これを読んでわかること haven はSASやSTATA, SPSSなど変数ラベルのあるフォーマットのデータも読み込める labelled::var_label()でデータフレームの各変数に一括してラベルを付加できる expss::use_labels()を使えばグラフや要約統計量に表示される変数名を…
概要六角形のあれRSudioのロゴ (CC-0)現在の入手方法昔は RStudioの公式サイトで通販できたがこのページでは今はマグカップとTシャツしか販売していない.rstudio.comこっちにも公式グッズらしきものがあるがステッカーはない.www.redbubble.comRStudio社がス…
第84回Tokyo.Rの発表資料です. 前回言ったようにrmarkdown使用中なので本体は Rpubs に上げた.感染症の流行を表す数理モデルに, SIR, SEIRといった古典的なものがある. これらのモデルの特徴について説明し, Rで計算する方法にも言及した. さらに最近流行し…
先日の第83回Tokyo.Rで構造推定に関する発表をした. 以前の発表資料(https://github.com/Gedevan-Aleksizde/20190703_ML_ECON)の加筆が直前まで長引いてたため, 正味3日くらいしか準備できる時間がなかった. そこで以前の発表ですこしだけ触れた構造推定につ…
第80回Tokyo.Rの発表の補足として書かれた長文
概要 イントロダクション 再現性に関する解説 「初心者の質問」特有の問題 補足:「再現性」と「再現可能性」 不変的で再現可能な入門用標本抽出器, IRIS の提案 解説 意味がわからない人へのネタバレ その他 概要R の初心者の質問などで役立つように再現性を…
2019年Japan.Rで公開した怪文書のhtml版
Ubuntu OS, R 上で GPU 版 mxnet や keras (tensorflow) を動かしたかったのでインストールした話.
CausalImpact パッケージに関して, ただひたすら長いだけのうんちく書いた. 27ページ相当.
近年, 飯野山が正規分布と言われて久しい. しかしながら, 具体的なパラメータを推定した先行研究は存在しない. 本稿では, 正規分布への当てはめを行うとともに, 飯野山の分布形状のもつ非ガウシアンな要素に着目し, 頂点付近が平坦になる分布に関しても議論…
図1: Monte-Carlo, from Neugebauer (2018) イントロダクション モンテカルロ法とは どこを見て収束を確認するか トレースプロット GR統計量 を確認する. 多重連鎖はいくつ必要か 自己相関関数 (ACF, コレログラム) 有効サンプルサイズ 事後診断ツール bayes…
機械学習のエイプリルフール記事です.
Mendeley から Zotero へ移行するときのメモ
小林慶一郎氏の『AIと超人類の時代 弱者がもつ強み』の解説
概要 予備知識のセットアップ 目的は因果推論 一般化モーメント法 (GMM) カーネル回帰 ランダムフォレスト 本題 参考文献 概要Athey, Tibshirani, & Wager (2016, Generalized Random Forests) で提案されている Generalized Random Forest (GRF) について解…
R を使い OpenStreetMap API で道路データを取得してグラフを作る話
prophet パッケージを例にベイズ統計モデルについて説明する
発端 www.datasciencecentral.com というData Science Central の記事が,"A good reminder that Data Science Central is completely insane" https://t.co/68esZTv88d— mat kelcey (@mat_kelcey) 2018年5月22日 (Data Science Central が完全にデタラメであ…
本記事は 以下の2018年4月1日付のエイプリルフール特別企画エントリのネタバレ編です. 文体が多少異なりますが, 内容は概ね同じです. こちらの記事が読みづらいという方は本エントリをお読みください. ill-identified.hatenablog.com 概要最近は知識をひけら…
本記事はエイプリルフール用の特別記事です. 威圧的・挑発的な文体はジョークです. 種明かし編はこちらです. ill-identified.hatenablog.com 概要よくきたな. おれは ill-identified だ.おれは日頃から長文で難解な記事ばかり書いている. そこで難解な長文に…