ill-identified diary

所属組織の見解などとは一切関係なく小難しい話しかしません

R

[R] R Markdown の YAML ヘッダでハマったおまえのための記事

R Markdown の YAML ヘッダでわかりにくくエラーの原因になりがちな箇所を逆噴射文体で解説する

[R] dplyr 1.0.0 時代の時系列データ処理 — 特に移動集計 —

dplyr (tidyverse) の時代に合った新しい時系列データ処理用パッケージをいろいろ比較した結果……へのリンク

[R] [TeX] rmarkdownでスライドをpdfで出力するフォーマットパッケージを作った

2020/7/10 追記: 更新していろいろ変わった. 特に名前が rmdCJKからrmdjaに変わっている点に注意 2020/9/21 追記: リポジトリ変更こっちの内容は古くなったので R Markdown の日本語テンプレートが欲しい場合や技術的な詳細は GitHub - Gedevan-Aleksizde/rm…

[R][Stan]マルコフ連鎖モンテカルロ法の実践ガイド2: ランクプロット他

Vehtali et al(2020) で提案されたランクプロットやbulk-ESSに関する解説

[R] データフレームの変数に日本語ラベルを付けたいとき

これを読んでわかること haven はSASやSTATA, SPSSなど変数ラベルのあるフォーマットのデータも読み込める labelled::var_label()でデータフレームの各変数に一括してラベルを付加できる expss::use_labels()を使えばグラフや要約統計量に表示される変数名を…

Rステッカーの入手方法

概要六角形のあれRSudioのロゴ (CC-0)現在の入手方法昔は RStudioの公式サイトで通販できたがこのページでは今はマグカップとTシャツしか販売していない.rstudio.comこっちにも公式グッズらしきものがあるがステッカーはない.www.redbubble.comRStudio社がス…

[R] とパンデミックの数理モデル 新型コロナウィルス(COVID-19)研究を例に

第84回Tokyo.Rの発表資料です. 前回言ったようにrmarkdown使用中なので本体は Rpubs に上げた.感染症の流行を表す数理モデルに, SIR, SEIRといった古典的なものがある. これらのモデルの特徴について説明し, Rで計算する方法にも言及した. さらに最近流行し…

RでOlley-Pakesの構造推定を書く例とbookdown

先日の第83回Tokyo.Rで構造推定に関する発表をした. 以前の発表資料(https://github.com/Gedevan-Aleksizde/20190703_ML_ECON)の加筆が直前まで長引いてたため, 正味3日くらいしか準備できる時間がなかった. そこで以前の発表ですこしだけ触れた構造推定につ…

IRIS: R 質問チャンネルで再現性を担保するための標本抽出器

概要 イントロダクション 再現性に関する解説 「初心者の質問」特有の問題 補足:「再現性」と「再現可能性」 不変的で再現可能な入門用標本抽出器, IRIS の提案 解説 意味がわからない人へのネタバレ その他 概要R の初心者の質問などで役立つように再現性を…

三国志で学ぶデータ分析 (原稿写し)

2019年Japan.Rで公開した怪文書のhtml版

[メモ] R 上でディープラーニングをGPUで動かす: Mxnet, tensorflow, keras

Ubuntu OS, R 上で GPU 版 mxnet や keras (tensorflow) を動かしたかったのでインストールした話.

[R] CausalImpact でできること, できないこと

CausalImpact パッケージに関して, ただひたすら長いだけのうんちく書いた. 27ページ相当.

[R] 飯野山 (讃岐富士) は正規分布らしいのでパラメータを推定する

近年, 飯野山が正規分布と言われて久しい. しかしながら, 具体的なパラメータを推定した先行研究は存在しない. 本稿では, 正規分布への当てはめを行うとともに, 飯野山の分布形状のもつ非ガウシアンな要素に着目し, 頂点付近が平坦になる分布に関しても議論…

[R] [stan] bayesplot を使ったモンテカルロ法の実践ガイド

図1: Monte-Carlo, from Neugebauer (2018) イントロダクション モンテカルロ法とは どこを見て収束を確認するか トレースプロット GR統計量 を確認する. 多重連鎖はいくつ必要か 自己相関関数 (ACF, コレログラム) 有効サンプルサイズ 事後診断ツール bayes…

[R] [OpenStreatMap] 東京の道路データをグラフに要約する

R を使い OpenStreetMap API で道路データを取得してグラフを作る話

[R] fb Prophet の解剖で学ぶベイズ時系列モデリング

prophet パッケージを例にベイズ統計モデルについて説明する

[R] 『Rで名刺 ggplot2編』の真似をした

Rおじさんは名刺もRで作る。

[R] 非ガウシアン状態空間対応パッケージ, KFAS の使い方

R の状態空間モデル計算パッケージ KFAS は、正規分布以外のモデルにも適用可能な便利なパッケージである. この KFAS を, 交通事故件数モデルの実例を用いて解説する

[R] bsts (ベイズ構造時系列モデル) パッケージの使い方

Google の研究者が開発した R 用の時系列予測パッケージ BSTS (ベイズ構造時系列モデル, Bayesian structural time series model) の理念と使い方を解説する.

[R] [bsts, dlm, KFAS] マーケティングの状態空間モデリング

概要 岩波 DS Vol. 6 での佐藤忠彦 (2017, 状態空間モデルのマーケティングへの応用)の記事でなされた小売業の売上量のモデリングを R で再現してみる. dlm と KFAS, そしてbstsパッケージを利用して, それぞれでプログラムを書いてみる. 最近はゆるめの読み…

[R] 計量経済学と機械学習の違い

ユリウス暦2020/1/6更新: その後のこの分野の急速な発展のため, 情報を更新した ill-identified.hatenablog.com概要 機械学習か経済学 (計量経済学) そのいずれかに関してある程度の知識がある人間向け もうすでにこのネタでブログその他がいくつも書かれた…

[R] 予測モデルを作るには formula を活用せよ

予測モデルを構築する時は変数の変換と取捨選択を試行錯誤する必要があるが, R の formula を活用すれば楽にできる.

[R] [教材]アニメーションで学ぶカルマンフィルタ

概要 すごく今更感があるが, カルマンフィルタのフィルタリングの話. アニメーションを作ってみたかっただけともいう. 簡単な説明なのでもっと具体的な話は他の文献で勉強して欲しい. カルマンフィルタのアニメーションを作成している記事は既にがあるのだが…

[stan][R] RFM分析と階層ベイズ法 (解決編)

前回うまくいかなかった stan を用いたRFM分析の決着編。

[stan] [jags] ggmcmc でMCMCの事後診断

2019/12/15 追記: 現在は ggmcmcよりもbayesplotのほうがおすすめです ill-identified.hatenablog.com概要これまで, stan などのサンプリング結果を R で処理するのが面倒だと思っていたのだが, いまさら ggmcmc パッケージという便利なものに気づいた. rsta…

[R] glmnet を glm みたいに使う

2019/12/15 追記: 今は caret, mlr, mlr3等便利バッケージが増えたので, 以下の内容をあえて使うメリットはないです.概要 本文よりリンクの面積の方が大きいしょぼい記事 glmnet() を glm() の構文っぽく使う関数を雑に作った. 今は caretがあるのであまり意…

[R] 東京都の所得階級分布から元の分布を推定する方法

土地統計調査の世帯収入は不完全な階級化データでしか公開されないため, 全世帯の平均収入を直接計算することが出来ない。そこで、東京都のデータを使って確率モデルを仮定して世帯収入分布を推定する方法を紹介する。

[STAN] [R] STAN の出力加工方法2 DIC の計算

概要 前回の(R) Stan の出力加工方法 - ill-identified diaryのおまけ的な形で書いた. BUGS には DIC を計算する機能があるらしいが, rstan にはないので書いてみた. Spiegelhalter et al. (2002) で提案された DIC, デビアンス情報量規準はベイズ統計でモデ…

(R) Stan の出力加工方法

概要 忙しくて2ヶ月連続無更新になりそうになっているところをなんとか回避したいという妥協の産物 stan および rstan のモデルの事後診断機能がやや物足りないのでそれを補うヒント 本当に簡単な話 2016/10/07: Accessing the contents of a stanfit object…

[stan] [R] ベクトル ARIMA (VARIMA) で人口予測 (?)

概要 前回 VARMA の話をしたのに関連して, 単なるテクニカルな話題から, もう少し実用性のある話にしてみた. 都道府県別の人口の時系列データを VARIMA を当てはめてみた. 今月は時間がなかったのであまり大した内容ではない. 5ページ程度. 中途半端. VARMA …