ill-identified diary

所属組織の見解などとは一切関係なく小難しい話しかしません

2020-01-01から1年間の記事一覧

[R][初心者の質問] mice で多重代入法の結果を統合できない時の対処法

R の mice パッケージの pool 関数がうまく使えない人への回答

[小ネタ] 自作 R パッケージのメッセージをローカライズする

R

概要公式ドキュメント “Translating R Messages, R >= 3.0.0” の記述をパッケージ開発の観点で簡単に紹介する.イントロダクション湯谷氏が『Rパッケージ開発入門』の補足として書いた文書にもあるが, この情報だけだとまだつまずくところがいくらかあったの…

[小ネタ] R でコロプレス図 (色分け地図) をなるべく簡単に描く

概要R-wakalang に投稿された質問を元にした小ネタ. タイトルの通り sf と ggplot2 パッケージを使ったコロプレス図 (色分け地図) の作成方法を紹介する*1. あまり R に習熟していない人向けにごく簡単な例だけを紹介する.関連する話を取り上げているページ…

「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 -

全数調査 --- 全てのデータを取得できれば統計分析は必要ない, 全てのログデータを使えば機械学習は完全にうまく行く... それらは全て誤りである. 母集団の考え方は意外と教科書でもはっきりと教えていないので, 新しい視点で説明してみた

[小ネタ] [R] randomForest::MDSplot() を ggplot2 で書き直す

randomForest::MDSplot() が `ggplot2` で描かれたグラフじゃないのは不便なので作った.

おまえはもうRのグラフの日本語表示に悩まない (各OS対応)

Rグラフで日本語フォントを表示する方法が新旧OSいろいろばらばらだったのでまとめた

(u)pBibTeX から biblatex に移行できるか (備忘録) (未完成)

まじでメモ まじで情報がない 能書き 主なオプション style natbib sorting, sortlocale backend 結論 補足: 記述例 能書きBibLaTeX はマジで日本語情報が不足してるのでとりあえずメモ. 「BiBLaTeXに移行して日本語文献がうまく出力できないので調べている…

[R] 小ネタ: Rのサンプルデータの詳細情報を一括表示する

Rデータセットのヘルプドキュメントを一括取得してデータを簡単に探す方法……あまり簡単ではなかった

[R] R Markdown の YAML ヘッダでハマったおまえのための記事

R Markdown の YAML ヘッダでわかりにくくエラーの原因になりがちな箇所を逆噴射文体で解説する

LaTeXをはてなブログに変換する pandoc フィルタを作った

いまはまだLaTeXをはてな記法に変換することしかできないが, そのうちRStudioからも直接送れるようになる

[R] dplyr 1.0.0 時代の時系列データ処理 — 特に移動集計 —

dplyr (tidyverse) の時代に合った新しい時系列データ処理用パッケージをいろいろ比較した結果……へのリンク

[R] [TeX] rmarkdownでスライドをpdfで出力するフォーマットパッケージを作った

2020/7/10 追記: 更新していろいろ変わった. 特に名前が rmdCJKからrmdjaに変わっている点に注意 2020/9/21 追記: リポジトリ変更こっちの内容は古くなったので R Markdown の日本語テンプレートが欲しい場合や技術的な詳細は GitHub - Gedevan-Aleksizde/rm…

[R][Stan]マルコフ連鎖モンテカルロ法の実践ガイド2: ランクプロット他

Vehtali et al(2020) で提案されたランクプロットやbulk-ESSに関する解説

[R] データフレームの変数に日本語ラベルを付けたいとき

これを読んでわかること haven はSASやSTATA, SPSSなど変数ラベルのあるフォーマットのデータも読み込める labelled::var_label()でデータフレームの各変数に一括してラベルを付加できる expss::use_labels()を使えばグラフや要約統計量に表示される変数名を…

Rステッカーの入手方法

概要六角形のあれRSudioのロゴ (CC-0)現在の入手方法昔は RStudioの公式サイトで通販できたがこのページでは今はマグカップとTシャツしか販売していない.rstudio.comこっちにも公式グッズらしきものがあるがステッカーはない.www.redbubble.comRStudio社がス…

[R] とパンデミックの数理モデル 新型コロナウィルス(COVID-19)研究を例に

第84回Tokyo.Rの発表資料です. 前回言ったようにrmarkdown使用中なので本体は Rpubs に上げた.感染症の流行を表す数理モデルに, SIR, SEIRといった古典的なものがある. これらのモデルの特徴について説明し, Rで計算する方法にも言及した. さらに最近流行し…

RでOlley-Pakesの構造推定を書く例とbookdown

先日の第83回Tokyo.Rで構造推定に関する発表をした. 以前の発表資料(https://github.com/Gedevan-Aleksizde/20190703_ML_ECON)の加筆が直前まで長引いてたため, 正味3日くらいしか準備できる時間がなかった. そこで以前の発表ですこしだけ触れた構造推定につ…

計量経済学と機械学習の関係 –AI はさだめ, さだめは反事実 (転送用)

第80回Tokyo.Rの発表の補足として書かれた長文