ill-identified diary

所属組織の見解などとは一切関係なく小難しい話しかしません

ベクトルとのbsts異種試合た

本記事はエイプリルフール用の特別記事です. 種明かし編はこちらです.ill-identified.hatenablog.com 状態空間モデルの回帰ならばxubuntuされている.これで表現できる.顔写真あるいは弾人間に自由意志普及の上記さtributionofIncomeonJSTORというおり,従属変…

『ベイズ統計の理論と方法』の行間を読む I

渡辺澄夫『ベイズ統計の理論と方法』の補足説明っぽいことを書いた。

[R] 『Rで名刺 ggplot2編』の真似をした

Rおじさんは名刺もRで作る。

[事務連絡] ネイチャーインサイト株式会社を退職しました

ネイチャーインサイト株式会社を2017年12月末(28日)付けで退職しました。お世話になりました。

英語版ブログ開設のお知らせ

タイトルのとおり。英語版ブログを開設した。 en-ill-identified.blogspot.jp とりあえず1つだけ記事を書いた。 どれくらいのペースで更新するか、このブログとどうすみ分けるのか、こっちの記事を適当に英訳するだけにするのかとか、方向性はするかなどはま…

[R] 非ガウシアン状態空間対応パッケージ, KFAS の使い方

R の状態空間モデル計算パッケージ KFAS は、正規分布以外のモデルにも適用可能な便利なパッケージである. この KFAS を, 交通事故件数モデルの実例を用いて解説する

[R] bsts (ベイズ構造時系列モデル) パッケージの使い方

Google の研究者が開発した R 用の時系列予測パッケージ BSTS (ベイズ構造時系列モデル, Bayesian structural time series model) の理念と使い方を解説する.

[R] [bsts, dlm, KFAS] マーケティングの状態空間モデリング

概要 岩波 DS Vol. 6 での佐藤忠彦 (2017, 状態空間モデルのマーケティングへの応用)の記事でなされた小売業の売上量のモデリングを R で再現してみる. dlm と KFAS, そしてbstsパッケージを利用して, それぞれでプログラムを書いてみる. 最近はゆるめの読み…

[R] 計量経済学と機械学習の違い

ユリウス暦2020/1/6更新: その後のこの分野の急速な発展のため, 情報を更新した ill-identified.hatenablog.com概要 機械学習か経済学 (計量経済学) そのいずれかに関してある程度の知識がある人間向け もうすでにこのネタでブログその他がいくつも書かれた…

[宣伝] SAS ユーザー総会 2017で発表する

久々の更新だが, 残念ながら大したことは書かない.去年に引き続き, 8月4日の SASユーザー総会 2017 で発表する. 今年は都内で開催される. www.sascom.jp 場所: 東京大学伊藤国際学術研究センター, room D-07 時間: 8月4日 (2日目) 11:00 - 11:30 タイトル:『…

結局のところ, TeX (+ LyX) と Word のどちらが文書作成しやすいのか

概要MS Office Word (以下, Word) と TeX はいずれも文書作成で使われるが, 結局の所どちらが使いやすいのか. ここでは論文・レポート作成を例にして検討してみる.Word と TeX の比較に言及するページはかなり多く存在するが, 内容が断片的だったり大雑把で…

[R] 予測モデルを作るには formula を活用せよ

予測モデルを構築する時は変数の変換と取捨選択を試行錯誤する必要があるが, R の formula を活用すれば楽にできる.

[教材] 今更だが, ベイズ統計とは何なのか.

もう2017年だがベイズ統計と頻度主義統計学のちがいについての説明文を書いた. 歴史的経緯による違いから実用上の利点と問題まで.

[R] [教材]アニメーションで学ぶカルマンフィルタ

概要 すごく今更感があるが, カルマンフィルタのフィルタリングの話. アニメーションを作ってみたかっただけともいう. 簡単な説明なのでもっと具体的な話は他の文献で勉強して欲しい. カルマンフィルタのアニメーションを作成している記事は既にがあるのだが…

[stan][R] RFM分析と階層ベイズ法 (解決編)

前回うまくいかなかった stan を用いたRFM分析の決着編。

[stan] [jags] ggmcmc でMCMCの事後診断

2019/12/15 追記: 現在は ggmcmcよりもbayesplotのほうがおすすめです ill-identified.hatenablog.com概要これまで, stan などのサンプリング結果を R で処理するのが面倒だと思っていたのだが, いまさら ggmcmc パッケージという便利なものに気づいた. rsta…

[R] glmnet を glm みたいに使う

2019/12/15 追記: 今は caret, mlr, mlr3等便利バッケージが増えたので, 以下の内容をあえて使うメリットはないです.概要 本文よりリンクの面積の方が大きいしょぼい記事 glmnet() を glm() の構文っぽく使う関数を雑に作った. 今は caretがあるのであまり意…

[R] 東京都の所得階級分布から元の分布を推定する方法

土地統計調査の世帯収入は不完全な階級化データでしか公開されないため, 全世帯の平均収入を直接計算することが出来ない。そこで、東京都のデータを使って確率モデルを仮定して世帯収入分布を推定する方法を紹介する。

Ubuntu 16.04 で GPU 対応版 TensorFlow をanaconda 環境でインストールした話

Ubuntu 16.04 で GPU対応した Tensorflow を anaconda 環境にインストールした事例.

[事後連絡] SAS ユーザー総会 2016 で発表してきた

仕事に関係のあることは書かないという建前だが, 7/21-22 に神戸国際会議場で開催された SAS ユーザー総会 2016 で会社名義で発表した. www.sascom.jp 2日目 B-03 が自分の発表。 以上

[STAN] [R] STAN の出力加工方法2 DIC の計算

概要 前回の(R) Stan の出力加工方法 - ill-identified diaryのおまけ的な形で書いた. BUGS には DIC を計算する機能があるらしいが, rstan にはないので書いてみた. Spiegelhalter et al. (2002) で提案された DIC, デビアンス情報量規準はベイズ統計でモデ…

(R) Stan の出力加工方法

概要 忙しくて2ヶ月連続無更新になりそうになっているところをなんとか回避したいという妥協の産物 stan および rstan のモデルの事後診断機能がやや物足りないのでそれを補うヒント 本当に簡単な話 2016/10/07: Accessing the contents of a stanfit object…

[python] [stan] 潜在変数と階層ベイズ法と RFM 分析 [未完成]

RFM 分析を潜在変数と階層ベイズを使って表現する阿部(2011)を stan でできないか挑戦。まだ未完成。

[stan] [R] ベクトル ARIMA (VARIMA) で人口予測 (?)

概要 前回 VARMA の話をしたのに関連して, 単なるテクニカルな話題から, もう少し実用性のある話にしてみた. 都道府県別の人口の時系列データを VARIMA を当てはめてみた. 今月は時間がなかったのであまり大した内容ではない. 5ページ程度. 中途半端. VARMA …

[R] [Stan] で ベクトル ARMA (VARMA) を推定

Stan で VARMA のパラメータを推定するプログラムを用意した. Stan は始めたばかりなのでまだ効率的なコードでないかもしれない.

[QGIS] [R] QGIS と空間統計モデル (CARモデル)

概要・前置き 以前も何度か R で地図を作る方法を紹介していたが, 自分のプログラミングテクが雑なこともあり, 冗長なコードの掲載であまり便利でないのではという印象を持たれる恐れもあった. そこで, GUI で操作のできるわりに高機能な QGIS (Quantum GIS;…

[異種試合] ディープラーニングVSディープパラメータ

ユリウス暦2020/1/6更新: その後のこの分野の急速な発展のため, 情報を更新した ill-identified.hatenablog.com 概要今やかなり使い古された感じのあるテーマだが, 統計学と機械学習の違いについて, 分析の対象が社会現象である場合に限定して自分なりの考え…

SASでの文字コードの扱い方

概要あんまりないと思うが, 文字コードが異なるOS間でデータのやりとりをするときの話. SAS でセッションのエンコーディングと異なる文字コードのテキストを読み込む or 書き出す方法について データセットのエンコーディングが異なる場合のやり取りについて…

[R] ふだんと少し違うソローモデル

概要 普段とは趣向を変えて, R でソローモデルのシミュレーションをする. そのままだとつまらないので, ソローモデルの人口成長の前提条件をロジスティック法則としてみる. 分量はPDF換算で 6 ページ. ロジスティック法則についてソローモデルや, 他の多くの…

時系列編の続き: サンプルサイズが小さいときの情報量基準

概要前回の[[R] 回帰分析で適切な方法を使わないとどうなるか (時系列編) - ill-identified diary]で, 「時系列分析の場合は線型過程のラグ項の次数が分からないことが普通ではないか (なので実用性に欠ける用例でないか)」という指摘をいただいたので, 過去…