2014-01-01から1年間の記事一覧
概要 以前 紹介した streamR を利用して, 選挙前11日分のツイートを取得していた. しかし活用方法が分からないので簡単な集計結果のみ公開 ggplot2, dplyr などを使ってグラフにまとめる例を示す streamR でツイートを集める 1時間単位でツイートを収集し, t…
前回のRDD理論編を踏まえて, 前回 紹介した, Angrist and lavy(1999) "Using Maimonides' Rule to Estimate the Effect of Class Size on Scholastic Achievement" (以下 AL1999 と呼ぶ) のサンプルデータが著者の一人アングリストの所属する MIT Economics …
2014/12/18 実践編を更新 [計量経済学][時事ネタ?] 非連続回帰デザイン (RDD) 実践編 - ill-identified diary 概要 数式が多い Sharp RD と Fuzzy RD の手法について前回より厳密かつ実用性のある説明をする. R の rdd パッケージを使って実演する. → 理論の…
RDDとは? 前回 で言及したRDDについて, もう少し詳しく話すために個別に記事を書いた. Regression-Discontinuity Design (RDD) "Reforms as Experiments" は, Campbell (1969) で, 政策評価のために提案された方法論. Campbell (1969) には RDD 以外の話題も…
2014/11/20 時事ネタと言いつつ時事ネタへの言及が皆無だったので加筆 前置き 時事ネタ (NHK: 自民党 35人学級見直し反対の決議案) というほど時事問題に踏み込んではいないが, 少人数教育に関する研究として, J. D. アングリストと V. レヴィによる1999年…
2014/09/22 SQL 学習用の参考サイトを申し訳程度に追加 要約 今回の記事は プログラミングをあまりしたことのない (文系の) 学生で 卒論 (もしくは修論も?) で回帰分析など, 定量的な研究をしてみたいと考えている 人を読者層に想定して書いた. では何を書く…
概要 ubuntu 14.04 で xkb の設定を変えて Caps Lock を 好きなキーに変える方法 無変換キーをエスケープキーにする方法 他のキーの機能も変更できるようにするヒント を紹介します. 2015/6/17: 起動時に自動で設定を反映する方法について追記 2016/8/14: Ub…
(お断り) 今回はお役立ち情報というより読み物, あるいは筆者の政治的主張です. 2016/7/18: 「サンプル数」について加筆 母数はパラメータの訳語 確率論・統計学で用いられるパラメータ (parameter) は, 確率分布の特徴を表す値で, 日本語では「母数」と訳さ…
画像は60年代の東京都心の路線 (変わってない) 前回までのあらすじ 国交省の国土数値情報データベースからダウンロードした国内の過去存在した鉄道のデータを R で読み込み, 任意の時期の鉄道を表示する方法を紹介した. しかし, R では静止画像で表示するこ…
今回やること 国土交通省の国土数値情報ダウンロードサービスから鉄道の時系列データをダウンロードし, 国内の鉄道路線網がどう変わっていったかを, R を用いた処理方法を解説しつつ, 可視化してみる. 今回も R を使ってグラフを作成する. 以前の[R] Rで学ぶ…
線形回帰モデルのときは, 決定係数 という指標で, そのモデルの当てはまりの良さ, 言い換えるなら実際に観察された現実のできごとをどれくらい説明できるかを表すことができた. 決定係数の長所は, 必ずゼロから1の範囲になるため, 直感的に当てはまりの良し…
前回の多項ロジット (混合ロジット) の話に引き続いて, 多項ロジットが使えない場合の手法について書いておく. 今回言及するのは: IIAの仮定を検証する方法 ネステッド・ロジット 実行方法 一般化極値 (GEV) モデル 混合モデル (Mixture Model) 実行方法 で…
2014/06/12: データの加工方法を加筆 2014/06/14: 多項ロジット, 条件付き・混合ロジットを混同しないよう修正 離散選択が消費者の購買行動を分析するのにどう利用されているか, ということについて調べていたので, その要約を書いておく. 自分はマーケティ…
2020/7/6 追記: 最近は overleaf を始め使いやすいTeXエディタが増えてきたため, 必ずしも LyX が最も優れたエディタとは言えなくなってきた. 一方で, きちんとした日本語文書を作成するにはなんだかんだで細かい設定が必要になることが多い. そのため, R言…
注記 2014/11/8 シェイプファイルの利用元を ESRI から国土数値情報に変更し, 若干修正 概要 maptools パッケージを使ってGISデータをRに取り込み, 操作する方法を紹介する 意地でも ggplot2 パッケージをつかってGISデータからコロプレス地図 (塗り分け地図…
概要 前回 (ggplot2 で積み上げ折れ線グラフ(エリアプロット)を作成する方法) に引き続き, ggpplot の作例を紹介する. 前回は時系列データから積み上げ折れ線グラフを作成したのに対し, 今回は2014年2月9日に行われた東京都知事選挙の結果という横断面デー…
概要 時系列データセットを加工し, ggplot2 で作図する場合を例に, 以下のことに言及する. ggplot2で複数の系列の折れ線を1つのグラフに表示する方法 さらにそれを積み上げグラフ(エリアプロット)に変形する方法 デザインを洗練する方法 -- 色系統の変更 -…
記事というか, 既出情報のまとめっぽい感じになってしまった. 独自性や貢献はあまりない. 自分は普段 ubuntu 使ってるので windows とかだと少し勝手が違うかもしれない. XeLaTeX を使う 自分は普段 XeLaTeX を使っている. 理由は (ほとんど 1. だけだが) 以…
前置き 記述統計について書いた前回に引き続き, 回帰分析の結果をスマートに表にまとめる方法を複数のパッケージを比較しつつ紹介する. 前回に引き続き, xtable, latex, stagazer 関数の他, 新たに texreg についても紹介したい. 経済学系の論文では, 回帰分…
R でツイッターから情報を取得するパッケージは twitteR が有名だが*1, R で Streaming API へアクセスできる streamRパッケージを紹介してみたい. streamR の概要 CRAN - Package streamR によると作者は NYU の Ph.D. candidate (現在) の Pablo Barberá …
2014/01/28加筆修正 途中で疲れたので記述統計のみです. 要約 手っ取り早く体裁の整った記述統計を出力したい場合は stargazer ある程度自由の効き, かつ手軽なのは describe+xtable 細かい体裁に拘りたい場合は describe+latex latex 形式への出力 というわ…
学生版は32bit限定のため、 64bit版 Ubuntu ではインストール時や起動時に不具合が発生するおそれがある。 以下は自分が64bit版 Ubuntu 13.04でMATLAB R2012a学生版を起動までこぎつけた時のメモ.とはいえ、大半はMATLAB-Community Ubuntu Documentationの要…
経済学系の統計解析で便利な STATA ですが、有償なので多くの学生は大学の PC に用意されているものを使うはず。しかしこの STATA, 便利なのですがちょっとマイナーな手法になると実装されていないため、自作するかネット上で公開されている外部モジュールに…
経済学系の統計解析で便利な STATA ですが、どうも結果出力が貧弱です。 デフォルトでは TeX 形式で出力してくれないし、エクセルにコピペしようとしてもセルがうまく区切られなかったりします (その点 EViews は結果出力の編集がしやすかった。私は最初はエ…