ill-identified diary

所属組織の見解などとは一切関係なく小難しい話しかしません

誤解から学ぶシリーズ

今度こそ火鍋型分類機械学習モデルhotpotパッケージを実装した

概要 要約 先行研究 モデル デモ 実用的なのか? 参考文献 概要 SojinProject, CC-BY-SA-4.0 2日遅れのエイプリルフール 要約分類モデルとして見たロジスティック回帰の分類境界線は、『誤った図解から学ぶロジスティック回帰の性質』で指摘したように曲線で…

Rubin が「ベイジアンブートストラップ」を通して言いたかったこと

概要 Rubin の 1981年の “The Bayesian Bootstrap” とそれに関連する話の認識共有 以前の投稿でいまいちはっきりしない書き方をしたのでその訂正的な意味合いもある 正直なところ「役に立つ」系の話ではないし 「なるほど」系の話でもない やっぱり BB 自体…

久々に R の ... に騙されたので結果が正しいかどうか確認しないとダメなアンチパターン集を書く

R の ... を始めユーザがよく理解してないとそもそも間違ってることにすら気づかない罠にハマる恐れがあるというお説教を自分の失敗をきっかけに書いた

「機械学習とビジネスを橋渡しするものこそ評価指標であり, "全てのビジネスは条件付期待値の最大化問題として書ける"」という話の問題点と代替案

収益最大化を条件付き期待値の最大化問題と考えたときにどういう問題が発生するかと, その解決方法についての空想

「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 -

全数調査 --- 全てのデータを取得できれば統計分析は必要ない, 全てのログデータを使えば機械学習は完全にうまく行く... それらは全て誤りである. 母集団の考え方は意外と教科書でもはっきりと教えていないので, 新しい視点で説明してみた

「AIの正体は最小二乗法」記事を読み解く

小林慶一郎氏の『AIと超人類の時代 弱者がもつ強み』の解説

誤った図解から学ぶロジスティック回帰の性質

発端 www.datasciencecentral.com というData Science Central の記事が,"A good reminder that Data Science Central is completely insane" https://t.co/68esZTv88d— mat kelcey (@mat_kelcey) 2018年5月22日 (Data Science Central が完全にデタラメであ…

[教材] 今更だが, ベイズ統計とは何なのか.

もう2017年だがベイズ統計と頻度主義統計学のちがいについての説明文を書いた. 歴史的経緯による違いから実用上の利点と問題まで.