ill-identified diary

所属組織の見解などとは一切関係なく小難しい話しかしません

Steamワークショップでは9割以上が評価しても星3の評価が付けられる

要約ほんのとりとめのない趣味の話を日記的に書くつもりだったが中身が膨張したのでこっちに書いた. Steamワークショップはストアと違い, 表示されるレートは「プラス評価をした人の割合」とはかけ離れている. DL数または評価者数の少ないmodは, プラス評価…

仕事をやめて剣の修業の旅に出る

本題 タイトルのとおりです. 1月ほど前に告知したとおり退職しました. 正確には5/24付の退職です. 仕事をやめたので退職エントリを書いて剣の修行の旅に出ます. 月末には戻ってくるので失踪届とかは出さないでください.

ロジスティック回帰の4通りの表現+多クラス分類

ロジスティック回帰と多クラスロジスティック回帰の定義は意外とややこしい

TODOリスト2024年4月

ずっと放置してるけど忘れたわけではないタスクの一覧. 4月中にやるという意味ではない 高速な多項プロビットモデルの実装 (MACML) 阿部(2011)のRFM回帰分析のパッケージ化 元の手法では収束の問題があるので、これもなんとか解決したい リーカーターモデル…

「500年後に日本人が佐藤だけになる」という試算の問題と改善

この記事の要約 はじめに 問題点の要約 (追記) 先行研究について GARCH(っぽい)モデルによるシミュレーション シミュレーション前の理論分析 選択的夫婦別姓との比較 (追記) ゴルトン゠ワトソン分枝過程について 使用するデータ シミュレーションの技術的な…

今度こそ火鍋型分類機械学習モデルhotpotパッケージを実装した

概要 要約 先行研究 モデル デモ 実用的なのか? 参考文献 概要 SojinProject, CC-BY-SA-4.0 2日遅れのエイプリルフール 要約分類モデルとして見たロジスティック回帰の分類境界線は、『誤った図解から学ぶロジスティック回帰の性質』で指摘したように曲線で…

Rubin が「ベイジアンブートストラップ」を通して言いたかったこと

概要 Rubin の 1981年の “The Bayesian Bootstrap” とそれに関連する話の認識共有 以前の投稿でいまいちはっきりしない書き方をしたのでその訂正的な意味合いもある 正直なところ「役に立つ」系の話ではないし 「なるほど」系の話でもない やっぱり BB 自体…

Quarto が完成すると Jupyter でも R Markdown のように簡単にスライドや文書を作れるかもしれない

Quarto が完成すれば R Markdown だけでなくJupyterでのドキュメント作成も簡単になるかもしれないという話

R ユーザーのための Pandas 実践ガイド II: siuba と datar

pandas の構文を使いやすくするパッケージ, siuba と datar その他パッケージの機能とパフォーマンスの比較

rsvg で「不」自由に日本語フォントを埋め込む

R

概要 半期の総括のような風の投稿を昨日したばっかりだが, さらに補足. Rグラフィックスの文字化け問題中間報告 (2021年版) - ill-identified diary rsvg パッケージを使えば, Windows や Mac でうまく表示できなかったフォントが使えるかもしれない, と思っ…

Rグラフィックスの文字化け問題中間報告 (2021年版)

概要 去年書いた話のその後の更新について整理した. おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diaryあとこっちのスライドも閲覧数が少しづつ増えてるようなのでMac でも Windows でも, PNG でも PDF でもRのグラフに好きな…

Rで総当たり戦などの組み合わせデータを tidy に扱う

tidyでない組み合わせを表すデータを扱いたいときの回答例

Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド

Python でも楽にグラフを書きたい人のために

久々に R の ... に騙されたので結果が正しいかどうか確認しないとダメなアンチパターン集を書く

R の ... を始めユーザがよく理解してないとそもそも間違ってることにすら気づかない罠にハマる恐れがあるというお説教を自分の失敗をきっかけに書いた

ggplot2 で日付・時刻データを扱うときは日付の型の違いに注意

概要 ggplot2 でx軸が日付・時刻のグラフを描いて, geom_vline() を使うときは値の型を Date か POSIXct に統一しないと正常に表示されないという話 lubridate なんかを使っているとこの辺の違いを忘れがちかもしれない 「as.numeric() 変換で対処する」は今…

[日記] Ubuntu 20.04でWine v6を使いKindleを動かす

要点 Gecko がないと Kindle 上で Amazon のログインページがうまく表示されないらしい Wine v6.0 台でないと上記はサポートされないらしい 以下の投稿を既に見ている人にとっては新しい情報はほぼないので以降を読む価値はない. 近頃Wineで動かしていたKind…

「機械学習とビジネスを橋渡しするものこそ評価指標であり, "全てのビジネスは条件付期待値の最大化問題として書ける"」という話の問題点と代替案

収益最大化を条件付き期待値の最大化問題と考えたときにどういう問題が発生するかと, その解決方法についての空想

[日記] Rで格ゲーのコマンド表を作る

はじめにこれはある意味「エクセルでモザイク画を作ってみた」とか「マインクラフトのゲーム内で計算機を作った」と同類の余興である (そしてスケールの観点からはこれらよりもだいぶ見劣りする). しかしもしかしたらこれを読んでるあなたも将来, 武装勢力に…

WSLでWindows版Rの文字化けに別れを告げる

WindowsのWSL2でRStudioを快適に動かす方法. Ubuntuの設定部分はWSLでなくてもほぼ同じであり実質Ubuntuの設定方法の解説でもある

[書評] RユーザーのためのRStudio「実践」入門

はじめに 本書の特徴 初心者はどう学んでいくといいか 問題点 (本書に限らない一般論?) OS間の違いに対するサポート 以降はもはやただの日記 はじめに(ごめんやっぱ半分以上書評じゃなくて日記だった)松村優哉・湯谷啓明・紀ノ定保礼・前田和寛著『Rユーザー…

【小ネタ】Rpubs のハイパーリンクでうまく飛べない問題をluaフィルタで解消

また誘導用の記事. Rpubs のハイパーリンクがフレーム内で表示されるせいでたまにうまく外部サイトへ飛べない問題を lua フィルターで解決してみました. rpubs.com

[Rpubs] ggplot2 で沖縄をずらして日本地図を描きたい

実行例タイトルと画像の通り. 意外とこの方法のやり方が探しても出てこなかった*1ので書いてみた. はてなブログに投稿するのがめんどくさかったので Rpubs に投稿した. 以下が記事の誘導リンク. rpubs.com追記: twitter で指摘されたように, kuniezu パッケ…

[R Markdown] から [Word] へエクスポートするときのテンプレート (with officedown)

R

概要概要 デフォルトの word_document よりもう少し機能の豊富な Word 用テンプレートを提案する. 概要 初めに 使い方 必要パッケージとインストール 新規作成 カスタマイズ 注意点 解説 簡単なテンプレート 初めに先日の Tokyo.R で意外と Word へのエクス…

[小ネタ] RStudio がこっそりサポートしている言語一覧

初めに RStudio の新規作成ボタンを押して現れるリストには R Script (.R) や R Markdown (.Rmd) 以外にも, いろいろなタイプのファイルがある. たとえば C/C++, Python, SQL, Stan など. これらの「サポート」の充実度合いは差があるが, とりあえず, シンタ…

[日記] RStan がクラッシュすると思ったら原因は stan と関係なかった

なんかよく分からなくて曖昧なままだけどとりあえず書いておく. 久々に RStan を使おうとしたら, こんな感じのエラーが大量に表示され, RStudio がクラッシュした. OS は Ubuntu 20.04. ERROR elf_dynamic_array_reader.h:XX] tag not found ERROR elf_dynam…

[日報: 4/1] R言語で飯を食っていく方法について本を書きました. 皆さんにも特別にお見せします.

タイトルのとおりです. 常にスキルアップや転職を検討するなど, 自信のキャリア選択を日頃から考えなければならないのがプログラマ・エンジニアという職業だと思います. そこで本日4/1, プログラミング言語であるRでどうやって飯を食っていくかを指南する本…

互いに独立でなくてもできる中心極限定理と, そのデモ (Gordin's CLT/Donsker定理)

Lindeberg-Lévy中心極限定理以外のデモもやろう

[メモ] RStudio 1.4 時点での Python 関係トラブルシュートとか

概要先日リリースされた RStudio 1.4.1103 の新機能として, Python 実行環境のサポートが強化されたことが挙げられる*1. たとえば R と同様の環境ペーンが使えるようになったため, グローバルのオブジェクトやロード中のモジュールの一覧を確認しやすくなっ…

[書評]『データ分析のためのデータ可視化入門』と最近の R グラフィックスパッケージ事情

“Data Visualization: A Practical Introduction” の邦訳『データ可視化入門』の紹介+α

[メモ] R Markdown で書かれた R の資料を見つけたらここに書く

R

概要 リスト 無断翻訳不可 翻訳・改変可 ライセンス不明 日本語の資料 概要見つける度に無計画に Pocket とかに保存してたがごちゃごちゃしてきたのでここに書くことにする. キリがないので Rpubs とかはナシ. 主に bookdown で作られた書籍形式の資料.リス…