ill-identified diary

所属組織の見解などとは一切関係なく小難しい話しかしません

R

Steamワークショップでは9割以上が評価しても星3の評価が付けられる

要約ほんのとりとめのない趣味の話を日記的に書くつもりだったが中身が膨張したのでこっちに書いた. Steamワークショップはストアと違い, 表示されるレートは「プラス評価をした人の割合」とはかけ離れている. DL数または評価者数の少ないmodは, プラス評価…

今度こそ火鍋型分類機械学習モデルhotpotパッケージを実装した

概要 要約 先行研究 モデル デモ 実用的なのか? 参考文献 概要 SojinProject, CC-BY-SA-4.0 2日遅れのエイプリルフール 要約分類モデルとして見たロジスティック回帰の分類境界線は、『誤った図解から学ぶロジスティック回帰の性質』で指摘したように曲線で…

Quarto が完成すると Jupyter でも R Markdown のように簡単にスライドや文書を作れるかもしれない

Quarto が完成すれば R Markdown だけでなくJupyterでのドキュメント作成も簡単になるかもしれないという話

R ユーザーのための Pandas 実践ガイド II: siuba と datar

pandas の構文を使いやすくするパッケージ, siuba と datar その他パッケージの機能とパフォーマンスの比較

rsvg で「不」自由に日本語フォントを埋め込む

R

概要 半期の総括のような風の投稿を昨日したばっかりだが, さらに補足. Rグラフィックスの文字化け問題中間報告 (2021年版) - ill-identified diary rsvg パッケージを使えば, Windows や Mac でうまく表示できなかったフォントが使えるかもしれない, と思っ…

Rグラフィックスの文字化け問題中間報告 (2021年版)

概要 去年書いた話のその後の更新について整理した. おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diaryあとこっちのスライドも閲覧数が少しづつ増えてるようなのでMac でも Windows でも, PNG でも PDF でもRのグラフに好きな…

Rで総当たり戦などの組み合わせデータを tidy に扱う

tidyでない組み合わせを表すデータを扱いたいときの回答例

久々に R の ... に騙されたので結果が正しいかどうか確認しないとダメなアンチパターン集を書く

R の ... を始めユーザがよく理解してないとそもそも間違ってることにすら気づかない罠にハマる恐れがあるというお説教を自分の失敗をきっかけに書いた

ggplot2 で日付・時刻データを扱うときは日付の型の違いに注意

概要 ggplot2 でx軸が日付・時刻のグラフを描いて, geom_vline() を使うときは値の型を Date か POSIXct に統一しないと正常に表示されないという話 lubridate なんかを使っているとこの辺の違いを忘れがちかもしれない 「as.numeric() 変換で対処する」は今…

[日記] Rで格ゲーのコマンド表を作る

はじめにこれはある意味「エクセルでモザイク画を作ってみた」とか「マインクラフトのゲーム内で計算機を作った」と同類の余興である (そしてスケールの観点からはこれらよりもだいぶ見劣りする). しかしもしかしたらこれを読んでるあなたも将来, 武装勢力に…

WSLでWindows版Rの文字化けに別れを告げる

WindowsのWSL2でRStudioを快適に動かす方法. Ubuntuの設定部分はWSLでなくてもほぼ同じであり実質Ubuntuの設定方法の解説でもある

[書評] RユーザーのためのRStudio「実践」入門

はじめに 本書の特徴 初心者はどう学んでいくといいか 問題点 (本書に限らない一般論?) OS間の違いに対するサポート 以降はもはやただの日記 はじめに(ごめんやっぱ半分以上書評じゃなくて日記だった)松村優哉・湯谷啓明・紀ノ定保礼・前田和寛著『Rユーザー…

【小ネタ】Rpubs のハイパーリンクでうまく飛べない問題をluaフィルタで解消

また誘導用の記事. Rpubs のハイパーリンクがフレーム内で表示されるせいでたまにうまく外部サイトへ飛べない問題を lua フィルターで解決してみました. rpubs.com

[Rpubs] ggplot2 で沖縄をずらして日本地図を描きたい

実行例タイトルと画像の通り. 意外とこの方法のやり方が探しても出てこなかった*1ので書いてみた. はてなブログに投稿するのがめんどくさかったので Rpubs に投稿した. 以下が記事の誘導リンク. rpubs.com追記: twitter で指摘されたように, kuniezu パッケ…

[R Markdown] から [Word] へエクスポートするときのテンプレート (with officedown)

R

概要概要 デフォルトの word_document よりもう少し機能の豊富な Word 用テンプレートを提案する. 概要 初めに 使い方 必要パッケージとインストール 新規作成 カスタマイズ 注意点 解説 簡単なテンプレート 初めに先日の Tokyo.R で意外と Word へのエクス…

[小ネタ] RStudio がこっそりサポートしている言語一覧

初めに RStudio の新規作成ボタンを押して現れるリストには R Script (.R) や R Markdown (.Rmd) 以外にも, いろいろなタイプのファイルがある. たとえば C/C++, Python, SQL, Stan など. これらの「サポート」の充実度合いは差があるが, とりあえず, シンタ…

[日記] RStan がクラッシュすると思ったら原因は stan と関係なかった

なんかよく分からなくて曖昧なままだけどとりあえず書いておく. 久々に RStan を使おうとしたら, こんな感じのエラーが大量に表示され, RStudio がクラッシュした. OS は Ubuntu 20.04. ERROR elf_dynamic_array_reader.h:XX] tag not found ERROR elf_dynam…

[日報: 4/1] R言語で飯を食っていく方法について本を書きました. 皆さんにも特別にお見せします.

タイトルのとおりです. 常にスキルアップや転職を検討するなど, 自信のキャリア選択を日頃から考えなければならないのがプログラマ・エンジニアという職業だと思います. そこで本日4/1, プログラミング言語であるRでどうやって飯を食っていくかを指南する本…

互いに独立でなくてもできる中心極限定理と, そのデモ (Gordin's CLT/Donsker定理)

Lindeberg-Lévy中心極限定理以外のデモもやろう

[メモ] RStudio 1.4 時点での Python 関係トラブルシュートとか

概要先日リリースされた RStudio 1.4.1103 の新機能として, Python 実行環境のサポートが強化されたことが挙げられる*1. たとえば R と同様の環境ペーンが使えるようになったため, グローバルのオブジェクトやロード中のモジュールの一覧を確認しやすくなっ…

[書評]『データ分析のためのデータ可視化入門』と最近の R グラフィックスパッケージ事情

“Data Visualization: A Practical Introduction” の邦訳『データ可視化入門』の紹介+α

[メモ] R Markdown で書かれた R の資料を見つけたらここに書く

R

概要 リスト 無断翻訳不可 翻訳・改変可 ライセンス不明 日本語の資料 概要見つける度に無計画に Pocket とかに保存してたがごちゃごちゃしてきたのでここに書くことにする. キリがないので Rpubs とかはナシ. 主に bookdown で作られた書籍形式の資料.リス…

[R][不具合報告] plm の cipstest (CIPS検定) の実装の問題

plm の cipstest の実装がおかしかった話

[日報] knitr の公式ドキュメントの翻訳を公開した. R Markdown もそのうちやる.

概要タイトルの通り. これから R Markdown で翻訳するつもりなのは R Markdown: Definitive なんちゃら, Bookdown: うんちゃら, R Markdown Cookbook の三部作. knitr のドキュメント含め, 原典が全て非営利ライセンスなので当然ながら一般無料公開する予定.…

[R][初心者の質問] mice で多重代入法の結果を統合できない時の対処法

R の mice パッケージの pool 関数がうまく使えない人への回答

[小ネタ] 自作 R パッケージのメッセージをローカライズする

R

概要公式ドキュメント “Translating R Messages, R >= 3.0.0” の記述をパッケージ開発の観点で簡単に紹介する.イントロダクション湯谷氏が『Rパッケージ開発入門』の補足として書いた文書にもあるが, この情報だけだとまだつまずくところがいくらかあったの…

[小ネタ] R でコロプレス図 (色分け地図) をなるべく簡単に描く

概要R-wakalang に投稿された質問を元にした小ネタ. タイトルの通り sf と ggplot2 パッケージを使ったコロプレス図 (色分け地図) の作成方法を紹介する*1. あまり R に習熟していない人向けにごく簡単な例だけを紹介する.関連する話を取り上げているページ…

「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 -

全数調査 --- 全てのデータを取得できれば統計分析は必要ない, 全てのログデータを使えば機械学習は完全にうまく行く... それらは全て誤りである. 母集団の考え方は意外と教科書でもはっきりと教えていないので, 新しい視点で説明してみた

[小ネタ] [R] randomForest::MDSplot() を ggplot2 で書き直す

randomForest::MDSplot() が `ggplot2` で描かれたグラフじゃないのは不便なので作った.

おまえはもうRのグラフの日本語表示に悩まない (各OS対応)

Rグラフで日本語フォントを表示する方法が新旧OSいろいろばらばらだったのでまとめた