17.7 workflowr で R Markdown プロジェクトを研究用サイトでまとめる

workflowr パッケージ (J. Blischak, Carbonetto, and Stephens 2020; J. D. Blischak, Carbonetto, and Stephens 2019)は (データ分析の) プロジェクトをテンプレートとバージョン管理ツールである GIT を使って体系的に編成することが可能です. プロジェクトに変更を加えるたびに, 変更の記録を残すことができるので, workflowr はプロジェクトの特定のバージョンと対応するウェブサイトを構築できます. これはあなたの分析結果の履歴をすべて閲覧できることを意味します. このパッケージはバージョン管理のためバックエンドで GIT を使用していますが, 特に GIT に詳しくなる必要はありません. このパッケージは, 内部で GIT の操作を行う R の関数を提供し, あなたはこれらの関数を呼び出せばいいだけです. そのうえ, workflowr は自動的に再現可能なコードへのベストプラクティスを自動化します. R Markdown 文書がレンダリングされるたびに, workflowrset.seed() でシード値を設定, sessionInfo() でセッション情報を記録, そして絶対ファイルパスをスキャンする, などなど, といったことを自動的に行います. このパッケージの導入方法と詳細はパッケージのドキュメントをご覧ください.

workflowr の主著者である John Blischak は, R プロジェクトのワークフローと関連のあるパッケージとガイドを網羅的ではないですがリストにまとめています. これは GitHub レポジトリ https://github.com/jdblischak/r-project-workflows で見ることができます.

参考文献

Blischak, John D, Peter Carbonetto, and Matthew Stephens. 2019. “Creating and Sharing Reproducible Research Code the Workflowr Way [Version 1; Peer Review: 3 Approved].” F1000Research 8 (1749). https://doi.org/10.12688/f1000research.20843.1.
Blischak, John, Peter Carbonetto, and Matthew Stephens. 2020. Workflowr: A Framework for Reproducible and Collaborative Data Science. https://github.com/jdblischak/workflowr.