Pythonによる機械学習とTableauとの連携方法が学べる本をご紹介します。「Tableauの基本操作はわかったので、より高度な使い方を学んでいきたい」というような方におすすめです。
岩橋智宏・今西航平・増田啓志著 Tableauで始めるデータサイエンス
著者
書籍に記載されている情報ですが、岩橋氏と増田氏は元IBMで、Tableau Japanに所属されている方です。
今西氏は、株式会社キカガク取締役副社長、東北大学大学院医学系研究科非常勤講師という肩書です。株式会社キカガクは、AIや機械学習の学習サービスを展開されているようです。
Tableau社の人と機械学習の専門家で執筆された本です。
内容
特に良かった点や、参考になった点について記載します。第4章までありますが、ここでは第1章から第3章までについて記載します。
第1章 Tableau「で」始めるデータサイエンスとは?
データサイエンスのプロジェクトはどう進めるかという話から始まり、Tableau製品の説明、インストール方法などが記載されています。
第2章 基礎体力編
第2章と第3章に、それぞれ全体の40%ずつくらいのページが割かれています。
Tableau Desktop、Tableau Prepの基本的な使い方、Pythonの基本、pandasによるデータ操作、機械学習の基本、scikit-learnによる機械学習の実装など、丁寧に解説されています。
- Tableau Prepによる前処理、データの眺め方を学べる点は良いと思います。
- こういうデータだとこういうグラフで見るのがよいという基本も理解できます。
第3章 実践編
パラメータを入力すると、あらかじめ作成した機械学習モデルを呼び出して予測を行い、結果を表示するTableauダッシュボードを作成します。
機械学習モデルの作成方法とTableauとの連携方法を学ぶことができます。
- 第1章で紹介される「データサイエンスプロジェクトの進め方」が体感できます。
- 予測の例題は大きく3つ記載されおり、やや異なるタイプの分析を学べます。
- マップ(地図)を使った予測ダッシュボードも作成できます。
- TabPyを利用した連携方法が学べます。
注意点
Tableau Desktopのライセンスはあった方がよいと思います。
また、Tableau製品の使い方、Pythonの基本構文、pandasやscikit-learnの使い方、Jupyter Notebookの使い方など、ある程度予備知識があると進めやすいと思います。
おわりに
TableauとPythonによる機械学習の連携方法がわかりやすく、無駄なく解説されています。Tableau Japan所属の方が執筆されているので、Tableauを使ったデータの見方、見せ方もあらためて勉強になることが多かったです。