データサイエンス初学者の頃は特に
何から始めていいかわからない
まずは本で勉強したい!
という想いがある方も多いでしょう。
本記事ではこのような想いを持っている方、これからデータサイエンスを独学で学び始めようしている方に向けて、データサイエンティストである筆者が、「自分が初学者の頃にこれがあれば!」という本や「スキルが非常に伸びた!」という本を中心に紹介します。
特に、「データサイエンスを学びたいが、何も勉強を始めていない」という方にお勧めの「まずはここから始めるとよい」本、3選を紹介していきます。
以下の記事ではPythonのおすすめ学習サイトを紹介しています。
データサイエンス初学者向けのPython学習本3選
選定のポイント
対象となる方
今回の対象となる方は以下のような方です。
- これからデータサイエンスを始めたい
- データサイエンスを学び始めるにあたり、Pythonを学習し始めたい
- 少し自分で勉強してみてPythonとはどんなものか感じてみたい
ロードマップ
今回紹介する本は、それぞれ以下のような方に読んでいただきたいです。
・データサイエンス、Pythonにふれたことがない方。
・データサイエンスに必要な基本的なPython操作を一通り覚えたい方。
・機械学習手法を実践するところまでを覚えたい方。
⇒1冊目:東京大学のデータサイエンティスト育成講座
・基本的なPythonの操作がある程度できるようになった方。
・実際のデータ分析で使用する生データをどのように扱うかを習得したい方。
・実際に操作を行うことによりデータ分析の流れを身に着けたい方。
⇒2冊目:Python 実践データ分析 100本ノック
・ある程度Pythonでの操作ができるようになってきた方。
・少しづつ「for文」や「関数」などの長文を書くようになってきて、キレイでわかりやすいプログラムをかけるようになりたい方。
・一度入力した内容をチューニングなどで見返すことが多くなってきたが、後から見返すと自分の書いた内容がよくわからない方。
⇒3冊目:シリコンバレーPython大全
データサイエンスに使用するPythonを中心に
「Python入門」という本を手に取ると、非常に長いプログラム作成を扱っているものや、データサイエンスではあまり使用しない命令を解説しているものも存在します。
今回はデータサイエンスで使用する命令やデータサイエンスでよく使用されるJupyterNotebookを前提とした本を中心にピックアップしました。
データサイエンスの環境にあった本を使用することで必要な部分から学習でき、効率よく学習が進められます。
オススメ本での学習と合わせて行いたいこと
Webでの学習
Tech Teacher BlogにはPythonの基礎を学べる記事があり、本と併用していただくことでより学習がスムーズになります。
東京大学のデータサイエンティスト育成講座
おすすめポイント
- 入力と出力がわかりやすく示されている
- 基礎内容から丁寧に解説されている
- 最初に勉強すべき内容がわかる
日本ディープラーニング協会の理事長、東京大学大学院教授の松尾先生が提供する講座がもとになっています。
Python自体の本ではなくデータサイエンスの本ですが、この本に従ってデータサイエンスの基礎を勉強することにより、データサイエンス・Pythonともにしっかり実力がつきます。
入力と出力をペアで表示しているので移動中に読むのにも最適です。実際に自分で動かすことで最大の効果が得られます。
基本から実践まで幅広く
「Pythonでデータ分析をするというのはこういうことか」、「データサイエンスで使うPythonとはこういうことか」というのがわかるので、まずはこれに従って一通り自分でPythonを動かしてみるとよいでしょう。
- 基本的なPythonの使い方
- 確率統計
- Pandasなどのデータサイエンスで使用するライブラリ
- Matplotlibによるデータの見える化
- 機械学習を行うために必要な基礎知識・手法
- 機械学習の実装
これをしっかりやり込めば、回帰的な手法から決定木やサポートベクターマシーンなどの教師あり学習、主成分分析などの教師なし学習、モデルのチューニングまで一通りできるようになりますので、機械学習を始めたい方が読むには非常に最適な一冊となっています。
Python 実践データ分析 100本ノック
おすすめポイント
- 入力と出力がわかりやすく示されている
- 各項目のボリュームが大きくないので、好きなペースで進められる
- 少し進んだ内容の解説があり、学習の幅が広い
こちらもデータサイエンスでよく使う命令を効率よく勉強できるのでお勧めです。「東京大学のデータサイエンティスト育成講座」で基礎を学習したのちに、この本で実践を行うのがよいです。
どんな手順でデータ分析をするのか
データ分析をする際に、初学者の頃は「何ができるかわからない」「何がわからないかわからない」状態であると思います。
10個の実践的データを用いて各10個のお題を実際に解決することで、データ分析がどのような手順で行われるのか理解できます。
また、取り扱うデータも解説用に解析がすぐできる状態のデータのみを扱っているわけではなく、ビジネス現場でのデータ分析で直面する「汚いデータ」と「リアルな問題」を扱っていることで実際にビジネス現場で役立つ力が身につきます。
内容もデータ加工から始まり、画像、自然言語まで取り扱っており、解説も丁寧なので初学者からPythonの基礎を習得済みの方まで幅広く読んでいただきたい一冊になります。
シリコンバレーPython大全
おすすめポイント
- Python記述の作法がわかる
- キレイなPythonpプログラムを書ける
- 基礎がしっかりわかる
これまで紹介した2冊に対し、こちらはPython自体の本になります。データサイエンスに特化せずに、Python自体の基本がわかります。
基本的なところを解説している前半の「基本編」だけでもよいので勉強していただきたいです。後半にデータ解析について触れているページもあるので、あわせて確認してください。
Pythonの作法がわかる
初期に使用するプログラムは複雑なものはないのですが、学習が進んでいくとコードの量も多くなり複雑になっていきます。それに対応するためにこの本で書かれている基本的な約束事や見やすいプログラムの書き方を事前に学習し、それにそった書き方をしていくことは非常に有用です。
また、データサイエンスでよく使用されるのに解説が少ないf-stringやenumerate関数、内包表記などもわかりやすく解説されているので必見です。ぜひこの本でPythonの基礎をしっかり身に着けていただきたいです。
『Tech Teacher』3つの魅力
魅力1. オーダーメイドのカリキュラム
『Tech Teacher』では、決められたカリキュラムがなくオーダーメイドでカリキュラムを組んでいます。「質問だけしたい」「相談相手が欲しい」等のご要望も実現できます。
魅力2. 担当教師によるマンツーマン指導
Tech Teacherでは、完全マンツーマン指導で目標達成までサポートします。
東京大学を始めとする難関大学の理系学生・院生・博士の教師がが1対1で、丁寧に指導しています。
そのため、理解できない箇所は何度も分かるまで説明を受けることができます。
魅力3. 3,960円/30分で必要な分だけ受講
Tech Teacherでは、授業を受けた分だけ後払いの「従量課金制」を採用しているので、必要な分だけ授業を受講することができます。また、初期費用は入会金22,000円のみです。一般的なプログラミングスクールとは異なり、多額な初期費用がかからないため、気軽に学習を始めることができます。
まとめ
・魅力1. 担当教師によるマンツーマン指導
・魅力2. オーダーメイドのカリキュラム
・魅力3. 3,960円/30分で必要な分だけ受講
質問のみのお問い合わせも受け付けております。
まとめ
今回は、データサイエンス初学者がデータサイエンス目的でPythonを勉強するのに役に立つ本3冊を紹介しました。
ここに紹介した本はすべて素晴らしいのですが、最初からすべて理解するのは大変だと思います。まずはできるところから進めていけば実力がついておのずとすべてできるようになっていきますので躓いてもあきらめずに頑張っていきましょう。