- AIに対する理解を深めたい
- 将来的にAI開発に携わってみたい
このような方に対して、本記事では【AI入門編】としてAI開発に必要な機械学習のモデル4つを解説しています。
初心者の方でもわかるように、AI・機械学習・深層学習というそれぞれの概念の理解を導入にし、少しずつ専門性を高めていく構成となっています。
最後にはこれからAIに関する勉強を進めていくマイルストーンとしておすすめの資格も紹介しています!
AIとは?
人工知能(Artificial Intelligence:AI)とは、人間が普段行う思考や判断を再現したコンピューターシステムを指します。
しかし、知能とは何なのかを説明するのが難しいように、どのようなタスクを処理できれば知能を構築したと言えるかは自明ではないため、人工知能の厳密な定義はありません。
AIは汎用型AIと特化型AIに大きく分けられます。汎用型AIは人間のようにさまざまなタスクを処理できるAIであり、アニメで出てくるドラえもんやアトムのような存在です。
一方、特化型AIは特定の領域で人間以上の判断ができるAIです。近年の目覚ましい発展を見せているAI技術は、特化型AIに関するものです。
特化型AIは機械学習(Machine Learning:ML)により実現でき、機械学習は近年のAIブームの要因となっています。特に、機械学習の一種である深層学習(Deep Learning:DL)を用いたAIは画像認識や囲碁などのゲームの分野において人と同等以上の成果が達成されています。
機械学習
機械学習はコンピューターにデータ間の法則を自動的に導き出させる手法であり、さまざまなモデルが開発されています。
機械学習のモデルはデータ間の法則を表現した関数のようなものであり、入力データからタスクに応じた予測結果を出力します。モデルは最初に未知のパラメータを含みますが、データから最適なパラメータを学習します。
モデルやパラメータの学習法の違いによって、機械学習にはさまざまの手法があります。機械学習は、教師あり学習と教師なし学習、強化学習に大きく分けられます。
教師あり学習
教師あり学習(Supervised learning)は入力データと対応する正解データを基に入力から答えを予測するための法則を導き出す機械学習手法です。
教師あり学習は連続値を予測する回帰(Regression)と離散値を予測する分類(Classification)に分けられます。分類で予測する離散値は、範囲の狭い整数や文字列であり、分類はいくつかの候補から選択するようなタスクになります。
教師あり学習の分類モデルには、決定木やロジスティック回帰などが有名です。ロジスティック回帰は、名前に回帰とありますが分類モデルです。回帰タスクでは出力数値を予測しますが、その出力値を閾値として分類することができるため、ロジスティック回帰はそのようにして分類する手法です。
教師なし学習
教師なし学習(Unsupervised Learning)は入力データのみをコンピューターに与えて入力データ自体に関する特徴を自動で導く機械学習手法です。
教師なし学習の代表例としては、クラスタリング(Clustering)と次元削減(Dimensionality Reduction)があります。クラスタリングは似ているデータ同士をグループとして分けることができ、次元削減は表データなどで各列の特徴を調べてより少数の項目に情報を圧縮できます。
以下の記事では教師あり学習と教師なし学習の違いをわかりやすく解説しています。
強化学習
強化学習(Reinforcement Learning)は行動と利益に関するデータを基に最終的な利益が最大となる行動方針を導き出す機械学習手法です。特に、ゲームやロボットAIの分野を中心に活躍しています。
強化学習ではある状態でエージェントと呼ばれる行動主体が行動し、環境から報酬が与えられ、新しい状態に移行するという流れを繰り返します。最終的に最大の報酬をもらえるような行動方針を獲得することが強化学習の目標になります。
強化学習の代表的なアルゴリズムにQ学習があります。強化学習で最大化したい現在から未来の累積報酬和の期待値を、行動価値関数(Q関数)と呼びます。
Q関数を求めることで、良い行動かどうかを評価できます。全ての状態におけるQ関数を評価ができれば、そこから最適な行動指針を得ることができるようになります。
以下の記事では強化学習の概要やQ学習の仕組みについて紹介しています。
深層学習
機械学習の一種である深層学習は、人の神経ネットワーク(ニューラルネットワーク)を模倣した構造からなり、教師あり学習や教師なし学習、強化学習のモデルに利用されるほど汎用的な手法です。
深層学習は画像や文章のような非構造化データから特徴量を抽出することに優れており、画像分類・生成、文章を扱う自然言語処理の分野で特に活躍しています。それぞれの分野で用いられる代表的な深層学習手法について紹介します。
CNN
CNN(Convolutional Neural Network)は画像分類タスクなどで使用される深層学習モデルです。画像分類は入力画像に対してどのような種類の物体が写っているかを予測するタスクであり、教師あり学習(分類)に含まれます。
画像は数値を各ピクセルにまとめられたデータであり、特にカラー画像の場合、各ピクセルは赤と青、緑の3要素(RGB)の数値を持ちます。CNNでは、画像を縦横そのまま入力し、畳み込みと呼ばれる処理を繰り返して画像のエッジや色の組み合わせなどの特徴を抽出し、分類します。
CNNについては以下の記事でより詳しく解説しています。
RNN
RNN(Recurrent Neural Network)は文章などの単語が並ぶような系列データを扱える深層学習モデルです。ネットワーク構造は、過去の入力情報を引き継ぐように再帰的な構造をしており、将来の入力を予測するように学習します。
データが文章の場合、各単語などが入力となり次に続く単語の確率を予測するタスクであり、教師なし学習に含まれます。翻訳や対話などの系列変換タスクにおいては、入力文章と出力文章それぞれにRNNを用意した教師あり学習手法により達成できます。
VAE
VAE(Variational Auto Encoder)は画像などの生成確率をモデル化し、存在しない画像などを生成できる深層学習モデルです。大量の画像だけを用いて、画像を生成できる分布を学習させるため、教師なし学習になります。
近年、自動で架空の鮮明な画像を生成できるようになってきており画像生成分野が注目されています。
生成モデルには、VAEの他にもGAN(Generative Adversarial Network)や拡散モデルがあります。特にテキストやキーワードに沿った画像を生成したい場合は、生成確率にテキスト情報を条件づけて学習させる必要があります。
DQN
DQN(Deep Q-Network)は前述のQ学習に深層学習を組み合わせた強化学習手法になります。
Q学習では全ての状態と行動についてQ関数を決める必要があるため、状態と行動の組み合わせが膨大となるような場合、全てを求めることはできません。Q関数を深層学習によって関数近似する手法がDQNです。
『Tech Teacher』3つの魅力
魅力1. オーダーメイドのカリキュラム
『Tech Teacher』では、決められたカリキュラムがなくオーダーメイドでカリキュラムを組んでいます。「質問だけしたい」「相談相手が欲しい」等のご要望も実現できます。
魅力2. 担当教師によるマンツーマン指導
Tech Teacherでは、完全マンツーマン指導で目標達成までサポートします。
東京大学を始めとする難関大学の理系学生・院生・博士の教師がが1対1で、丁寧に指導しています。
そのため、理解できない箇所は何度も分かるまで説明を受けることができます。
魅力3. 3,960円/30分で必要な分だけ受講
Tech Teacherでは、授業を受けた分だけ後払いの「従量課金制」を採用しているので、必要な分だけ授業を受講することができます。また、初期費用は入会金22,000円のみです。一般的なプログラミングスクールとは異なり、多額な初期費用がかからないため、気軽に学習を始めることができます。
まとめ
・魅力1. 担当教師によるマンツーマン指導
・魅力2. オーダーメイドのカリキュラム
・魅力3. 3,960円/30分で必要な分だけ受講
質問のみのお問い合わせも受け付けております。
資格
最後にAI学習におすすめの日本ディープラーニング協会(JDLA)の資格を紹介します。
G検定
引用:JDLA公式サイト
JDLAのG検定(General検定)はさまざまなモデルの知識に加えてAIの歴史や法律など広範な知識が問われる資格試験です。
具体的には、人工知能とは何かから機械学習の具体的手法やディープラーニングの概要・手法、社会実装に向けた内容や法律、倫理・社会問題まで扱われます。
JDLA監修書籍として、「深層学習教科書ディープラーニングG検定(ジェネラリスト) 公式テキスト 第2版」や「ディープラーニングG検定(ジェネラリスト)法律・倫理テキスト」があり、ディープラーニング初学者でも体系的に学べます。G検定受験までに要する学習時間は、大半が15~50時間程度です。
受験者の職種は研究・開発だけでなく、営業・人事、経営と幅広い職種の人が受験しています。受験資格の制限はなく、Pythonのプログラムに関する知識は不要です。
E資格
引用:JDLA公式サイト
E資格(Engenear検定)はJLDAが認定した教育事業者による認定プログラムを修了したのち、受験できる資格試験です。認定プログラムではE資格のシラバスのキーワードに沿ってディープラーニングの理論やPythonのコーディングについて学びます。
資格試験では応用数学・機械学習・深層学習・開発環境について問われます。受験者は、学生や研究・開発・情報系・製造系の職種の人が大半となっています。
AIの知識は日進月歩であり、随時知識を更新する必要があるため、G検定・E資格のシラバスは定期的に更新されます。合格者は何年度の合格者か記載された証明書が配布されます。そのため、最新のAI技術について学ぶモチベーションとしてもG検定やE資格はおすすめです。
以下の記事ではこれらのAI資格の選び方や取得メリットについて解説しています。