※自分で理解した内容を記載しているため、不足、間違いなどがあるかも。
機械学習
データからコンピュータが学習すること。
学習したAIにデータを入力すると、学習した内容に沿って、アウトプットが得られる。
例えば、リンゴの画像を大量に読み込ませて学習させ、新しく読み込ませた画像がリンゴなのかどうかを判定できるようになる。
機械学習のアルゴリズムは主に「教師あり学習」「教師なし学習」「強化学習」に分類することができる。
教師あり学習
データと答えの組み合わせを与えて、学習させる。
リンゴの画像の例が、これにあたる。
「分類問題」と「回帰問題」に分類される。
分類問題
リンゴの画像の例が、これにあたる
回帰問題
数値を与えて、法則を見つけ出させ、予測する。
その日の気温(問題)と、アイスの売り上げ(答え)を学習データとして渡す。
「Y=aX+B」という関数が作成され、次に適当な気温を入れたときに、アイスの売り上げ予想を回答してくれる。
教師なし学習
正解がないデータを与えて学習させる。
例えば、果物の画像をたくさん読み込ませて、AIがそれを色や、形の特徴を見て勝手に分類する。新しくリンゴの画像を渡すと、リンゴグループとして識別してくれる。
新しくリンゴの画像を渡すと、リンゴグループとして識別してくれる。
強化学習
今、何をするのが一番最適なのかをアウトプットさせるための学習。
学習データは、行動の選択肢と、得られる報酬となる。
例えば、テトリスでは、まとめてたくさん消した方が得点があがる。現在積み上げるブロックの選択肢と得られる得点を学習させ、1行消すか、消さずに積み上げるかどちらを選べば最終的に高得点になるかを、得られるようになる。