【和から株式会社】はじめて学ぶ機械学習
公開日
2024年11月18日
更新日
2024年12月12日
和から株式会社主催「機械学習超入門」の講義の様子です。 機械学習を学んでいきたい方、興味がある方は是非ご参加ください。 ◎詳細・開催日程はこちら→https://wakara.co.jp/course/4335 #和から #機械学習 #集団セミナー
機械学習のようなその大掛かりなものが必要になる場合
っていうところはの統計学で解決できなかった場合の
手段っていうところですね
ちょっと機械学習に関しては
あのこれからお話ししていこうと思いますが
というのもですね
機械学習であの解決できる問題が決まってるんですよ
それこそ今人工知能とかがニュースとかで毎日出てくるものですから
何でもできるって思われがちなところはですね
それこそあのメディアもそういうふうに煽るんで
あのまあ人工知能とか機械学習使うとすごい分析ができるっていう風に
出てくるんですけど
機械学習に関して言うと
あの基本的に使える目的はっきりきまってます
基本的にここであの私がこれからいうことを以外はですね
あの解決するのが難しいか
まあ可能だったとしてもものすごく大変な思いで
その開発しないといけないっていうのところになります
ということでまぁちょっと早速お話ししていきましょう
なのでもしですねあの皆さんの中で具体的に
こういうことを解決したいっていうタスクがあれば
それがありのからお話をするものに一致しているかどうか
っていうところあの注意して見ていただくといいかなと思います
あの機械学習で解決できる問題は全部で3つですね
識別と回帰と分類って
この3つが機械学習で解決できる問題になります
まずあの識別アルゴリズム
あのこれ一番簡単ですね
あの a か b かを識別したいっていうのが
識別のアルゴリズムになります
例えばですねあのナイーブベイズって呼ばれるもの
メールのフィルタリングとかに活用されているものですね
通常のメールサーバーとかなとだいたい
その届いたメールが迷惑メールかどうか判別しているが入ってるんですけど
実際にこれもですね
あの届いたメールが普通のメールなのか
迷惑メールなのかをその識別するもで識別アルゴリズムです
これにはナイーブベイズって呼ばれる手法が
代表的に使われています
でその識別アルゴリズム他にもたくさんあります
例えばあのお客さんベースも
飲み込み客かどうかっていうところを分析する
バスケット分析と呼ばれるものもそうですね
例えばの車のディーラーショップに来たお客さんがですね
20代で独身で年収がいくらで借金があるかどうか
っていうそのまあ項目見てですね
最終的にはその人があの買ってくれるのかどうか
というところも予測したりするわけですよ
購買確率が80%を超えたら
営業も配置してあげましょうとかっていうような形でですね
買うか買わないかを識別するモデルがですね
あの決定木って呼ばれるものです
最近そのECとか
あのネット通販とかが盛んに
そのコロナウィルスの影響もあり
行われるようになってから
ここはかなり使われるようになってきています
買うか買わないかというところとか
あるいはあの医療とかだと
病気かそうじゃないかっていうものには
ロジスティック回帰分析ってのが使われていますね
他には deep learning って呼ばれるもの
これあのいわゆる人工知能です
人工知能使って今何やってるかっていうと
目の前に写っている写真
写真がですね
目の前の写真に写ってるものが犬なのか猫のかっていうところを
今までは人間が一々教えてあげないといけなかったんですけど
今はもう基本的にあの
まあ機械が勝手にですね
判断してくれるようになっているわけですよ
私が研究で扱ってた半導体の良品不良品の判定も
まあこの分野になります
あの写っているものが良品なのか
不良品なのかっていうところの自動的に判別してくれます
ですので a か b かこれまた cとかでもいいんですけど
a か bか c かっていうような形であの選択するものは
基本的に識別のアルゴリズムっていう風に呼ばれるものになります
これがまず一つですね
その次回帰のアルゴリズムで
これは何が違うかというとですね
予測したいものが a か b か c かではなくて
数字なんですよ
例えば今日の気温34度って
あの朝の天気予報では書いてありましたけど
明日の天気、気温何度になりますかっていうのは
回帰アルゴリズムって呼ばれるものになります
回帰分析っていう名前は
聞いたことある方もいらっしゃるかも知れないですね
例えば
月曜日晴れてて32度でしたっていう結果をもとに
じゃあ明日の天気はあの何になるでしょうか
明日の気温は何になるでしょうかっていうのが
その回帰アルゴリズムです
何も気象関係のとこだけで使ってる手法ではなくてですね
これ例えば物件の価格ですね
あの家の価格ってどういうふうに算定されているのかっていうと
不動産会社の方であの抱えている過去のデータのがあるわけですよ
例えばこの物件800万円で
物件が2億5,000万円っていうデータがあったときに
じゃあ新しく入ってきたこちらの物件がいくらになるでしょうか
って言うのを予測するのが回帰モデル
回帰予測っていうふうに呼ばれるものになります
これもあの機械学習であの解決できる問題です
例えば売上がいくらになるかとか
販売コストがいくらになるかっていうところ見ていくために
あの回帰分析含めたですね
回帰のアルゴリズムが使われているということです
なのであのまず識別と回帰の2つ説明してきました
そうするとあと一つ
もう一つあるのが3つ目
分類のアルゴリズムですね
これどういうところに使われているかと言うとですね
代表的なものはここ書いてありますけど
映画、映画とかドラマとか見放題のサービスありますね
サブスクリプションで
自由に動画とか見てるサービス
ネットフリックスさんとかちょっと具体的な名前を言っちゃいますけど
ネットフリックスさんとかHuluさんとかですね
そういうところで何しているかと言うとですね
実際サービス提供する側からすると
基本的には計測してくれる必要があるわけですね
継続してもらう必要があって
ただユーザー側からするとですね
あの面白い映画なかったら続ける理由ってないわけですよ
見たいと思う映画とかドラマがあるから
見続けるのであってね
そうするとですね
あの必然的にユーザーに対して
この映画面白いっていう風なものをきちんと
お勧めしないといけないわけですよ
ということでですねまぁじゃあ
コメディー好きな人にじゃあドキュメンタリー映画を
お勧めしたところですねまぁこれ押し売りになっちゃうじゃないですか
ニーズがあってないっていう風になってうまくいかない可能性があるわけです
それこそ映画ってもうあの毎日何百本とか何千本って新しく出てるのもなんで
でそれを新しいもの出ていくために
そのユーザーに全部あるお勧めしているとですね
まぁ当然ながらユーザー嫌気が差しますよね
ではなくてあの実際そのユーザが気にそうなジャンルのものですね
まぁ選んで用意してあげるために使われるのが
分類のアルゴリズムです
なにをやってるかっていうとあのお客さん
そのユーザーですね
ユーザーをグループ分けするんですよ
ドキュメンタリー好きな人たち
コメディー好きな人たち
例えばアクション好きな人たちとか
ロマンス好きな人たちっていう様な形で分類してあげて
例えば新作のドキュメンタリーが出ましたって
誰におすすめしますかっていうと
ドキュメンタリーが好きな人たちにお勧めしてみると
まぁレスポンスがある可能性が高いと言うような形で
大きいデータそれこそネットフリックスさんとか
Huluさんとか何百万とか何千万ってユーザーが登録されていますから
あのそういったそのサイズのデータを扱う場合は
例えばこうした形でですね
まずデータを開けるということをやります
まあこれ周りに分解と統合の考え方ですけど
全部一色単にしてじゃあ例えば回帰分析一個やりましょうとか
識別一個やりましょうって言うと
うまくいかない場合が多いんで
そのデータが一定より多くなってきた時の一つの方法として
あの分類のアルゴリズムっていうところがあります
というところですね
まぁちょっとお話ししてきたこの分類のアルゴリズムなんですけど
あの今までお話しした識別回避と大きく違うところがあってですね
例えばじゃあこのデータあったとしますね
あの6つ図形がありますよね
これ何で分けたらいいかっていう風に考えた時に
こういう分け方もいいと思うんですね
形でわけてもいいと思うんですけど
大きさで分けても別に問題はなさそうですね
いわゆるその分類のアルゴリズムに関してはですね
正解がないんですよ
どう開けるかどう開けるのがいいかって
それ別に正解がある話ではないので
分けた側がいわゆる解釈をする必要があります
NEXT
【和から株式会社】AI(人工知能)超入門