基本情報技術者試験 平成31年度 春期 午前 問4
機械学習(教師あり学習、教師なし学習)の種類についての問題。
--------------------------
平成31年度 春期 午前 問4
機械学習における教師あり学習の説明として、最も適切なものはどれか。
ア
個々の行動に対しての善しあしを得点として与えることによって、得点が最も多く得られるような方策を学習する。
イ
コンピュータ利用者の挙動データを蓄積し、挙動データの出現頻度に従って次の挙動を推論する。
ウ
正解のデータを提示したり、データが誤りであることを指摘したりすることによって、未知のデータに対して正誤を得ることを助ける。
エ
正解のデータを提示せずに、統計的性質や、ある種の条件によって入力パターンを判定したり、クラスタリングしたりする。
--------------------------
解説
機械学習をネタにした問題はよく出るようになった。
問題は「教師あり学習はどれか」で、答えをまず書いてしまうと、選択肢ウが正解。
教師がすることは正解や誤りを指摘すること、と覚えれば回答はできる。
大量の動物の画像と、それらの画像が猫かそうでないか(正解かそうでないか)の答えを与えておいて、新しい画像の動物が猫かそうでないかを分類できるように学習する。
正解のデータを提示せず、とわざわざ書いてある選択肢エは問題とは反対の教師なし学習になる。
蓄積されたデータの傾向をみたり(パターンの判定)、傾向が似ているグループに分けてみたり(クラスタリング)することができるようになる。
選択肢アも得点を与えてるので教師ありでは?
と思うけれども、これは分類すると強化学習になる。教師あり学習では正誤の分類が明確にできる。
強化学習の例としてはオセロとか囲碁の AI を思い浮かべるとよい。状況の善しあしを得点化する方法を与えておき、あとは AI がどんな手を打てばより善い得点を得やすくなるかを繰り返し学習していく。ある一手を正解かそうでないかとは教えられない。
選択肢イも教師なし学習になる。
少なくとも正解のデータを提示したりしていないので、教師あり学習かと聞かれたら違うと回答できる。
教師なし学習と一言でいってもその種類は色々とある。
・クラスタリング(データを似た者同士でグループ分けして分類する)
・主成分分析(データの種類(次元)を減らしても全体を表せるようにする)
・アソシエーション分析(データ間にある関係性を明らかにする)
選択肢エの教師なし学習はクラスタリングの話で、選択肢イの教師なし学習はアソシエーション分析になる。
アソシエーション分析絡みでよく聞くのが "紙おむつを買う人はビールを一緒に買う傾向がある" という話。印象に残りやすいのでよく聞くけど、実際はそうでもないらしい。
資格試験の問題に正解することが目的と割り切れば良いけど、気になりだして細かな定義を追い出すと終わらなくなる分野。
前後の問題はこちら。