データエンジニアの役割
「データエンジニアの役割」に関する問題が40問中2問出題されます!
参考:https://cbt.odyssey-com.co.jp/pythonic-exam/python3cda.html
本試験の主教材である「Pythonによるあたらしいデータ分析の教科書第2版」では第1章(P002~012)の内容です。
前回の記事に引き続き機械学習に関する問題です!
今回の記事で「1章 データエンジニアの役割」の範囲は終わりです。
それでは、練習問題を解いてみましょう!
練習問題1
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
教師なし学習は、正解ラベルを用いる学習方法であり、クラスタリングや次元削減というタスクを行う。
答えはコチラをクリック!
答え:
誤)正解ラベルを用いる学習方法
正)正解ラベルを用いない学習方法
ポイント
教師なし学習は正解ラベルを
用いる?用いない? (クリック!)
教師なし学習は、正解ラベルを用いない学習方法です!
データ間のそれぞれの特徴をもとに学習をします。
また、正解ラベルを用いる学習方法は教師あり学習です。
覚えておきましょう!
練習問題2
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
強化学習は、システムが得られる報酬を最小化するように学習する方法であり、データ分析の中では始まったばかりの手法である。
答えはコチラをクリック!
答え:
誤)最小化
正)最大化
ポイント (クリック!)
強化学習とは「〇〇」
強化学習は、システムが得られる報酬を最大化するように学習する方法です!
例えば、囲碁AIや将棋AIなどがあります。具体例とあわせて覚えておきましょう!
練習問題3
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
教師なし学習の種類の一つにクラスタリングがある。クラスタリングは、与えられたデータの中からグルーピングを行う。因果関係がなさそうに見えるデータであればクラスタリングを行う必要はない。
答えはコチラをクリック!
答え:
誤)クラスタリングを行う必要はない
正)クラスタリングを行うことで、人間では気づかない特徴を発見することもある
ポイント
クラスタリングとは〇〇 (クリック!)
クラスタリングは、与えられたデータの中からグルーピングを行います!
教師なし学習の主な種類の1つであるため覚えておきましょう!
練習問題4
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
教師なし学習の種類の一つに次元削減がある。次元削減とは、大量なデータの種類をより多いデータの種類(次元数)で言い表す手法である。
答えはコチラをクリック!
答え:
誤)より多いデータの種類
正)より少ないデータの種類
ポイント
次元削減とは (クリック!)〇〇
次元削減とは、大量なデータの種類をより少ないデータの種類(次元数)にすることです!
「次元を削減する=データの種類(次元数)を少なくする」
と覚えましょう!
また、教師なし学習の主な種類の1つでもあります。
練習問題5
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
機械学習の処理でよく行われる手順の中にデータ入手がある。ここでは、入手したデータの概要をとらえ、見やすい形に整えるためにMatplotlibを活用する。
答えはコチラをクリック!
答え:
誤)Matplotlib
正)NumpyやPandas
ポイント
データ入手では〇〇を
活用する (クリック!)
機械学習の処理でよく行われる手順の中にデータ入手があります。
データを入手したらまず、データの概要をとらえ、見やすい形に整える必要があります。
NumpyやPandasが活用されます。!
理解度チェック
問題
機械学習に関する次の記述のうち正しいものはどれか選びましょう。
1、教師なし学習の種類の一つにクラスタリングがある。クラスタリングは、与えられたデータの中からグルーピングを行う。因果関係がなさそうに見えるデータであればクラスタリングを行う必要はない。
2、強化学習は、システムが得られる報酬を最小化するように学習する方法であり、データ分析の中では始まったばかりの手法である。
3、教師なし学習は、正解ラベルを用いない学習方法であり、クラスタリングや次元削減といったタスクを行う。
4、教師なし学習の種類の一つに次元削減がある。次元削減とは、大量なデータの種類をより多いデータの種類(次元数)で言い表す手法である。
5、機械学習の処理でよく行われる手順の中にデータ入手がある。ここでは、入手したデータの概要をとらえ、見やすい形に整えるためにMatplotlibを活用する。
答えはコチラをクリック!
答え:3番
ポイント
教師なし学習は正解ラベルを用いる?用いない? (クリック!)
教師なし学習は、正解ラベルを用いない学習方法です!
データ間のそれぞれの特徴をもとに学習をします。
また、正解ラベルを用いる学習方法は教師あり学習です。
覚えておきましょう!
今回のポイント
今回のポイントを振り返りましょう!
ポイント
教師なし学習は正解ラベルを
用いる?用いない? (クリック!)
教師なし学習は、正解ラベルを用いない学習方法です!
データ間のそれぞれの特徴をもとに学習をします。
また、正解ラベルを用いる学習方法は教師あり学習です。覚えておきましょう!
ポイント (クリック!)
強化学習とは「〇〇」
強化学習は、システムが得られる報酬を最大化するように学習する方法です!
例えば、囲碁AIや将棋AIなどがあります。具体例とあわせて覚えておきましょう!
ポイント
クラスタリングとは〇〇 (クリック!)
クラスタリングは、与えられたデータの中からグルーピングを行います!
教師なし学習の主な種類の1つであるため覚えておきましょう!
ポイント
次元削減とは (クリック!)〇〇
次元削減とは、大量なデータの種類をより少ないデータの種類(次元数)にすることです!
「次元を削減する=データの種類(次元数)を少なくする」
と覚えましょう!
また、教師なし学習の主な種類の1つでもあります。
ポイント
データ入手では〇〇を活用する (クリック!)
機械学習の処理でよく行われる手順の中にデータ入手があります。
データを入手したらまず、データの概要をとらえ、見やすい形に整える必要があります。
NumpyやPandasが活用されます。!
参考資料:Pythonによるあたらしいデータ分析の教科書第2版
次回は…
次回、「Pythonと環境」の実行環境構築について学んでいきます!