データエンジニアの役割
「データエンジニアの役割」に関する問題が40問中2問出題されます!
参考:https://cbt.odyssey-com.co.jp/pythonic-exam/python3cda.html
本試験の主教材である「Pythonによるあたらしいデータ分析の教科書第2版」では第1章(P002~012)の内容です。
前回の記事に引き続きPart2です!
それでは、練習問題を解いてみましょう!
練習問題1
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
データ分析に利用されるプログラミング言語には、Python、R、Excel、Java、HTML、Visual Basic for Applicationなどがある。
答えはコチラをクリック!
答え:
誤)HTML
正)HTMLはデータ分析に利用される
プログラミング言語ではない
ポイント
データ分析に利用される (クリック!)
プログラミング言語は
「〇〇」
データ分析に利用される代表的な
プログラミング言語を知っておきましょう!
例えば
・Python
・R
・Excel
・Java
・Visual Basic for Application
などがあります。
練習問題2
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
データ分析エンジニアが持つべき技術として、データの入手や加工などのハンドリング、データの可視化、プログラミングがある。データの可視化とは、データベースやファイルなどからデータを入手し、必要に応じて加工する技術のことである。よくMatplotlibが使われる。
答えはコチラをクリック!
答え:
誤)データの可視化とは、データベースやファイルなどからデータを入手し、必要に応じて加工する技術のこと
※これはデータの入手や加工などの「ハンドリング」の説明です
正)データの可視化とは、データの特性をとらえグラフなどで可視化する技術のこと
ポイント
データ分析エンジニアが持つべき技術は「〇〇」 (クリック!)
データ分析エンジニアが持つべき
技術は主に3つあります。
・データの入手や加工などのハンドリング
・データの可視化
・プログラミング
<補足1>
「データの入手や加工などのハンドリング」
・データベースやファイルなどからデータを入手し、必要に応じて加工する技術のこと。
・主に、NumpyやPandasを使う。
<補足2>
「データの可視化」
・データの特性をとらえグラフなどで可視化する技術のこと。
・主に、Matplotlibを使う。
練習問題3
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
Dataframe構造を提供するサード製
パッケージとしてpandasがある。DataFrame構造は、R言語のデータフレームからインスパイアされたもので、表形式の1次元データを柔軟に取り扱うことができる。
答えはコチラをクリック!
答え:
誤)表形式の1次元データ
正)表形式の2次元データ
R言語のデータフレームから影響を受けたということも知っておきましょう。
※サード製パッケージ…pythonに機能を追加したり支援したりするためのもの
ポイント
pandasが提供するData (クリック!)
Frame構造とは〇〇次元のデータ
DataFrame構造は表形式の2次元データを取り扱えるデータ構造のことです!
pandasでよく出てくる言葉なので覚えておきましょう!
練習問題4
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
データ分析を行う上でデータハンドリングは重要な役割を持つ。データハンドリングは前処理ともいわれ、データの入手や再加工、つなぎ合わせや可視化など、分析を行う上で一度だけ実行すればいい。
答えはコチラをクリック!
答え:
誤)一度だけ実行すればいい
正)何度も繰り返し実行する
ポイント
データハンドリングとは (クリック!)〇〇
データハンドリングは前処理ともいわれ、データの入手や再加工、つなぎ合わせや可視化など、データ分析を行う上で何度も実行される重要な工程であるので知っておきましょう!
練習問題5
問題
データ分析に関する次の文章の間違っている所を探してみましょう。
データ分析で使う主なパッケージの中に数値計算を扱うNumpyがある。Numpyは配列の扱いは得意で行列の計算は苦手である。内部は、C言語で実装されており高速に処理される。
答えはコチラをクリック!
答え:
誤)配列の扱いは得意で行列の計算は苦手
正)配列や行列を効率よく扱える
ポイント
Numpyとは〇〇 (クリック!)
Numpyとは数値計算を扱い、配列や行列を効率よく扱うことができます!
理解度チェック
問題
データ分析に関する次の記述のうち正しいものはどれか選びましょう。
1、データ分析に利用されるプログラミング言語には、Python、R、Excel、HTML、Visual Basic for Applicationなどがある。
2、データ分析で使う主なパッケージの中に数値計算を扱うNumpyがある。Numpyは配列の扱いは得意で行列の計算は苦手である。内部は、C言語で実装されており高速に処理される。
3、Dataframe構造を提供するサード製パッケージとしてpandasがある。DataFrame構造は、R言語のデータフレームからインスパイアされたもので、表形式の1次元データを柔軟に取り扱うことができる。
4、データ分析を行う上でデータハンドリングは重要な役割を持つ。データハンドリングは前処理ともいわれ、データの入手や再加工、つなぎ合わせや可視化など、分析を行う上で一度だけ実行すればいい。
5、データ分析エンジニアが持つべき技術として、データの入手や加工などのハンドリング、データの可視化、プログラミングがある。データの可視化とは、データの特性をとらえグラフなどで可視化する技術のことである。よくMatplotlibが使われる。
答えはコチラをクリック!
答え:5番
ポイント
(クリック!)データ分析エンジニアが持つべき技術は「〇〇」
データ分析エンジニアが持つべき技術は主に3つあります。
・データの入手や加工などのハンドリング
・データの可視化
・プログラミング
<補足>
「データの入手や加工などのハンドリング」
・データベースやファイルなどからデータを入手し、必要に応じて加工する技術のこと。
・主に、NumpyやPandasを使う。
「データの可視化」
・データの特性をとらえグラフなどで可視化する技術のこと。
・主に、Matplotlibを使う。
今回のポイント
今回のポイントを振り返りましょう!
ポイント
データ分析に利用されるプログラミング言語は「〇〇」 (クリック!)
データ分析に利用される代表的なプログラミング言語を知っておきましょう!
例えば
・Python
・R
・Excel
・Java
・Visual Basic for Application などがあります。
ポイント
データ分析エンジニアが持つべき技術は「〇〇」 (クリック!)
データ分析エンジニアが持つべき技術は主に3つあります。
・データの入手や加工などのハンドリング
・データの可視化
・プログラミング
<補足>
「データの入手や加工などのハンドリング」
・データベースやファイルなどからデータを入手し、必要に応じて加工する技術のこと。
・主に、NumpyやPandasを使う。
「データの可視化」
・データの特性をとらえグラフなどで可視化する技術のこと。
・主に、Matplotlibを使う。
ポイント
pandasが提供するData
Frame構造とは〇〇次元の
データ (クリック!)
DataFrame構造は表形式の2次元データを取り扱えるデータ構造のことです!
pandasでよく出てくる言葉なので覚えておきましょう!
ポイント
データハンドリングとは (クリック!)〇〇
データハンドリングは前処理ともいわれ、データの入手や再加工、つなぎ合わせや可視化など、データ分析を行う上で何度も実行される重要な工程であるので知っておきましょう!
ポイント
Numpyとは〇〇 (クリック!)
Numpyとは数値計算を扱い、配列や行列を効率よく扱うことができます!
参考資料:Pythonによるあたらしいデータ分析の教科書第2版
次回は…
次回も引き続きデータエンジニアの役割の範囲の中で、
特に機械学習について学んでいきましょう!