電脳ヨーグルト

プログラミングの備忘録と私生活を

3日に1回は耳にするデータサイエンティストとは何かについて解説

f:id:at25250410:20180815180535p:plain

最近よく聞くようになったデータサイエンティストという職業について、分かりやすく説明していきます!

データサイエンティストとは

そもそもデータサイエンティストとはなんぞや?プログラマーとは何と違うの?と思うかもしれません。

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)

専門書にも関わらず異例の10万部を売り上げたこの本で有名な、東京大学の松尾豊先生によると、データサイエンティストとは、一言でいうと「データ分析の専門家」だそうです。

いろいろな書物やネット上で定義されており、一概にはまだ定まっていない状態らしいですが、松尾先生によると、データサイエンティストとはビジネスの課題に対して、統計や機械学習(数学)とプログラミング(IT)スキルを使って、解決する人と定義されています。

データサイエンティストに必要な能力

データサイエンティストには、数学や統計ができる人しかなれないと思われがちですが、それだけではなく、それを実装する力(エンジニアリング力)も必要ですし、そもそもそれらを使ってビジネス課題を解決していく(コンサルティング力みたいなもの)力が求められています。

なのでなかなかハードルが高い職業です。

松尾先生の定義によると、この1つのどれが欠けてもデータサイエンティストではないそうです。

ただ、これらのスキルについてすべてエキスパートだという人はいないので、それぞれの強みを持っている人たちでグループを作り、データサイエンスチームを結成することもあります。

私が個人的に聞いた話では、AIなどのデータサイエンスに精通したフリーのエンジニアがプロジェクトごとにチームを作って、仕事をしたりしているみたいです。今後このような経験豊富な優秀エンジニア集団が、大企業の経営課題とかも解決するようになるのかもしれないですね。というかもう既にそうなのかもしれません。

データ分析の流れ

次に、実際のデータ分析の流れを簡単に説明します。

データ分析のプロジェクトでは、そのビジネス理解、データ理解、データ加工、処理、モデリング、検証、運用の流れを創ることが大事になってきます。

そして実際のビジネス現場で重要になるのは、ビジネス理解です。

クライアントや関係者がはっきりと目的を持っている場合は少ないので、クライアントや関係者と話し合い等をしながら、データサイエンティスト側から課題を見つけ、提案していくことが求められます。

データサイエンティストは、コンサルタントや営業等と協力する必要がありますし、ビジネス的な視点も重要なので、いわゆる「技術屋」みたいな人だとデータサイエンティストとしての仕事をこなせないわけです。

データサイエンティストの給与

f:id:at25250410:20180814235226p:plain
データサイエンティストは技術力や専門スキル、知識を要する仕事である分、能力の個人差が表れやすいので、それぞれの能力によって給料が決められるるため、給与もまちまちみたいです。

現状だと、pythonやAIのライブラリを弄って、データ分析できればデータサイエンティストを名乗れてしまうのかも知れませんが、仕事のスケールは人によって全然違うので、以下のように給与面で差がでるのかなと思います。

求人サイトのIndeed

f:id:at25250410:20180815182408p:plain

平均年収.jp

f:id:at25250410:20180815182449p:plain

アメリカのメディアGlassdoor

f:id:at25250410:20180815181705p:plain

日本でも比較的給与が高い傾向ですが、アメリカだと桁が一つ違いますね。

まとめ

個人的な不満になりますが、日本はもっとエンジニアを大切にするべきだと思います。


エンジニアの待遇を上げないと、今後どんどんアメリカや中国、インドなどに優秀な技術者が行ってしまうでしょう。


エンジニアの給与が上がらないのは、日本に元々あるエンジニア軽視の風潮3次請け、4次請けの中間搾取構造GoogleやAmazonなどの情報を牛耳る大企業が無いことなど色々な原因があるかと思います。


日本は第二次産業で発展してきた国で、ものづくりに関するデータが沢山あるので、ここで日本の一発逆転があるかもしれないです。