データサイエンティストの仕事とは何か?ビジネスの課題をデータで解決するスペシャリストを解説

2021年2月5日

データサイエンティストの概要

データサイエンティストとはビッグデータと呼ばれる巨大で複雑なデータを扱う職種です。
データサイエンティストは主にビッグデータの収集、加工、分析を行います。この分析結果を企業経営に役立てたり、ビジネス上の課題を解決したりします。

データサイエンティストの仕事の流れ

データサイエンティストの基本的な仕事の流れは以下のとおりです。

1.データ分析の企画

まずは企業が抱えている課題を洗い出し、課題を解決するためにどのようなデータが必要かを検討します。さらに想定される結果について仮説を立てます。

2.データの収集

業務システムやインターネット上から分析の元となるデータを収集します。データベース言語であるSQLやAPIといったツールを使い、データを取得します。取得したデータはそのままでは扱いづらいためフォーマットの統一を行います。

3.データクレンジング

不要な情報や重複した情報を削除したり、表記ゆれを統一したりしてデータを加工します。この工程は非常に重要で、データ解析の質を高めます。

4.データの解析

企画時に立てた仮説と比べて、結果がどうだったかを検証します。また、解析した結果から新たな知見を得ることもあります。

5.レポーティング

解析結果を見える化します。ビジネス戦略や課題解決の提案について、経営層へ向けてアプローチします。そのため、データサイエンティストにもビジネスの知見が求められます。

データサイエンティストに求められるスキルセット

データサイエンティストに求められるスキルセットとして、以下のものが挙げられます[1]応用情報技術者平成31年春期 午前問63

  • ビジネス力
  • データサイエンス力
  • データエンジニアリング力

データサイエンティストのビジネス力とは、課題の背景を理解した上で、ビジネス課題を整理・分析し、解決する力のことです。
データサイエンス力は人工知能や統計学などの情報科学に関する知識を用いて、予測、検定、関係性の把握およびデータ加工・可視化する力のことです。例えば、分析要件に対して、どのような手法を採用するのかを考えることができることもデータサイエンス力に含まれます。
データエンジニアリング力とは、データ分析によって作成したモデルを使えるように、分析システムを実装、運用する力のことです。

データ分析で使われる技術

先ほどはデータサイエンティストに求められるスキルセットを紹介しましたが、ここからは具体的にデータサイエンティストがビッグデータの分析の際に使うプログラミング言語や分析技術を紹介していきます。

R言語

オープンソースの統計解析に特化したプログラミング言語です。データ解析の結果をグラフに出力することが得意です。本格的なデータ分析が簡単な記述でできます。統計解析に関するパッケージも数多く提供されています。

Python

R言語と同じくデータ分析や機械学習に利用されます。R言語とよく比較されますが、Pythonの方がR言語に比べて汎用的です。たとえばPythonでは、Webアプリケーションなどを作ることができます。

データベース/SQL

データベースの知識も必須です。また、データベースを扱うための言語であるSQLが使える必要もあるでしょう。SQLにはMySQLやPostgreSQLなどの種類がありますが、基本的な文法は変わりません。

統計学と機械学習

統計学と機械学習は混同しやすい概念です。

統計学は、人間がデータから規則や傾向を発見し、説明することを目的としています。一方で、機械学習は、機械にデータを与えることで規則や傾向に照らし合わせて、最適な判断を自動で行うことを目的としています。

なぜデータサイエンティストが必要なのか

蓄積された膨大なデータは、企業の貴重な経営資源です。「ヒト」「モノ」「カネ」といった従来から重要視されてきた資源に加えて「データ」も重要な資源の一つになっています。

データサイエンティストの仕事はデータを分析するだけにとどまらず、分析した結果をもとに経営戦略を立てる手助けをしたりビジネス上の課題を解決したりすることです。企業が直面するさまざまな意思決定の場面において、データサイエンティストは経営の先行きを左右します。

こういった理由があるためデータの分析から提案まで行えるデータサイエンティストは必要です。データサイエンティストは今後ますますその存在感を増していくと考えられます。

データサイエンティストのキャリアパス

データサイエンティストのキャリアパスは大きく2つに分かれます。

1つ目はコンサルタントやマーケターといったビジネス系の職種です。コンサルタントはデータ分析の結果からビジネス上の課題を抽出し解決します。マーケターは市場調査を行い経営戦略の立案などに役立てます。こういったビジネス系の職種は、データサイエンティストの知識やスキルに加えて、コミュニケーション能力やプレゼンテーション能力などのビジネススキルも必要になってきます。

もう1つは技術系に特化したデータベースアーキテクトやAIエンジニアなどです。データベースアーキテクトは情報収集に必要なデータベースを設計から考える職種です。データの分析結果をビジネスに役立てるAIを作るAIエンジニアも技術系のキャリアパスといえるでしょう。

参考

1 応用情報技術者平成31年春期 午前問63