問題
問26
データウェアハウスに蓄積された大量のデータから、傾向やパターン、規則性などを分析し、ビジネス上の知見を発見する技術の総称はどれか。
- データクレンジング
- データ移行
- データマイニング
- データ仮想化
正解
正解は「ウ」です。
解説
正解は「ウ」のデータマイニングです。データマイニングは、統計学やAI(人工知能)などの技術を駆使して、大量のデータ(ビッグデータ)の中から、これまで知られていなかった有益なパターンや相関関係、法則性などを発見するための技術です。その名前の通り、データという「鉱山(mine)」から価値ある情報を「採掘(mining)」するイメージです。
例えば、スーパーマーケットの購買履歴データをデータマイニングすることで、「おむつを買う客は、ビールも一緒に買う傾向がある」といった、一見すると無関係に見える商品の組み合わせを発見することができます。このような知見は、商品の陳列方法の改善や、新たなマーケティング戦略の立案など、ビジネス上の意思決定に直接役立てられます。問題文にある「大量のデータから」「傾向やパターン、規則性などを分析」「ビジネス上の知見を発見する」という記述は、データマイニングの目的と手法を的確に説明しています。
ア(データクレンジング):
データ分析の前処理として、データの欠損値や重複、表記の揺れなどを修正・削除し、データの品質を高める作業のことです。
イ(データ移行):
古いシステムから新しいシステムへ、あるいはある場所から別の場所へデータを移動させることです。システムの刷新時などに行われます。
エ(データ仮想化):
物理的に異なる場所に散在するデータを、あたかも一つのデータベースにあるかのように見せかけ、統合的にアクセスできるようにする技術です。
解法のポイント
この問題は、データ活用に関する用語の定義を正確に理解しているかが問われます。「データマイニング」は「分析して知見を発見する」という目的を持つ技術である点がポイントです。一方、「データクレンジング」や「データ移行」「データ仮想化」は、データを分析しやすくしたり、管理しやすくしたりするための準備や基盤となる技術です。それぞれの用語が、データ活用のどのプロセス(前処理、分析、基盤構築など)に関わるものなのかを意識して覚えると、違いが明確になります。
用語補足
データマイニング:
大量のデータから価値ある情報を掘り出す技術です。砂金採りのように、膨大な砂(データ)の中からキラリと光る金(知見)を見つけ出す作業に似ています。
データウェアハウス (DWH):
企業内の様々なシステムからデータを集めて、目的別に整理・保管しておくためのデータベースです。分析しやすいように時系列で大量のデータが蓄積されています。
データクレンジング:
データをきれいに掃除(クレンジング)することです。例えば、住所録の「東京都千代田区」と「東京都千代田」を統一したり、重複しているデータを削除したりする作業を指します。
知見:
物事の本質を見通す優れた洞察力や、調査・分析などから得られた新しい知識のことです。データ分析においては、ビジネスに役立つ発見を指すことが多いです。


