令和3年度 秋期 データベーススペシャリスト試験 午前II 問18
2025年6月30日
【問題18】
ビッグデータ処理基盤に利用され、オープンソースソフトウェアの一つであるApache Sparkの特徴はどれか。
MapReduceの考え方に基づいたバッチ処理に特化している。
RDD (Resilient Distributed Dataset) と呼ばれるデータ集合に対して変換を行う。
パブリッシュ/サブスクライブ (Publish/Subscribe) 型のメッセージングモデルを採用している。
マスタノードをもたないキーバリューストアである。
【解説】
ア: MapReduceの考え方に基づいたバッチ処理に特化している。
誤り。Apache SparkはMapReduceの考え方を拡張していますが、リアルタイム処理やストリーミング処理など、多用途に対応できるのが特徴です。
イ: RDD (Resilient Distributed Dataset) と呼ばれるデータ集合に対して変換を行う。
正しい。Apache Sparkの基盤技術としてRDDがあり、分散処理を効率的に行うためのデータモデルです。
ウ: パブリッシュ/サブスクライブ (Publish/Subscribe) 型のメッセージングモデルを採用している。
誤り。これはApache Kafkaなどのメッセージングシステムの特徴であり、Apache Sparkとは異なります。
エ: マスタノードをもたないキーバリューストアである。
誤り。これは分散型キーバリューストアの説明であり、Apache Sparkの特徴ではありません。
【答え】
イ: RDD (Resilient Distributed Dataset) と呼ばれるデータ集合に対して変換を行う。
出典:令和3年度 秋期 データベーススペシャリスト試験 午前II 問18