|
ProgrammingGuideBasicConcept
SSS Mapreduce Programming Guide - Basic Concept
ja, en 基本的な概念まず、最初にSSS Mapreduceを利用するにあたって必要となる概念について説明を行います。 TupleGroup通常キーバリューストアではキーとバリューのペアを階層構造などを持たないフラットな空間に記録します。 しかし、フラットな空間にキーとバリューのペアを記録すると、 データ処理を実行した際の入力と出力が区別できない、 あるデータ処理の出力と別のデータ処理の出力が区別できないなどの不都合が発生します。 そのため、SSS Mapreduceのストレージサーバーはキーとバリューのペアをグループ分けして記録します。 このグループを「TupleGroup」と呼びます。 また、「TupleGroup」を構成するひとつひとつのキーとバリューのペアを「Tuple」と呼びます。 SSS Mapreduceのデータ処理では、ストレージサーバーからTupleGroupを読み込み、ワーカーサーバーで然るべき処理を行い、結果を別のTupleGroupとしてストレージサーバーに書き込むという流れが基本となります。 | |