今回は、 Hadoopの構成要素である並列データ処理フレームワークMapReduceにおける実装アーキテクチャの特徴について解説します。加えて、 類似のシステムである並列データベースを取り上げ、 想定するワークロードなどの違いについて解説します。 Apache ...
昨今、 バッチ処理にHadoopを活用する事例が話題になっています。その中でも特筆すべきなのは、 分散処理技術であるMapReduceです。しかし、 MapReduceを実際に使うには、 数台から数100台のサーバを用意し、 Hadoopのセットアップもしなければなりません。
「MapReduce」よ、道を譲ってくれ。君はここまでよく頑張ってくれたが、今日のビッグデータ開発者が求めているのは、処理速度と簡潔性だ。 「Apache Hadoop」(以下Hadoop)環境で稼働するフレームワークとして、最近登場した、高速処理が得意な「Apache Spark ...