Apache Hadoop 简单配置及实践(一)
Apache Hadoop 是一个分布式计算基础框架,通过它可以使用N台计算机同时处理某个复杂的计算任务。用户(应用程序)只需要定义如何将一项计算任务拆分(Map)以及如何将各个分任务的结果合并(Reduce),剩下的事情比如如何协调N台计算机一起工作,如何保证即使某一台计算机中途坏掉了也不会影响整项任务的工作等,都由 Hadoop 代劳。Hadoop...
View ArticleApache Hadoop 简单配置及实践(二)
上一篇讲到 Hadoop 的基本配置,实际上我们在搭建分布式计算系统的同时也已经搭建好分布式储存系统了,我们除了可以使用 Hadoop 命令行 管理系统内的文件和目录,也可以通过 Hadoop API 来操作数据。下面简述如何在应用程序调用HDFS。 1、先用 Maven 创建一个Java Application (Console) 程序,然后引用 hadoop-core-0.20.2.jar。...
View ArticleApache Cassandra 的集群配置
Apache Cassandra 是 NoSQL 阵营产品中重要的成员之一,因为 Cassandra 使用了去中心化的模式(类似 memcached), 因此使用它搭建集群非常简单。下面简述使用 Cassandra 0.7 搭建集群的过程。 1、基本配置 首先需要准备3台或以上的计算机。下面假定有3台运行 Linux 操作系统的计算机,IP地址分别为 192.168.0.100,...
View Article
More Pages to Explore .....