-
Hadoop与大数据技术大会将于11月30日开幕
更新:2012-11-26 20:58浏览:1224411月26日,由中国计算机协会(CCF)主办,CCF大数据专家委员会协办,CSDN承办的Hadoop与大数据技术大会(HadoopBigData Technology Conference 2012,HBTC 2012)将于2012年11月30日-12月1日在北京新云南皇冠假日酒店举行。 本次大会以大数据共享与开放技术
-
童小军:阿里云+Hadoop让大数据平民化
更新:2012-11-13 07:03浏览:12605云计算正在深刻地改变企业IT的应用模式,以及整个IT产业的格局,同时也给了在ICT产业后发的中国企业带来很大的机遇。在中国市场,众多公司加入了这个行业的角逐,并逐渐成长壮大,也为开发者、ISV/SI及企业用户带来新的更多的选择。阿里云就是其中的一家竞争
-
在Hadoop中保护大数据安全的9个技巧
更新:2012-11-13 08:52浏览:8970当企业转变为数据驱动的机器时,其潜力是巨大的:企业所拥有的数据可能成为获得竞争优势的关键。因此,企业的数据和基础设施的安全也变得比以往任何时候都重要。 在许多情况下,企业或组织都可能得到Forrester所说的有毒的数据。例如,一家无线公司正在收集
-
Hadoop之父勾勒大数据平台的未来
更新:2012-11-07 12:08浏览:13531【导语】大数据不是炒作,也不是泡沫。Hadoop在未来将继续追随谷歌的脚步。Hadoop的创造者兼ApacheHadoop项目创始人Doug Cutting近日表示。 作为一个批处理计算引擎,Apache Hadoop是大数据核心的开源软件框架。有一种说法是,Hadoop并不适用于真正实时数据
-
Intel Hadoop发行版:优化企业大数据处理
更新:2012-11-03 08:32浏览:10552IDC把2012定为大数据元年,由非结构化与半结构化数据组成的大数据与企业用户的距离愈拉愈近。在2011年,Facebook与淘宝等大型的互联网公司已经开始试水大数据运营领域。而Hadoop已经成为企业用户构建海量数据架构的不二之
-
如何为大数据处理构建高性能Hadoop集群
更新:2012-10-24 22:40浏览:9836【IT168 应用】越来越多的企业开始使用Hadoop来对大数据进行处理分析,但Hadoop集群的整体性能却取决于CPU、内存、网络以及存储之间的性能平衡。而在这篇文章中,我们将探讨如何为Hadoop集群构建高性能网络,这是对大数据进行处理分析的关键所在。 关于Hadoo
-
大数据三两事之大数据不是只有Hadoop
更新:2012-10-23 12:28浏览:11282这段时间接触大数据相关项目比较多,自然有些体会和感触。感觉到自己之前对于这个领域的认识并不全面,甚至有点盲目,然后在具体项目或者概念认证阶段走了不少弯路。但好在在这些项目过程中认识接触了不少合作伙伴的兄弟姐妹们,从他们那里学到了不少东西。
-
Hadoop白皮书(5):机器学习Hahout简介
更新:2012-10-21 09:08浏览:14904Mahout 是一套具有可扩充能力的机器学习类库。它提供机器学习框架的同时,还实现了一些可扩展的机器学习领域经典算法的实现,可以帮助开发人员更加方便快捷地创建智能应用程序。通过和 Apache Hadoop 分布式框架相结合,Mahout 可以有效地使用分布式系统来实
-
Hadoop白皮书(4):数据仓库Hive简介
更新:2012-10-21 09:07浏览:14445Hive 是一种建立在 Hadoop 之上的数据仓库架构。它提供了: 一套方便的实施数据抽取(ETL)的工具。 一种让用户对数据描述其结构的机制。 支持用户对存储在Hadoop中的海量数据进行查询和分析的能力。 Hive 的基本特点是它采用 HDFS 进行数据存储并利用 Map/Red
-
Hadoop白皮书(3):分布式计算框架MapReduce简介
更新:2012-10-21 09:05浏览:9694MapReduce 是一个高性能的批处理分布式计算框架,用于对海量数据进行并行分析和处理。与传统数据仓库和分析技术相比,MapReduce 适合处理各种类型的数据,包括结构化、半结构化和非结构化数据。数据量在 TB 和 PB 级别,在这个量级上,传统方法通常已经无法
-
Hadoop白皮书(2):分布式数据库HBase简介
更新:2012-10-21 09:04浏览:13832HBase 是一个面向列的分布式数据库。HBase 不是一个关系型数据库,其设计目标是用来解决关系型数据库在处理海量数据时的理论和实现上的局限性。传统关系型数据库在上世纪七十年代为交易系统设计,以满足数据一致性(ACID)为目标,并没有考虑数据规模扩大时的
-
Hadoop白皮书(1):分布式文件系统HDFS简介
更新:2012-10-21 09:03浏览:13741Hadoop 分布式文件系统 (HDFS) 是运行在通用硬件上的分布式文件系统。HDFS 提供了一个高度容错性和高吞吐量的海量数据存储解决方案。HDFS 已经在各种大型在线服务和大型存储系统中得到广泛应用,已经成为各大网站等在线服务公司的海量存储事实标准,多年来为
-
定义大数据:浅显易懂的大数据入门
更新:2012-10-21 08:44浏览:10101当前,众多企业都面对从四面八方涌来的数据流的冲击。涓涓细流汇成大河,而科技企业、专家、分析师和技术顾问们纷纷将这条数据之河定义为大数据。但是,在这些众说纷纭的大数据定义中,不乏大量的常见误解。大量的企业都面临着挑战,需要辨别具有价值的数据
-
大数据的五大迷思:价值取决于Hadoop?
更新:2012-10-21 08:42浏览:11657目前,大量企业拥有海量的客户信息,包括在线交易记录及社交媒体数据等。但是,成功的关键是要能够从不同渠道和来源的数据中洞察价值,而具备收集并分析这些数据能力的企业将在竞争中拥有显著优势。 但是,数据的非结构化已经成为企业的重大挑战。企业已经熟
-
Hadoop入门:充分利用大数据分析能力
更新:2012-10-21 08:40浏览:12497《Hadoop* 入门-详实步骤助力 IT 经理充分利用大数据分析能力》是来自英特尔IT中心的一份规划指南。 在当前大数据众说纷纭的时代,这份规划指南为 IT 经理提供了重要信息和实施步骤,以帮助他们对大数据分析项目进行规划和实施,并着手开始使用 Hadoop*。指
-
中国大数据10大预测: Hadoop迈向商业化
更新:2012-10-21 08:32浏览:12732在芯动大数据 智领大机遇 英特尔大数据论坛上,IDC企业系统与软件研究组高级研究经理周震刚预测大数据市场趋势时表示,开源的Hadoop将迈向商业化,但部分早期的Hadoop项目会面临挑战。 他表示,大象(Hadoop)会和企鹅跑的一样快,甚至可能跑得更快。他预测说