admin

这家伙很懒,什么也没写
文章
17180
加入时间
8年前

Apache Spark源码剖析

资源名称: 源码剖析 内容简介: 《 源码剖析》以 版本源码为切入点,着力于探寻 所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。 《 源码剖析》第 章详细介绍了 中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握 实现机理。第 章对 库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握 技术。 《 源码剖析》对于 应用开发人员及 集群管理人员都有极好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。 资源目录: 第一部

Hadoop基础教程

资源名称: 基础教程 内容简介: 《 基础教程》包括三个主要部分:第 章讲述了 的核心机制及 的工作模式;第 章涵盖了 更多可操作的内容;第 章介绍了 与其他产品和技术的组合使用。《 基础教程》目的在于帮助读者了解什么是 , 是如何工作的,以及如何使用 从数据中提取有价值的信息,并用它解决大数据问题。   《 基础教程》适用于有软件开发经验的技术人员。 资源目录: 第 章 绪论   大数据处理   数据的价值   受众较少   一种不同的方法       基于 的云计算   云太多了   第三种方法   

大数据Spark企业级实战

资源名称:大数据 企业级实战 内容简介: 是当今大数据领域最活跃、最热门、高效的大数据通用计算平台,是 软件基金会下所有开源项目中三大开源项目之一。   在 理念的指引下, 基于 成功地构建起了大数据处理的一体化解决方案,将 、 、 、 、 等大数据计算模型统一到一个技术堆栈中,开发者使用一致的 操作 中的所有功能;更为重要的是 的 、 、 、 等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了 在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得 正在加速成为大数据

OpenStack云计算平台管理

资源名称: 云计算平台管理 资源目录: 深入浅出 云平台管理 深入浅出 云平台管理 深入浅出 云平台管理 深入浅出 云平台管理 深入浅出 云平台管理 深入浅出 云平台管理 资源截图:

实战大数据

资源名称:实战大数据 内容简介: 数据是重要资产 已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。 本书共 章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例, 云文件系统实例。 本书适合大数据技术初学者、大数据从业人员和

赤裸裸的未来 : 大数据时代:如何预见未来的生活和自己(带目录)

资源名称:赤裸裸的未来 大数据时代 如何预见未来的生活和自己(带目录) 内容简介: 全书主题聚焦于未知与未来,但论述绝非建立在想象之上的空中楼阁,其间穿插着大量事例,或基于客观现实,或依据科学推测,生动有趣。 塔克尔通过大量的访谈和调查,约见各领域的权威人士,积累了极为丰富的素材,提取了他们有关现实的观点和对未来的预期,为我们展开了有关未来社会各领域的翔实可信的图景,讲述的虽是前沿科技主题,内容却平实亲和。就个人而言,我们生活在一个 超级透明 的世界,我们泄露出去的海量信息无处不在。若将这些信息收集起来,

大数据:互联网大规模数据挖掘与分布式处理

资源名称:大数据:互联网大规模数据挖掘与分布式处理 内容简介: 本书源自作者在斯坦福大学教授多年的 挖掘 课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前 应用的许多重要话题。主要内容包括:    分布式文件系统以及 工具;    相似性搜索;    数据流处理以及针对易丢失数据等特殊情况的专用处理算法;    搜索引擎技术,如谷歌的 ;    频繁项集挖掘;    大规模高维数据集的聚类算法;    应用中的关键问题:广告管理和推荐系统。 资源目录:

使用Hadoop构建云计算平台

资源名称:使用 构建云计算平台 内容简介: 核心框架: 和 任务的分解与结果的汇总 分布式计算的基石 是一个 的开源项目 一个能够对大量数据进行分布式处理的软件架构 假设计算元素和存储会失败,因此维护多个工作 数据副本,确保数据在线迁移 在很多场合得到应用: 。 资源截图:

Hadoop云计算技术手册

资源名称: 云计算技术手册 内容简介: 是一个开源的分布式并行计算平台,它主要由 的算法执行和一个分布式的文件系统等两部分组成。 起源于 大牛领导开发的 搜索引擎项目的子项目。现在是 软件基金会管理的开源项目。 本文主要介绍 及相关技术,从 的起源开始讲述,主要涵盖了 算法思想,基本框架,运行流程和编程粒度等内容,以期给入门者提供一个关于 的技术简介和研究参考。关于 的安装指南和编程范例并不在本文叙述范围内,有需要者请参考其它资料。 资源目录: 引言 从何而来 算法思想 是怎么思考的 基本架构 是如何构成