数据处理

Hadoop大数据处理 中文pdf

资源名称: 大数据处理 中文 章大数据处理概论 什么是大数据 数据处理平台的基础架构 大数据处理的存储 提升容量 提升吞吐量 大数据处理的计算模式 多处理技术 并行计算 大数据处理系统的容错性 数据存储容错 计算任务容错 大数据处理的云计算变革 本章参考文献 章基于 的大数据处理架构 核心云计算技术 并行计算编程模型 分布式文件系统 分布式结构化数据存储 云计算技术及发展 的由来 原理与运行机制 相关技术及简介 技术的发展与演进 基于云计算的大数据处理架构 基于云计算的大数据处理技术的应用 百度 阿里巴巴

用Apache Spark进行大数据处理-第一部分:入门介绍 中文

资源名称:用 进行大数据处理 第一部分 入门介绍 中文 本文档主要讲述的是用 进行大数据处理 第一部分:入门介绍; 是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在 年由加州大学伯克利分校的 开发,并于 年成为 的开源项目之一。 资源截图:

Hadoop大数据处理技术基础与实践 完整pdf

资源名称: 大数据处理技术基础与实践 完整 基础与实践第 章 概述 . 来源和动机 . 体系架构 . 与分布式开发 . 行业应用案例分析 . . 在门户网站的应用 . . 在搜索引擎中的应用 . . 在电商平台中的应用 . 小结第 章 安装与配置管理 . 实验准备 . 配置一个单节点环境 . . 运行一个虚拟系统 . . 配置网络 . . 创建新的用户组和用户 . . 上传文件到 并配置 、 环境 . . 修改 . 配置文件 . . 修改 主机名 . . 绑定 与 . . 关闭防火墙 . 节点之间的免密码

Python数据处理 PDF_Python教程

资源名称: 数据处理 内容简介: 本书采用基于项目的方法,介绍用 完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括: 基础知识,如何从 、 、 、 和 文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和 中提取数据。 作者简介: 数据科学家,资深软件开发者。活跃于 软件基金会、 等社区。曾参与美国总统创新伙伴项目,是美国政府技术组织 的联合创始人。曾担任《华盛顿邮报》数据记者。 资深 开发者, 联合创始人。喜欢数据分析和获取、网页抓取

深入理解大数据:大数据处理与编程实践

资源名称:深入理解大数据:大数据处理与编程实践 内容简介: 以大数据处理主流平台 为核心,介绍 , , ,以及 的基本设计思想、工作原理、系统构架、以及详细的大数据处理编程技术。   特点:   ( ) 重点放在教读者算法设计实现,从基础算法,到应用编程案例,解决实际问题。   ( ) 作者多年的教学研究实践,课程设计沉淀,可以更深入地讨论大数据。   ( ) 来自业界 真实的实践经验和案例积累。 资源目录: 推荐序一 推荐序二 推荐序三 丛书序言 前言 第一部分 系统 第 章大数据处理技术简介 并行计算