大数

数据算法:Hadoop/Spark大数据处理技巧 英文pdf原版

资源名称:数据算法: 大数据处理技巧 英文 原版 第 章二次排序:简介 第 章二次排序:详细示例 第 章 列表 第 章左外连接 第 章反转排序 第 章移动平均 第 章购物篮分析 第 章共同好友 第 章使用 实现推荐引擎 第 章基于内容的电影推荐 第 章使用马尔可夫模型的智能邮件营销 第 章 均值聚类 第 章 近邻 第 章朴素贝叶斯 第 章情感分析 第 章查找、统计和列出大图中的所有三角形 第 章 计数 第 章 测序 第 章 回归 第 章 趋势检验 第 章等位基因频率 第 章 检验 第 章皮尔逊相关系数 第

驾驭大数据

资源名称:驾驭大数据 内容简介: 本书提供了处理大数据和在企业中培养创新和探索文化所需的工具、流程和方法,描绘了一个易于实施的行动计划,以帮助企业发现新的商业机会,实现新的业务流程,并做出更明智的决策。 本书重点介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及从人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加具有创造力,以及如

数据科学与大数据分析

资源名称:数据科学与大数据分析 内容简介: 数据科学与大数据分析在当前是炙手可热的概念,关注的是如何通过分析海量数据来洞悉隐藏于数据背后的见解。本书是数据科学领域为数不多的实用性技术图书,它通过详细剖析数据分析生命周期的各个阶段来讲解用于发现、分析、可视化、表示数据的相关方法和技术。《数据科学与大数据分析 数据的发现 分析 可视化与表示》总共分为 章,主要内容包括大数据分析的简单介绍,数据分析生命周期的各个阶段,使用 语言进行基本的数据分析,以及高级的分析理论和方法,主要涉及数据的聚类、关联规则、回归、分

企业大数据系统构建实战:技术、架构、实施与应用

资源名称:企业大数据系统构建实战:技术、架构、实施与应用 内容简介: 本书分 章,分别从企业大数据战略定位、企业大数据落地实施和价值评估,以及大数据的变革与挑战这三大方面进行撰写,宏观上涵盖了企业战略决策和定位,微观上涵盖了大数据职能、思路、方法、流程、开发、应用、评估的整个环节。企业大数据的知识完整性也是本书的特色之一。 资源目录: 前言 第 章企业大数据战略定位 宏观 微观 资源协同 战略定位 启动契机 大数据历程 本章小结 第 章企业大数据职能规划 大数据组织架构体系 大数据部门在企业中的角色 常见

Hadoop大数据处理 中文pdf

资源名称: 大数据处理 中文 章大数据处理概论 什么是大数据 数据处理平台的基础架构 大数据处理的存储 提升容量 提升吞吐量 大数据处理的计算模式 多处理技术 并行计算 大数据处理系统的容错性 数据存储容错 计算任务容错 大数据处理的云计算变革 本章参考文献 章基于 的大数据处理架构 核心云计算技术 并行计算编程模型 分布式文件系统 分布式结构化数据存储 云计算技术及发展 的由来 原理与运行机制 相关技术及简介 技术的发展与演进 基于云计算的大数据处理架构 基于云计算的大数据处理技术的应用 百度 阿里巴巴

Hadoop安全 大数据平台隐私保护 中文pdf

资源名称: 安全 大数据平台隐私保护 中文 第 章 引言 安全概览 机密性 完整性 可用性 验证、授权和审计 安全:简史 组件和生态系统 | 目录 小结 部分 安全架构第 章 保护分布式系统 威胁种类 授权访问/伪装 内在威胁 拒绝服务 数据威胁 威胁和风险评估 用户评估 环境评估 漏洞 深度防御 小结 第 章 系统架构 运行环境 网络安全 网络划分 网络防火墙 入侵检测和防御 角色和隔离策略 主节点 工作节点 管理节点 边界节点 操作系统安全 远程访问控制 主机防火墙 小结 资源截图:

尚学堂_大数据_Hbase视频教程

教程名称: 尚学堂 大数据 视频教程 是一个分布式的、面向列的开源数据库,该技术来源于 所撰写的 论文 :一个结构化数据的分布式存储系统 。就像 利用了 文件系统( )所提供的分布式数据存储一样, 在 之上提供了类似于 的能力。

Spark大数据分析核心概念技术及实践

资源名称: 大数据分析核心概念技术及实践 内容简介: 本书是大数据和 方面的一本简明易懂的手册。它将祝你学习如何用 来完成很多大数据分析人物。它覆盖了高效利用 所需要的一切内容。作者首先介绍 语法,然后介绍作为基石的 再对 的各大组件 、 、 、 进行详细介绍,最后讲解 集群管理。书中不仅给出了丰富的示例代码,还对 的核心概念和基本原理进行了较为全面的介绍,然你不仅知其然且知其所以然。通过本书,你可以快速上手 ,把 应用到实践中。 资源截图:

大数据大创新-阿里巴巴云上数据中台之道

资源名称:大数据大创新 阿里巴巴云上数据中台之道 内容简介: 在 集团内,数据人员面临的现实情况是:集团数据存储已经达到 级别,部分单张表每天的数据记录数高达几千亿条;在 年 双 购物狂欢节 的 小时中,支付金额达到了 亿元人民币,支付峰值高达 万笔 秒,下单峰值达 万笔 秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露 巨大的信息量给数据采集、存储和计算都带来了极大的挑战。《大数据之路 大数据实践》就是在此背景下完成的。本书中讲到的 大数据系统架构,就是为了满足不断变化