首页
编程语言与程序设计
全部
操作系统
数据库
计算机工具书
IT人文/互联网
网络与通信
软件工程及软件方法学
计算机安全
大数据与云计算
游戏开发
您的位置:
主页
猜你喜欢
1
数据工程之道:设计和构建健壮的数据系统
2
数据架构之道:数据模型设计与管控
3
腾讯大数据构建之道
4
数据库可靠性工程 数据库系统设计与运维指南
5
大数据系统构建:可扩展实时数据系统构建原理与最佳实践
6
数据虚拟化 多源异构数据集成之道
7
构建数据湖仓
8
大数据平台架构与原型实现:数据中台建设实战
9
新工科数据结构
10
数据架构
11
Kudu:构建高性能实时数据分析存储系统
12
数据产品设计
13
华为数据之道
14
非结构化大数据分析
15
Hadoop构建数据仓库实践
16
京东数据中心构建实战
17
从零构建向量数据库
18
数据即未来:大数据王者之道
19
数据库系统内幕
20
统计分析:从小数据到大数据
21
数据治理:工业企业数字化转型之道
22
数据密集型应用系统设计
23
高级算法和数据结构
24
程序员学数据结构
25
数据结构C++Plus语言实现 c语言大话数据结构与算法大数据算法分析导论教程C++ Plus Data Structure考研程序设计网络工程信息安全计算机科学理论软件工程原理
26
数据结构与算法之美
27
大数据实战——大数据、数据科学和人工智能在商务决策中的应用
28
数据安全架构设计与实战
29
大数据分析与应用实战
30
文件系统技术内幕:大数据时代海量数据存储之道
31
趣学数据结构
32
大话数据结构
33
数据价值与产品化设计
34
大数据之路
35
数据中台架构:企业数据化最佳实践
36
Java语言程序设计与数据结构
37
大数据分析:Python爬虫、数据清洗和数据可视化
38
讲透数据治理套装 华为数据之道 一本书讲透数据治理 套装共2册
39
人工智能时代的数据体系 收藏
40
数据科学工程实践
41
透视中国政府统计数据
42
企业级大数据平台构建:架构与实现
43
大数据实践之路:数据中台+数据分析+产品应用
44
数据可视化设计指南:从数据到新知
45
大数据大创新:阿里巴巴云上数据中台之道
46
数据分析之道:用数据思维指导业务实战
47
企业级数据架构:核心要素、架构模型、数据管理与平台搭建
48
人工智能的数学基础——数据之本
49
工业大数据融合体系结构与关键技术
50
数据中台产品经理:从数据体系到数据平台实战
51
数据工程之道:设计和构建健壮的数据系统
下载排行
1
黑马王子
DeepSeek即时通:提示词重塑AI生产力 收藏
2
朱俊义
内网攻防实战图谱:从红队视角构建安全对抗体系 计算机网络技术网络安全Web安全渗透测试 异步图书出品 收藏
3
赵景波
MySQL内核设计与实现 收藏
4
卜东波
学有所承——研究生毕业传承会撷英 收藏
5
剑桥大学出版社
原版进口 剑桥Unlock教材第三版 Unlock 4级别听说 listening speaking 新版剑桥初中英语教材 听力口语阅读写作课程培训 [平装] 收藏
6
本书编写组
煤矿安全规程解读2025 收藏
7
简·S.赫斯特哈文
守恒律方程的数值方法:从分析到算法 收藏
8
宝宝巴士
《儿童科学启蒙大百科》3-6岁幼儿科普趣味绘本科普读物 幼儿园小学课外科普阅读书籍可点读版百科全书 [4-6岁] 收藏
9
李毓佩
漫画李毓佩数学故事 全6册 随书附赠超值赠品 入选《中国小学生基础阅读书目》数学原理概念思维科普 [6-14岁] 收藏
10
竹下文子
汽车嘟嘟嘟系列珍藏版含竹下文子新书真厉害!高空作业车 收藏
11
陈秋贝
公务摄影一本通 收藏
12
果麦文化
我身上有个不可战胜的夏天 收藏
13
锤星创作组
开心锤锤 动画版18 收藏
14
陈统
人工智能工程设计 收藏
15
粟圣森
openEuler操作系统项目实战教程 收藏
16
Roald Dahl
点读版 罗尔德达尔英文原版Level 1-Esio Trot小乌龟是怎样长大的进口原版分级阅读绘本 蓝思值490L [平装] 收藏
17
Roald Dahl
点读版 罗尔德达尔英文原版Level 1- The Enormous Crocodile 巨大的鳄鱼进口原版分级阅读绘本 蓝思值490L [平装] 收藏
18
魏强
病原微生物资源系统保藏学 收藏
19
《新教材里的大百科》编写组
新教材里的大百科二年级上册 注音版新教材里的大百科2025年新版同步新教材1-6年级全国通用上册语数科学知识拓展孩子的第二课堂拓展小学生视野同步课本 数学 科学 三科合一 同步新教材 [6-12岁] 收藏
20
托芙·扬松
独一无二的姆明 做温暖坚韧的小孩 80周年礼盒版 内含图书+姆明灯 托芙·扬松著3-6岁 收藏
21
WLOP
鬼刀4·梦 WLOP典藏插画作品集 收藏
22
七堇年
巧克力与佛 专享冰箱贴 七堇年新作 写给不规则的人 丧气的人 失去位置的人 人有巨大的弹性 去过 收藏
23
东野圭吾
人偶游戏 东野圭吾超自然力量指引的连环杀人事件 以恶制恶的复仇推理 被誉为“幻之作”的东野封神作 收藏
24
冯雪
家庭健康管理全书 冯雪新作 一场关于生活方式的家庭健康革命让家人少生病更安心生活方式医学专家冯雪重磅新作 收藏
25
李超
48课搞定信息学奥赛:C++趣味编程 收藏
26
内田公太
从零自制操作系统 收藏
27
Roald Dahl
点读版 罗尔德达尔英文原版Level 2- Fantastic Mr Fox了不起的狐狸爸爸进口原版分级阅读绘本 蓝思值520L [平装] 收藏
28
Roald Dahl
点读版 罗尔德达尔英文原版Level 3-Charlie And The Chocolate Factory查理和巧克力工厂进口原版分级阅读绘本 蓝思值550L [平装] 收藏
29
Roald Dahl
点读版 罗尔德达尔英文原版Level 2- The Magic Finger魔法手指进口原版分级阅读绘本 蓝思值540L [平装] 收藏
30
龍 幸伸
胆大党官方设定资料指南 [平装] 收藏
计算机与互联网
数据工程之道:设计和构建健壮的数据系统
书籍语言:简体中文
下载次数:4569
书籍类型:Epub+Txt+pdf+mobi
创建日期:2024-04-25 11:10:03
发布日期:2025-09-13
连载状态:全集
书籍作者:乔·里斯
ISBN:9787111745273
运行环境:pc/安卓/iPhone/iPad/Kindle/平板
下载地址
内容简介
本书介绍了数据工程生命周期,并展示如何组合运用各种云技术来满足下游数据消费者的需求。本书分为三部分:第一部分介绍了数据工程的定义、数据工程的生命周期、合理的架构设计和帮助技术选型的框架;第二部分深入介绍了数据工程生命周期的每个阶段——数据生成、存储、获取、转换和服务;第三部分讨论了数据工程的重要部分——安全和隐私。附录还介绍了与处理数据文件和评估数据系统的性能有关的序列化和压缩,以及云网络。本书适合软件工程师、数据科学家、数据工程师和数据分析师等相关技术人员阅读。
作者简介
Joe Reis是“数据恢复科学家”,也是数据工程师和架构师。他是Ternary Data的首席执行官和联合创始人,在统计建模、预测、机器学习、数据工程、数据架构等领域有丰富的从业经验。
Matt Housley是数据工程顾问和云计算专家,目前专注于基于云的数据工程。
编辑推荐
适读人群 :软件工程师、数据科学家、数据工程师和数据分析师等相关技术人员
数据工程在过去的十几年发展迅速,许多软件工程师、数据科学家和分析师想要追寻数据工程的全景。通过这本实用的书,你将学会通过数据工程生命周期框架评估现有的最佳技术,从而规划和构建系统来满足组织和客户的需求。
作者将带领你了解数据工程生命周期,并展示各种云技术的组合运用来满足下游数据消费者的需求。你将了解如何应用数据生成、摄取、编排、转换、存储和治理的概念,无论底层技术如何,这些概念在任何数据环境中都至关重要。
本书将帮助你:
? 全面概览数据工程领域。
? 使用端到端的最佳实践框架来评估数据工程问题。
? 看穿营销炒作,选择正确的技术、数据架构和流程。
? 使用数据工程生命周期来设计和构建健壮的架构。
? 将数据治理和数据安全融入数据工程生命周期。
下载地址
Txt格式下载
兼容性最好的txt格式,支持所有设备
Epub格式下载
iPhone/iPad/安卓/Kindle/平板 首选epub格式,支持分章书签笔记
pdf格式下载
高清pdf扫描版,适合pc阅读
mobi格式下载
mobi格式下载
百度云网盘下载
百度云网盘下载
新浪微盘下载
新浪微盘下载
推送到Kindle上
推送到Kindle上
在线阅读
在线阅读
目录
前言1
第一部分 基础和构建块7
第1章 数据工程概述9
1.1 什么是数据工程9
1.2 数据工程技能和活动18
1.3 组织内部的数据工程师26
1.4 总结34
1.5 补充资料34
第2章 数据工程生命周期36
2.1 什么是数据工程生命周期36
2.2 数据工程生命周期中的主要底层设计49
2.3 总结66
2.4 补充资料67
第3章 设计好的数据架构68
3.1 什么是数据架构68
3.2 好的数据架构的原则73
3.3 主要架构概念81
3.4 数据架构的示例和类型91
3.5 谁参与了数据架构的设计102
3.6 总结102
3.7 补充资料103
第4章 根据数据生命周期选择技术107
4.1 团队大小和能力108
4.2 加速市场化109
4.3 互操作性109
4.4 成本优化和商业价值110
4.5 现在与未来:不变的与暂时的技术112
4.6 部署位置114
4.7 构建与购买122
4.8 单体与模块化128
4.9 无服务器与服务器131
4.10 优化、性能和基准战争135
4.11 底层设计及其对技术选择的影响137
4.12 总结139
4.13 补充资料139
第二部分 深入数据工程生命周期141
第5章 源系统中的数据生成143
5.1 数据源:数据是如何生成的?144
5.2 源系统:主要观点144
5.3 源系统实际细节152
5.4 你和谁一起工作166
5.5 数据底层设计及其对源系统的影响167
5.6 总结171
5.7 补充资料172
第6章 存储173
6.1 数据存储的原材料174
6.2 数据存储系统180
6.3 数据工程存储抽象195
6.4 存储的重要思想和趋势198
6.5 你和谁一起工作206
6.6 底层设计207
6.7 总结209
6.8 补充资料209
第7章 获取210
7.1 什么是数据获取210
7.2 数据获取阶段的关键工程考虑因素212
7.3 批量获取的考虑因素220
7.4 消息和流获取的考虑因素223
7.5 获取数据的方式225
7.6 你和谁一起工作236
7.7 底层设计237
7.8 总结241
7.9 补充资料242
第8章 查询、建模和转换243
8.1 查询244
8.2 数据建模257
8.3 转换276
8.4 你和谁一起工作293
8.5 底层设计294
8.6 总结298
8.7 补充资料298
第9章 为分析、机器学习和反向ETL提供数据服务300
9.1 提供数据服务的常见关注点301
9.2 分析306
9.3 机器学习310
9.4 数据工程师需要理解的机器学习知识310
9.5 为分析和机器学习提供数据服务的方法312
9.6 反向ETL318
9.7 你和谁一起工作319
9.8 底层设计320
9.9 总结324
9.10 补充资料324
第三部分 安全、隐私和数据工程的未来327
第10章 安全和隐私329
10.1 人员330
10.2 流程330
10.3 技术333
10.4 总结336
10.5 补充资料336
第11章 数据工程的未来337
11.1 常青的数据工程生命周期337
11.2 复杂性的下降和易用的数据工具的兴起338
11.3 云数据操作系统及其高互通性339
11.4 “企业级”数据工程340
11.5 数据工程师的头衔和职责将发生的变化341
11.6 超越现代数据栈,迈向实时数据栈341
11.7 总结345
附录A 序列化和压缩技术的细节347
附录B 云网络353
查看全部↓
短评
产品特色