91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片

 
云數(shù)據(jù)湖:構(gòu)建健壯的云數(shù)據(jù)架構(gòu)
云數(shù)據(jù)湖:構(gòu)建健壯的云數(shù)據(jù)架構(gòu)
Rukmani Gopalan
張燕妮 譯
出版時間:2024年09月
頁數(shù):201
“這本書提供了支持云中數(shù)據(jù)工作負載所需的基本知識?!?br /> ——Prasanna Sundararajan
Microsoft Azure首席軟件架構(gòu)師
“這本書是大數(shù)據(jù)領(lǐng)域每個人的必讀書?!?br /> ——Andreilonescu
Adobe高級軟件工程師

企業(yè)比以往任何時候都更加了解云數(shù)據(jù)湖架構(gòu)對于從數(shù)據(jù)中獲取價值的重要性。但是,要構(gòu)建一個穩(wěn)健、可擴展、性能卓越的數(shù)據(jù)湖,仍然是一個復雜的命題,因為這需要大量的工具和選項協(xié)同工作,以提供從數(shù)據(jù)到洞見的無縫端到端管道。
這本實用書籍簡明而全面地概述了云數(shù)據(jù)湖的設(shè)置、管理和治理。作者Rukmani Gopalan是一位產(chǎn)品管理領(lǐng)導者和數(shù)據(jù)愛好者,他指導數(shù)據(jù)架構(gòu)師和工程師了解云數(shù)據(jù)湖工作的主要方面——從設(shè)計考慮因素和最佳實踐到數(shù)據(jù)格式優(yōu)化、性能優(yōu)化、成本管理和治理。
通過閱讀本書,你將:
● 了解基于云的大數(shù)據(jù)戰(zhàn)略對企業(yè)的益處。
● 獲得設(shè)計高性能、可擴展數(shù)據(jù)湖的指導和最佳實踐。
● 研究架構(gòu)和設(shè)計選擇以及數(shù)據(jù)管理原則和策略。
● 構(gòu)建可隨著組織和業(yè)務(wù)需求的增加而擴展的數(shù)據(jù)戰(zhàn)略。
● 在云中實施可擴展的數(shù)據(jù)湖。
● 使用基于云的高級分析,從數(shù)據(jù)中獲取更多價值。
  1. 前言
  2. 第1章 大數(shù)據(jù)—超越喧囂
  3. 1.1 什么是大數(shù)據(jù)
  4. 1.2 彈性數(shù)據(jù)基礎(chǔ)設(shè)施的挑戰(zhàn)
  5. 1.3 云計算基礎(chǔ)
  6. 1.3.1 云計算術(shù)語
  7. 1.3.2 云的價值主張
  8. 1.4 云數(shù)據(jù)湖架構(gòu)
  9. 1.4.1 本地數(shù)據(jù)倉庫解決方案的限制
  10. 1.4.2 什么是云數(shù)據(jù)湖架構(gòu)
  11. 1.4.3 云數(shù)據(jù)湖架構(gòu)的優(yōu)勢
  12. 1.5 開啟云數(shù)據(jù)湖之旅
  13. 1.6 總結(jié)
  14. 第2章 云上的大數(shù)據(jù)架構(gòu)
  15. 2.1 為什么Klodars公司要遷移到云
  16. 2.2 云數(shù)據(jù)湖架構(gòu)基礎(chǔ)
  17. 2.2.1 淺談數(shù)據(jù)的多樣性
  18. 2.2.2 云數(shù)據(jù)湖存儲
  19. 2.2.3 大數(shù)據(jù)分析引擎
  20. 2.2.4 云數(shù)據(jù)倉庫
  21. 2.3 現(xiàn)代數(shù)據(jù)倉庫架構(gòu)
  22. 2.3.1 參考架構(gòu)
  23. 2.3.2 現(xiàn)代數(shù)據(jù)倉庫架構(gòu)的用例
  24. 2.3.3 現(xiàn)代數(shù)據(jù)倉庫架構(gòu)的優(yōu)勢和挑戰(zhàn)
  25. 2.4 數(shù)據(jù)湖倉一體架構(gòu)
  26. 2.4.1 參考架構(gòu)
  27. 2.4.2 數(shù)據(jù)湖倉一體架構(gòu)的用例
  28. 2.4.3 數(shù)據(jù)湖倉一體架構(gòu)的優(yōu)勢和挑戰(zhàn)
  29. 2.4.4 數(shù)據(jù)倉庫和非結(jié)構(gòu)化數(shù)據(jù)
  30. 2.5 數(shù)據(jù)網(wǎng)格
  31. 2.5.1 參考架構(gòu)
  32. 2.5.2 數(shù)據(jù)網(wǎng)格架構(gòu)的用例
  33. 2.5.3 數(shù)據(jù)網(wǎng)格架構(gòu)的優(yōu)勢和挑戰(zhàn)
  34. 2.6 什么是適合的架構(gòu)
  35. 2.6.1 了解客戶
  36. 2.6.2 了解業(yè)務(wù)驅(qū)動因素
  37. 2.6.3 考慮增長和未來場景
  38. 2.6.4 設(shè)計注意事項
  39. 2.6.5 混合方法
  40. 2.7 總結(jié)
  41. 第3章 數(shù)據(jù)湖的設(shè)計注意事項
  42. 3.1 設(shè)置云數(shù)據(jù)湖基礎(chǔ)設(shè)施
  43. 3.1.1 確定目標
  44. 3.1.2 規(guī)劃架構(gòu)和可交付成果
  45. 3.1.3 云數(shù)據(jù)湖實施
  46. 3.1.4 發(fā)布和運行
  47. 3.2 在數(shù)據(jù)湖中組織數(shù)據(jù)
  48. 3.2.1 數(shù)據(jù)生命中的一天
  49. 3.2.2 數(shù)據(jù)湖區(qū)
  50. 3.2.3 組織機制
  51. 3.3 數(shù)據(jù)治理簡介
  52. 3.3.1 數(shù)據(jù)治理的參與者
  53. 3.3.2 數(shù)據(jù)分類
  54. 3.3.3 元數(shù)據(jù)管理、數(shù)據(jù)目錄和數(shù)據(jù)共享
  55. 3.3.4 數(shù)據(jù)訪問管理
  56. 3.3.5 數(shù)據(jù)質(zhì)量和可觀測性
  57. 3.3.6 Klodars公司的數(shù)據(jù)治理
  58. 3.3.7 數(shù)據(jù)治理總結(jié)
  59. 3.4 管理數(shù)據(jù)湖成本
  60. 3.4.1 揭秘云上的數(shù)據(jù)湖成本
  61. 3.4.2 數(shù)據(jù)湖成本策略
  62. 3.5 總結(jié)
  63. 第4章 可擴展的數(shù)據(jù)湖
  64. 4.1 可擴展性探秘
  65. 4.1.1 什么是可擴展性
  66. 4.1.2 日常生活中的規(guī)模
  67. 4.1.3 數(shù)據(jù)湖架構(gòu)中的可擴展性
  68. 4.2 數(shù)據(jù)湖處理系統(tǒng)的內(nèi)部
  69. 4.2.1 內(nèi)部數(shù)據(jù)復制
  70. 4.2.2 內(nèi)部ELT/ETL處理
  71. 4.2.3 關(guān)于其他交互式查詢的說明
  72. 4.3 可擴展數(shù)據(jù)湖解決方案的注意事項
  73. 4.3.1 選擇合適的云產(chǎn)品
  74. 4.3.2 峰值容量規(guī)劃
  75. 4.3.3 數(shù)據(jù)格式和作業(yè)配置文件
  76. 4.4 總結(jié)
  77. 第5章 優(yōu)化云數(shù)據(jù)湖架構(gòu)以提高性能
  78. 5.1 度量性能的基礎(chǔ)知識
  79. 5.1.1 性能的目標和指標
  80. 5.1.2 度量性能
  81. 5.1.3 優(yōu)化以提高性能
  82. 5.2 云數(shù)據(jù)湖性能
  83. 5.2.1 SLA、SLO和SLI
  84. 5.2.2 示例:Klodars公司如何管理其SLA、SLO和SLI
  85. 5.3 性能驅(qū)動因素
  86. 5.3.1 復制作業(yè)的性能驅(qū)動因素
  87. 5.3.2 Spark作業(yè)的性能驅(qū)動因素
  88. 5.4 性能調(diào)優(yōu)的優(yōu)化原則和技術(shù)
  89. 5.4.1 數(shù)據(jù)格式
  90. 5.4.2 數(shù)據(jù)組織和分區(qū)
  91. 5.4.3 在Apache Spark上選擇正確的配置
  92. 5.5 減少數(shù)據(jù)傳輸開銷
  93. 5.6 優(yōu)質(zhì)產(chǎn)品和性能
  94. 5.6.1 大型虛擬機案例
  95. 5.6.2 閃存案例
  96. 5.7 總結(jié)
  97. 第6章 深入了解數(shù)據(jù)格式
  98. 6.1 為什么我們需要這些開放數(shù)據(jù)格式
  99. 6.1.1 為什么我們需要存儲表格數(shù)據(jù)
  100. 6.1.2 為什么在云數(shù)據(jù)湖中存儲表格數(shù)據(jù)是一個問題
  101. 6.2 Delta Lake
  102. 6.2.1 為什么開發(fā)Delta Lake
  103. 6.2.2 Delta Lake如何工作
  104. 6.2.3 什么時候使用Delta Lake
  105. 6.3 Apache Iceberg
  106. 6.3.1 為什么開發(fā)Apache Iceberg
  107. 6.3.2 Apache Iceberg是如何工作的
  108. 6.3.3 什么時候使用Apache Iceberg
  109. 6.4 Apache Hudi
  110. 6.4.1 為什么孵化Apache Hudi
  111. 6.4.2 Apache Hudi如何工作
  112. 6.4.3 什么時候使用Apache Hudi
  113. 6.5 總結(jié)
  114. 第7章 架構(gòu)的決策框架
  115. 7.1 云數(shù)據(jù)湖評估
  116. 7.2 云數(shù)據(jù)湖評估分析
  117. 7.2.1 從零開始
  118. 7.2.2 將現(xiàn)有數(shù)據(jù)湖或數(shù)據(jù)倉庫遷移到云
  119. 7.2.3 改進現(xiàn)有的云數(shù)據(jù)湖
  120. 7.3 決策框架的第1階段:評估
  121. 7.3.1 了解客戶需求
  122. 7.3.2 了解改進的機會
  123. 7.3.3 了解業(yè)務(wù)驅(qū)動因素
  124. 7.3.4 確定需求的優(yōu)先級來完成評估階段
  125. 7.4 決策框架的第2階段:定義
  126. 7.4.1 確定云數(shù)據(jù)湖的設(shè)計選擇
  127. 7.4.2 規(guī)劃云數(shù)據(jù)湖項目可交付成果
  128. 7.5 決策框架的第3階段:實施
  129. 7.6 決策框架的第4階段:操作
  130. 7.7 總結(jié)
  131. 第8章 數(shù)據(jù)啟迪未來的六大經(jīng)驗
  132. 8.1 第1課:關(guān)注云數(shù)據(jù)湖的工作方式和時間,而不是“如果”和“為什么”
  133. 8.2 第2課:權(quán)力越大,責任越大—數(shù)據(jù)也不例外
  134. 8.3 第3課:客戶引領(lǐng)技術(shù),而不是技術(shù)引領(lǐng)客戶
  135. 8.4 第4課:改變是不可避免的,所以要做好準備
  136. 8.5 第5課:建立同理心,分清輕重緩急
  137. 8.6 第6課:巨大的影響不會在一夜之間發(fā)生
  138. 8.7 總結(jié)
  139. 附錄 云數(shù)據(jù)湖決策框架模板
書名:云數(shù)據(jù)湖:構(gòu)建健壯的云數(shù)據(jù)架構(gòu)
作者:Rukmani Gopalan
譯者:張燕妮 譯
國內(nèi)出版社:機械工業(yè)出版社
出版時間:2024年09月
頁數(shù):201
書號:978-7-111-76275-1
原版書書名:The Cloud Data Lake
原版書出版商:O'Reilly Media
Rukmani Gopalan
 
Rukmani Gopalan是一位產(chǎn)品管理領(lǐng)導者,曾在微軟和其他初創(chuàng)公司從事數(shù)據(jù)基礎(chǔ)設(shè)施和平臺方面的工作。她的目標是向數(shù)據(jù)架構(gòu)師和數(shù)據(jù)開發(fā)人員傳授構(gòu)建云數(shù)據(jù)湖平臺的各方面知識。她住在華盛頓州的雷德蒙德,喜歡探索太平洋西北地區(qū),交談時喜歡喝咖啡。
 
 
購買選項
定價:89.00元
書號:978-7-111-76275-1
出版社:機械工業(yè)出版社