Google BigQuery權(quán)威指南
傅建慶, 姜海龍, 羅一鳴, 潘飛 譯
出版時(shí)間:2021年08月
頁數(shù):514
你是否需要從PB級數(shù)據(jù)中獲取洞察,你是否希望構(gòu)建協(xié)作、敏捷的工作空間?本書是Google BigQuery的規(guī)范參考書,它的存儲(chǔ)系 統(tǒng)可以幫助你整合企業(yè)的全部數(shù)據(jù),其查詢引擎可以支持對大型 數(shù)據(jù)集的交互式分析和機(jī)器學(xué)習(xí)。BigQuery幫助企業(yè)在一個(gè)便捷 的框架中有效地存儲(chǔ)、查詢、導(dǎo)入數(shù)據(jù),并從中學(xué)習(xí)。
本書作者提供了在基于serverless、自動(dòng)擴(kuò)縮容的公共云上建立現(xiàn)代數(shù)據(jù)倉庫的最佳實(shí)踐。無論你是想更全面地了解BigQuery,還 是想專注于特定的任務(wù),這份詳盡的指南都必不可少。
● 深入探討B(tài)igQuery的內(nèi)部工作方式,包括其整體架構(gòu)。
● 學(xué)習(xí)BigQuery支持的數(shù)據(jù)類型、函數(shù)和運(yùn)算符。
● 優(yōu)化查詢語句和schema,從而提高性能或降低成本。
● 使用標(biāo)準(zhǔn)SQL中高級功能,如GIS、歷史快照、DDL/DML、用戶定義函數(shù)和腳本。
● 使用BigQuery ML解決各類機(jī)器學(xué)習(xí)問題。
● 學(xué)習(xí)如何保護(hù)數(shù)據(jù)、監(jiān)控作業(yè),以及授權(quán)用戶。
- 前言
- 第1章 Google BigQuery是什么
- 數(shù)據(jù)處理架構(gòu)
- 使用BigQuery
- BigQuery起源
- 是什么使BigQuery成為可能?
- 小結(jié)
- 第2章 基礎(chǔ)查詢語法
- 簡單查詢
- 使用WHERE進(jìn)行過濾
- SELECT *、EXCEPT和REPLACE
- 聚合
- 數(shù)組與結(jié)構(gòu)體簡介
- Join表
- 保存和分享
- 小結(jié)
- 第3章 數(shù)據(jù)類型、函數(shù)和運(yùn)算符
- 數(shù)值類型和函數(shù)
- 數(shù)學(xué)函數(shù)
- 使用BOOL
- 使用TIMESTAMP
- Date、Time和DateTime
- 使用GIS函數(shù)
- 小結(jié)
- 第4章 將數(shù)據(jù)加載到BigQuery
- 基礎(chǔ)知識
- 聯(lián)邦查詢和外部數(shù)據(jù)源
- 傳輸和導(dǎo)出
- 遷移自有數(shù)據(jù)
- 小結(jié)
- 第5章 使用BigQuery進(jìn)行開發(fā)
- 以編程的方式進(jìn)行開發(fā)
- 通過數(shù)據(jù)科學(xué)工具訪問BigQuery
- 通過Bash腳本使用BigQuery
- 小結(jié)
- 第6章 BigQuery架構(gòu)
- 高層架構(gòu)
- 查詢引擎 Dremel
- 存儲(chǔ)
- 小結(jié)
- 第7章 性能與成本優(yōu)化
- 需要遵循的原則
- 度量和故障排除
- 優(yōu)化數(shù)據(jù)的存儲(chǔ)和訪問方式
- 時(shí)間不敏感的用戶場景
- 小結(jié)
- 第8章 高級查詢
- 可復(fù)用查詢
- 高級SQL
- 擴(kuò)展SQL
- 高級函數(shù)
- 小結(jié)
- 第9章 BigQuery中的機(jī)器學(xué)習(xí)
- 什么是機(jī)器學(xué)習(xí)
- 構(gòu)建回歸模型
- 構(gòu)建分類模型
- 自定義BigQuery ML
- k-Means聚類
- 推薦系統(tǒng)
- 在GCP上自定義機(jī)器學(xué)習(xí)模型
- 小結(jié)
- 第10章 BigQuery安全管理
- 安全基礎(chǔ)設(shè)施
- IAM
- 管理BigQuery
- 可用性、故障恢復(fù)和加密
- 監(jiān)管與合規(guī)
- 小結(jié)
書名:Google BigQuery權(quán)威指南
譯者:傅建慶, 姜海龍, 羅一鳴, 潘飛 譯
國內(nèi)出版社:中國電力出版社
出版時(shí)間:2021年08月
頁數(shù):514
書號:978-7-5198-5677-9
原版書書名:Google BigQuery: The Definitive Guide
原版書出版商:O'Reilly Media
Valliappa Lakshmanan
Valliappa (Lak) Lakshmanan是Google Cloud的數(shù)據(jù)分析和AI解決方案負(fù)責(zé)人。他的團(tuán)隊(duì)借助BigQuery和Google Cloud上的其他數(shù)據(jù)分析、機(jī)器學(xué)習(xí)產(chǎn)品,構(gòu)建軟件解決方案來解決業(yè)務(wù)問題。
Valliappa Lakshmanan是知名高管,與管理層其他同仁和數(shù)據(jù)科學(xué)團(tuán)隊(duì)一起用數(shù)據(jù)和AI創(chuàng)造價(jià)值。
Jordan Tigani
Jordan Tigani是BigQuery的產(chǎn)品管理總監(jiān)。作為BigQuery的創(chuàng)始工程師之一,他幫助數(shù)據(jù)倉庫發(fā)展成為Google Cloud中最成功的產(chǎn)品之一。 他擁有20年的軟件開發(fā)經(jīng)驗(yàn)。