古风君子以泽,盗墓笔记小说txt下载,琅琊榜海宴小说

基于Python的無監(jiān)督學習

孫立超譯

出版時間：2020年12月

頁數(shù)：366

“研究人員、工程師和學生將會欣賞這本書，書中充滿了實用的無監(jiān)督學習技術、通俗易懂并非常實用的Python示例，學習起來快速并且有效。”
——SarahNagy
Edison資深數(shù)據(jù)科學家
很多業(yè)內(nèi)專家認為無監(jiān)督學習是人工智能的下一個前沿，可能把握著進入通用人工智能的鑰匙。因為世界上絕大部分數(shù)據(jù)是無標簽的，傳統(tǒng)的監(jiān)督學習不能使用到它們。無監(jiān)督學習通過另外的方法可以使用到這些無標簽的數(shù)據(jù)集從而發(fā)現(xiàn)數(shù)據(jù)深層的有價值的數(shù)據(jù)模型，這些模型可能是人類自身也無法發(fā)現(xiàn)的。
作者Ankur Patel通過兩個簡單的、可應用于生產(chǎn)的Python框架向您展示了如何應用無監(jiān)督學習:Scikit-learn和包含Keras的TensorFlow。通過代碼和親身操作的實例，數(shù)據(jù)科學家將發(fā)現(xiàn)數(shù)據(jù)中難以發(fā)現(xiàn)的模型：檢測數(shù)據(jù)中的異常、進行自動特征工程和選擇、生成合成數(shù)據(jù)集等，并獲得更深層次的業(yè)務洞察力。您所需要的只是一些編程和機器學習經(jīng)驗就可以開始學習本書。

● 比較不同機器學習方法的優(yōu)缺點：監(jiān)督學習、無監(jiān)督學習和強化學習
● 從頭到尾的建立和管理機器學習項目
● 建立一個異常檢測系統(tǒng)，以捕捉信用卡交易的欺詐
● 將用戶集群到不同的同構組中
● 執(zhí)行半監(jiān)督學習
● 使用受限制玻爾茲曼機開發(fā)電影推薦系統(tǒng)
● 使用生成對抗網(wǎng)絡生成合成圖像

目錄
產(chǎn)品信息
關于作者

前言
第一部分無監(jiān)督學習基礎
第1章機器學習生態(tài)系統(tǒng)中的無監(jiān)督學習
機器學習基本術語
基于規(guī)則（Rules-Based）與機器學習
監(jiān)督學習與無監(jiān)督學習
監(jiān)督學習的優(yōu)缺點
無監(jiān)督學習的優(yōu)缺點
使用無監(jiān)督學習改進機器學習的解決方案
了解監(jiān)督學習算法
線性算法
基于鄰域的算法
基于樹的算法
支持向量機
神經(jīng)網(wǎng)絡
了解無監(jiān)督學習算法
降維
聚類
特征提取
無監(jiān)督深度學習
使用無監(jiān)督學習解決序列數(shù)據(jù)問題
利用無監(jiān)督學習的強化學習
半監(jiān)督學習
無監(jiān)督學習的成功應用
結論
第2章完整機器學習項目
環(huán)境設置
版本控制：Git
克隆本書的Git存儲庫
科學庫：Anaconda發(fā)行版Python
神經(jīng)網(wǎng)絡：TensorFlow和Keras
梯度提升算法，版本1: XGBoost
梯度提升算法，版本2: LightGBM
聚類算法
交互式計算環(huán)境：Jupyter Notebook
數(shù)據(jù)概述
數(shù)據(jù)準備
數(shù)據(jù)采集
數(shù)據(jù)研究
生成特征矩陣和標簽數(shù)組
特征工程與特征選擇
數(shù)據(jù)可視化（Data Visualization）
模型準備
分離出訓練和測試數(shù)據(jù)集
選擇成本函數(shù)
創(chuàng)建k 折交叉驗證集
機器學習模型（第一部分）
評估指標
混淆矩陣（Confusion Matrix）
精確率召回率曲線（Precision-Recall Curve）
觀察者操作特征曲線（receiver operating characteristic）
機器學習模型（第二部分）
模型2：隨機森林(Random Forests)
模型3：XGBoost梯度提升機（gradient boosting machine）
模型4：LightGBM梯度提升機
使用測試集對四個模型評估
集成（Ensembles）
最終算法選擇
完整生產(chǎn)系統(tǒng)
結論
第二部分使用SciKit-Learn進行無監(jiān)督學習
第3章降維
降維的動因
降維算法
主成分分析（principal component analysis，PCA）
PCA概念
PCA練習
增量PCA
稀疏PCA
核PCA
奇異值分解
隨機投影
等距映射
多維標度法
局部線性嵌入
t-分布隨機鄰域嵌入
其他降維方法
字典學習
獨立成分分析
結論
第4章異常檢測
信用卡欺詐檢測
準備數(shù)據(jù)
定義異常評分函數(shù)
定義評估指標
定義繪圖函數(shù)
普通PCA異常檢測
PCA成分數(shù)量等于原始特征的數(shù)量
尋找最優(yōu)主成分數(shù)
稀疏PCA異常檢測
核PCA異常檢測
高斯隨機投影異常檢測
稀疏隨機投影異常檢測
非線性異常檢測
字典學習異常檢測
ICA異常檢測
在測試數(shù)據(jù)集上運行欺詐檢測解決方案
測試數(shù)據(jù)集上的普通PCA異常檢測
測試集上的ICA異常檢測
測試集上使用字典學習異常檢測
結論
第5章聚類
MNIST數(shù)字集
聚類算法
k均值
k均值慣性
評估聚類結果
k均值精度
k均值和主成分的數(shù)量
原始數(shù)據(jù)集上的k均值
層次聚類
層次聚類方法
樹狀圖
評估聚類結果
密度聚類（DBSCAN）
DBSCAN算法
HDBSCAN
結論
第6章分組分割
借貸俱樂部數(shù)據(jù)
數(shù)據(jù)準備
將字符串格式轉換為數(shù)字格式
輸入缺失值
特征工程
選擇最終特征集并執(zhí)行縮放
指定用來評估的標簽
聚類的好處
k均值應用
分層聚類應用
HDBSCAN應用程序
結論
第三部分使用TensorFlow和Keras
無監(jiān)督學習
第7章自動編碼器
神經(jīng)網(wǎng)絡
TensorFlow
Keras
自動編碼器：編碼器和解碼器
欠完備自動編碼器
過完備自動編碼器
密集與稀疏自動編碼器
降噪自動編碼器
變分自動編碼器
結論
第8章自動編碼器實踐
數(shù)據(jù)準備
自動編碼器的組成部分
激活函數(shù)
我們的第一臺自動編碼器
損失函數(shù)
優(yōu)化器
訓練模型
對測試集進行評估
具有線性激活函數(shù)的兩層欠完備自動編碼器
增加節(jié)點數(shù)
添加更多隱藏層
非線性自動編碼器
具有線性激活的過完備自動編碼器
具有線性激活、隨機失活的過完備自動編碼器
具有稀疏、線性激活、隨機失活的過完備自動編碼器
具有稀疏、線性激活、隨機失活功能的過完備自動編碼器
使用噪聲數(shù)據(jù)集
降噪自動編碼器
二層、降噪、具備線性激活的欠完備自動編碼器
兩層、降噪、具備線性激活的過完備自動編碼器
兩層、降噪、ReLu激活的過完備自動編碼器
結論
第9章半監(jiān)督學習
數(shù)據(jù)準備
監(jiān)督模型
無監(jiān)督模型
半監(jiān)督模型
監(jiān)督和無監(jiān)督的合力
結論
第四部分使用TensorFlow和Keras
進行深度無監(jiān)督學習
第10章使用受限玻爾茲曼機器的推薦系統(tǒng)
玻爾茲曼機器
推薦系統(tǒng)
協(xié)同過濾
Netflix獎
MovieLens數(shù)據(jù)集
數(shù)據(jù)準備
定義成本函數(shù)：均方誤差
進行基線實驗
矩陣分解
一個潛在因子
三個潛在因子
五個潛在因子
使用RBM的協(xié)同過濾
RBM神經(jīng)網(wǎng)絡結構
構建RBM類的組件
訓練RBM推薦系統(tǒng)
結論
第11章基于深度信念網(wǎng)絡的特征檢測
深層信念網(wǎng)絡詳述
MNIST圖像分類
受限波爾茲曼機
構建RBM類的組件
使用RBM模型生成圖像
查看中間特征檢測器
為DBN訓練三個RBM
檢查特征檢測器（Examine Feature Detectors）
查看生成的圖像
完整DBN
DBN訓練的工作原理
訓練DBN
無監(jiān)督學習如何幫助監(jiān)督學習
使用LightGBM的圖像分類器
監(jiān)督學習
無監(jiān)督和監(jiān)督的解決方案
結論
第12章生成對抗網(wǎng)絡
生成對抗網(wǎng)絡概念
深度卷積生成對抗網(wǎng)絡
卷積神經(jīng)網(wǎng)絡
重新思考DCGAN
DCGAN生成器
DCGAN的鑒別器
鑒別器和對抗模型
MNIST數(shù)據(jù)集的DCGAN
在MNIST數(shù)據(jù)集執(zhí)行DCGAN
結論
第13章時間序列聚類
心電數(shù)據(jù)
走進時間序列聚類
心電圖k形時間序列聚類
數(shù)據(jù)準備
訓練和評估
在ECG5000上使用k形進行時間序列聚類
數(shù)據(jù)準備
訓練和評估
基于k均值的ECG5000時間序列聚類
基于ECG5000的分層DBSCAN時間序列聚類
比較時間序列聚類算法
k形
k均值
HDBSCAN
比較所有三種時間序列聚類方法
結論
第14章尾聲
監(jiān)督學習
無監(jiān)督學習
SciKit-Learn
TensorFlow和Keras
強化學習
今天最有希望的無監(jiān)督學習領域
無監(jiān)督學習的未來
結語

書名：基于Python的無監(jiān)督學習

作者：Ankur A. Patel 著

譯者：孫立超譯

國內(nèi)出版社：中國電力出版社

出版時間：2020年12月

頁數(shù)：366

書號：978-7-5198-4949-8

原版書書名：Hands-On Unsupervised Learning Using Python

原版書出版商：O'Reilly Media

Ankur A. Patel

Ankur A. Patel是7Park data數(shù)據(jù)科學部門的副總裁（隸屬于Vista Equity Partners投資組合公司）。在7Park data, Ankur和他的數(shù)據(jù)科學團隊使用替代數(shù)據(jù)為對沖基金和企業(yè)構建數(shù)據(jù)產(chǎn)品，并為企業(yè)客戶開發(fā)機器學習服務（MLaaS）。
Ankur A. Patel是Glean和Mellow的聯(lián)合創(chuàng)始人。Glean使用自然語言處理技術生成供應商的支出情報信息，Mellow為程序員提供自然語言處理的API。此前，Ankur曾領導過7Park Data、ThetaRay、RSquared Macro、Bridgewater Associates（橋水聯(lián)合基金）和JPMorgan（摩根大通）的團隊。他也是Hands-On Unsupervised Learning Using Python一書的作者。

查看Ankur A. Patel更多信息

購買選項

定價：98.00元

書號：978-7-5198-4949-8

出版社：中國電力出版社

聯(lián)系出版社郵購

91精品国产综合久久四虎久久_国产成人午夜高潮毛片_99er视频精品免费观看_2020亚洲熟女在线观看_日本女优人体写真_国内黄色毛片_年轻的老师中文版在线_丰满女邻居做爰_久久久久久精品成人免费图片