關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
強(qiáng)化學(xué)習(xí)(微課版)
本書(shū)構(gòu)建了一個(gè)完整的強(qiáng)化學(xué)習(xí)入門(mén)路徑,深入淺出地介紹了強(qiáng)化學(xué)習(xí)算法的基本原理和實(shí)現(xiàn)方法。本書(shū)
首先回顧了相關(guān)預(yù)備知識(shí),包括數(shù)學(xué)基礎(chǔ)和機(jī)器學(xué)習(xí)基礎(chǔ),然后先介紹強(qiáng)化學(xué)習(xí)的基本概念,給出強(qiáng)化學(xué)習(xí)的
數(shù)學(xué)框架(馬爾可夫決策過(guò)程),隨后介紹強(qiáng)化學(xué)習(xí)的求解算法,包括表格求解法(動(dòng)態(tài)規(guī)劃法、蒙特卡洛法
和時(shí)序差分法),以及近似求解法(值函數(shù)近似法、策略梯度法和深度強(qiáng)化學(xué)習(xí))。本書(shū)后一部分為實(shí)踐與前
沿,實(shí)踐部分基于一個(gè)相同的例子實(shí)現(xiàn)了強(qiáng)化學(xué)習(xí)領(lǐng)域的主流基礎(chǔ)算法,前沿部分介紹了強(qiáng)化學(xué)習(xí)領(lǐng)域的**
研究進(jìn)展。本書(shū)配有相當(dāng)數(shù)量的習(xí)題供練習(xí),配套代碼基于 Python 實(shí)現(xiàn),源代碼均已開(kāi)源,可開(kāi)放獲取。
本書(shū)可作為理工科本科生、研究生的強(qiáng)化學(xué)習(xí)課程的教材,也可作為相關(guān)從業(yè)者掌握強(qiáng)化學(xué)習(xí)的入門(mén)
參考書(shū)。
你還可能感興趣
我要評(píng)論
|