關(guān)于我們
書單推薦
新書推薦

強化學(xué)習(xí)與最優(yōu)控制

強化學(xué)習(xí)與最優(yōu)控制

定  價:139 元

叢書名:信息技術(shù)和電氣工程學(xué)科國際知名教材中譯本系列

        

  • 作者:[美]德梅萃·P. 博塞克斯(Dimitri P. Bertsekas) 著 李宇超 譯
  • 出版時間:2024/4/1
  • ISBN:9787302656449
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:O232 
  • 頁碼:284
  • 紙張:
  • 版次:1
  • 開本:
9
7
6
8
5
7
6
3
4
0
4
2
9
本書的目的是考慮大型且具有挑戰(zhàn)性的多階段決策問題,這些問題原則上可以通過動態(tài)規(guī)劃和**控制來解決,但它們的精確解決方案在計算上是難以處理的。本書討論依賴于近似的解決方法,以產(chǎn)生具有足夠性能的次優(yōu)策略。這些方法統(tǒng)稱為增強學(xué)習(xí),也可以叫做近似動態(tài)規(guī)劃和神經(jīng)動態(tài)規(guī)劃等。 本書的主題產(chǎn)生于**控制和人工智能思想的相互作用。本書的目的之一是探索這兩個領(lǐng)域之間的共同邊界,并架設(shè)一座具有任一領(lǐng)域背景的專業(yè)人士都可以訪問的橋梁。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容