關(guān)于我們
書單推薦
新書推薦

紙上的想象

紙上的想象

定  價:72 元

        

  • 作者:張振興,楊任農(nóng),左家亮著
  • 出版時間:2024/8/1
  • ISBN:9787561294604
  • 出 版 社:西北工業(yè)大學(xué)出版社
  • 中圖法分類:TP391.413 
  • 頁碼:317頁
  • 紙張:
  • 版次:1
  • 開本:26cm
9
7
2
8
9
7
4
5
6
6
0
1
4

讀者對象:本書可供從事信息技術(shù)相關(guān)研究和工程技術(shù)人員閱讀參考

本書專注于研究文本到圖像生成任務(wù),該任務(wù)旨在通過自然語言描述生成逼真且語義一致的圖片。第1章簡要概述基于語言描述的圖像合成研究。在第2章中,提出了一種名為“雙注意力生成對抗網(wǎng)絡(luò)(DTGAN)”的方法,該方法能夠僅用單個生成器/判別器生成與給定自然語言描述相符的高質(zhì)量圖片。第3章致力于解決當(dāng)前單階段文本到圖像生成模型中存在的生成圖像缺乏多樣性的問題。第4章創(chuàng)建了兩個新的Good&Bad數(shù)據(jù)集,包含成功與失敗的合成樣本,并訓(xùn)練了對應(yīng)的分類器,以確保生成的圖片自然、逼真可信。第5章和第6章分別探討基于條件生成對抗網(wǎng)絡(luò)的文本到圖像模型的潛空間和語言空間,以提升可解釋性。通過獨(dú)立成分分析算法對生成器的預(yù)訓(xùn)練權(quán)重值進(jìn)行研究,揭示潛空間與圖像變化之間的關(guān)系。此外,通過關(guān)鍵詞之間的線性插值在合成圖像語義空間中進(jìn)行定性分析,揭示“語言”嵌入的作用。第7章總結(jié)本書的主要貢獻(xiàn)并回答了研究問題。本書可供從事信息技術(shù)相關(guān)研究和工程技術(shù)人員閱讀參考。
 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容