關(guān)于我們
書單推薦
新書推薦
|
紙上的想象 讀者對象:本書可供從事信息技術(shù)相關(guān)研究和工程技術(shù)人員閱讀參考
本書專注于研究文本到圖像生成任務(wù),該任務(wù)旨在通過自然語言描述生成逼真且語義一致的圖片。第1章簡要概述基于語言描述的圖像合成研究。在第2章中,提出了一種名為“雙注意力生成對抗網(wǎng)絡(luò)(DTGAN)”的方法,該方法能夠僅用單個生成器/判別器生成與給定自然語言描述相符的高質(zhì)量圖片。第3章致力于解決當(dāng)前單階段文本到圖像生成模型中存在的生成圖像缺乏多樣性的問題。第4章創(chuàng)建了兩個新的Good&Bad數(shù)據(jù)集,包含成功與失敗的合成樣本,并訓(xùn)練了對應(yīng)的分類器,以確保生成的圖片自然、逼真可信。第5章和第6章分別探討基于條件生成對抗網(wǎng)絡(luò)的文本到圖像模型的潛空間和語言空間,以提升可解釋性。通過獨(dú)立成分分析算法對生成器的預(yù)訓(xùn)練權(quán)重值進(jìn)行研究,揭示潛空間與圖像變化之間的關(guān)系。此外,通過關(guān)鍵詞之間的線性插值在合成圖像語義空間中進(jìn)行定性分析,揭示“語言”嵌入的作用。第7章總結(jié)本書的主要貢獻(xiàn)并回答了研究問題。本書可供從事信息技術(shù)相關(guān)研究和工程技術(shù)人員閱讀參考。
你還可能感興趣
我要評論
|