網(wǎng)絡(luò)信息采集加工與應(yīng)用技術(shù)
定 價(jià):98 元
- 作者:尹寶生著
- 出版時(shí)間:2024/1/1
- ISBN:9787559133458
- 出 版 社:遼寧科學(xué)技術(shù)出版社
- 中圖法分類:TP393.07
- 頁碼:325頁
- 紙張:
- 版次:1
- 開本:26cm
本書重點(diǎn)介紹了網(wǎng)絡(luò)信息采集的主要技術(shù)方法、信息加工的主要技術(shù)以及信息應(yīng)用具體實(shí)踐等內(nèi)容。其中的信息采集部分主要介紹了基于RSS訂閱、網(wǎng)絡(luò)爬蟲、網(wǎng)站API、物聯(lián)網(wǎng)傳感器、問答大模型等信息采集方式,以及信源發(fā)現(xiàn)技術(shù)、主題采集技術(shù)、定點(diǎn)采集技術(shù)和常用采集工具等;信息加工部分主要介紹了時(shí)間信息識(shí)別與標(biāo)準(zhǔn)化技術(shù)、實(shí)體關(guān)系分類技術(shù)、文本摘要生成技術(shù)、事件抽取技術(shù)、文獻(xiàn)聚類技術(shù)、技術(shù)脈絡(luò)分析技術(shù)等;信息應(yīng)用部分主要介紹了信息推薦技術(shù)、信息采集平臺(tái)的構(gòu)建以及知識(shí)管理平臺(tái)的構(gòu)建等。
第一部分信息采集技術(shù)
1互聯(lián)網(wǎng)信息資源的值
2網(wǎng)絡(luò)信息采集的主要方式
2.1基于RSS 訂閱的信息采集
2.2基于網(wǎng)絡(luò)爬蟲的信息采集
2.3基于網(wǎng)站API的信息采集
2.4基于物聯(lián)網(wǎng)傳感器的信息采集
2.5基于問答大模型的信息采集
3網(wǎng)絡(luò)信息采集的主要技術(shù)
3.1定點(diǎn)采集技術(shù)
3.2主題采集技術(shù)
3.3采集技術(shù)
3.4實(shí)時(shí)流數(shù)據(jù)采集技術(shù)
4網(wǎng)絡(luò)信息采集的主要工具
4.1 Scrapy
4.2BeautifulSoup
4.3Selenium
4.4PySpider
4.pache Nutch
4.6Goutte
4.7Crawlera
4.8Apify
4.9Octoparse
4.10Import. io
4.11Content Grabber
4.12ParseHub
4.13WebHarvy
5基于網(wǎng)站特征分析的信源發(fā)現(xiàn)技術(shù)
5.1問題的提出及相關(guān)研究
5.2網(wǎng)站特征分析及數(shù)據(jù)處理
5.3基于網(wǎng)站特征分析的相關(guān)度計(jì)算
5.4信源發(fā)現(xiàn)技術(shù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.5研究結(jié)論
延伸閱讀
……
第二部分信息加工技術(shù)
第三部分信息應(yīng)用技術(shù)