由于推薦系統(tǒng)開(kāi)放性的特點(diǎn),惡意用戶(hù)可以通過(guò)注入偽造的用戶(hù)概貌以改變目標(biāo)項(xiàng)目在推薦系統(tǒng)中的排名,托攻擊行為干擾了推薦系統(tǒng)的正常運(yùn)行,阻礙推薦系統(tǒng)的應(yīng)用和推廣。
《推薦系統(tǒng)中基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究》提出了幾種托攻擊監(jiān)測(cè)的方法:提出一種基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架;在基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架基礎(chǔ)上提出了兩種托攻擊檢測(cè)算法;提出了一種結(jié)合目標(biāo)項(xiàng)目分析和支持向量機(jī)的檢測(cè)方法;提出了一種基于目標(biāo)項(xiàng)目分析和時(shí)間序列的托攻擊檢測(cè)算法。
個(gè)性化推薦技術(shù)作為一種解決信息超載問(wèn)題最有效的工具,但是由于推薦系統(tǒng)開(kāi)放性的特點(diǎn),惡意用戶(hù)可以通過(guò)注入偽造的用戶(hù)概貌以改變目標(biāo)項(xiàng)目在推薦系統(tǒng)中的排名,此類(lèi)現(xiàn)象稱(chēng)為托攻擊。托攻擊行為使推薦系統(tǒng)向用戶(hù)推薦被操縱的商品或信息,干擾了推薦系統(tǒng)的正常運(yùn)行,阻礙推薦系統(tǒng)的應(yīng)用和推廣。本書(shū)的主要內(nèi)容如下:
分析了推薦系統(tǒng)國(guó)內(nèi)外研究現(xiàn)狀和面臨的主要挑戰(zhàn);分析推薦系統(tǒng)中相似度計(jì)算方法、托攻擊檢測(cè)評(píng)價(jià)指標(biāo)和現(xiàn)有的用于托攻擊檢測(cè)的概貌屬性,并對(duì)推薦系統(tǒng)中概貌屬性提取技術(shù)進(jìn)行分析。
針對(duì)托攻擊群體性特征以及用戶(hù)評(píng)分矩陣稀疏性的特點(diǎn),提出一種基于目標(biāo)項(xiàng)目分析(TIA)的托攻擊檢測(cè)框架。首先,找出有攻擊嫌疑的疑似托攻擊用戶(hù)集合;其次,構(gòu)建由這些疑似托攻擊用戶(hù)概貌組成的評(píng)分矩陣;最后,通過(guò)目標(biāo)項(xiàng)目分析方法得到攻擊意圖和目標(biāo)項(xiàng)目,檢索出托攻擊用戶(hù)。
通過(guò)分析真實(shí)用戶(hù)概貌和托攻擊用戶(hù)概貌屬性值的分布,在基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架基礎(chǔ)上提出了兩種托攻擊檢測(cè)算法,基于RDMA和DegSim概貌屬性的方法(RD-TIA)和基于一種新的概貌屬性DegSim‘的檢測(cè)方法(DeR-TIA)。
針對(duì)現(xiàn)有的SVM托攻擊檢測(cè)算法存在的缺陷以及推薦系統(tǒng)托攻擊檢測(cè)中存在的類(lèi)不均衡問(wèn)題,本書(shū)提出了使用自適應(yīng)人工合成樣本方法Borderline-SMOTE來(lái)緩解類(lèi)不均衡問(wèn)題。提出了一種結(jié)合目標(biāo)項(xiàng)目分析和支持向量機(jī)(SVM)的檢測(cè)方法(SVM~TIA)。
根據(jù)虛假用戶(hù)惡意注入的評(píng)分信息在時(shí)間節(jié)點(diǎn)上具有集中性的特點(diǎn),以及真實(shí)評(píng)分與托攻擊評(píng)分在統(tǒng)計(jì)學(xué)上呈現(xiàn)的不同分布特征,提出了一種基于目標(biāo)項(xiàng)目分析和時(shí)間序列的托攻擊檢測(cè)算法(TS-TIA)。
本書(shū)受?chē)?guó)家自然科學(xué)基金面上項(xiàng)目“基于異構(gòu)服務(wù)網(wǎng)絡(luò)分析的Web服務(wù)推薦研究”(No.61379158),國(guó)家自然科學(xué)基金青年基金項(xiàng)目“基于用戶(hù)生成信息分析和異常群組發(fā)現(xiàn)的推薦系統(tǒng)托攻擊檢測(cè)研究”(No.61602070)等項(xiàng)目的資助。
本書(shū)的編寫(xiě)和出版受到了重慶大學(xué)軟件學(xué)院的大力支持,在此表示衷心的感謝。
限于本書(shū)作者的學(xué)識(shí)水平,書(shū)中疏漏之處在所難免,懇請(qǐng)讀者批評(píng)指正。
周魏,男,工學(xué)博士。國(guó)家建設(shè)高水平大學(xué)公派研究生項(xiàng)目-聯(lián)合培養(yǎng)博士研究生。香港理工大學(xué)博士后。主要研究方向?yàn)橥扑]系統(tǒng)和數(shù)據(jù)挖掘。近年來(lái)。主持國(guó)家自然科學(xué)基金1項(xiàng),參研國(guó)家自然科學(xué)基金3項(xiàng)。博士后基金1項(xiàng),國(guó)家科技支撐計(jì)劃課題1項(xiàng),中央高?蒲袠I(yè)務(wù)專(zhuān)項(xiàng)基金各1項(xiàng),重慶市自然科學(xué)基金1項(xiàng)。以第1作者發(fā)表學(xué)術(shù)論文9篇,其中SCI檢索期刊4篇。El檢索8篇,計(jì)算機(jī)領(lǐng)域國(guó)際知名會(huì)議4篇,其中5篇為CCF推薦會(huì)議和期刊。文俊浩,男,重慶大學(xué)軟件學(xué)院教授、博士生導(dǎo)師。近年來(lái)主要從事服務(wù)計(jì)算、數(shù)據(jù)挖掘等方面的研究。主持國(guó)家自然科學(xué)基金面上項(xiàng)目2項(xiàng),主持國(guó)家“十一五”科技支撐計(jì)劃項(xiàng)目1項(xiàng),主研國(guó)家自然科學(xué)基金2項(xiàng),主持并參與省部級(jí)項(xiàng)目10余項(xiàng)。2015年獲國(guó)家教學(xué)成果二等獎(jiǎng)(排名第2)。2014年獲國(guó)家教學(xué)成果二等獎(jiǎng)(排名第1),2013年獲重慶市教學(xué)成果一等獎(jiǎng)(排名第1),2011年獲重慶市科技進(jìn)步二等獎(jiǎng)(排名第1)。近年來(lái)。發(fā)表學(xué)術(shù)論文70余篇,其中SCI檢索20余篇,EI檢索30余篇。
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容和創(chuàng)新點(diǎn)
1.4 本書(shū)組織結(jié)構(gòu)
1.5 本章小結(jié)
第2章 推薦系統(tǒng)與推薦系統(tǒng)托攻擊檢測(cè)綜述
2.1 推薦系統(tǒng)綜述
2.2 推薦系統(tǒng)托攻擊
2.3 推薦系統(tǒng)托攻擊檢測(cè)
2.4 概貌屬性綜述
2.5 本章小結(jié)
第3章 基于目標(biāo)項(xiàng)目分析的推薦系統(tǒng)托攻擊檢測(cè)框架
3.1 問(wèn)題的提出
3.2 推薦系統(tǒng)魯棒性分析
3.3 目標(biāo)項(xiàng)目分析方法
3.4 基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架TIAF
3.5 本章小結(jié)
第4章 基于概貌屬性和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究
4.1 基于概貌屬性和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)框架
4.2 RD-TIA托攻擊檢測(cè)方法
4.3 DeR-TIA托攻擊檢測(cè)方法
4.4 實(shí)驗(yàn)過(guò)程與結(jié)果分析
4.5 本章小結(jié)
第5章 基于支持向量機(jī)和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究
5.1 問(wèn)題的提出
5.2 相關(guān)理論
5.3 基于支持向量機(jī)和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)
5.4 實(shí)驗(yàn)過(guò)程與結(jié)果分析
5.5 本章小結(jié)
第6章 基于時(shí)間序列和目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究
6.1 問(wèn)題的提出
6.2 時(shí)間序列建模
6.3 基于目標(biāo)項(xiàng)目分析和時(shí)間序列的托攻擊檢測(cè)框架
6.4 實(shí)驗(yàn)過(guò)程與結(jié)果分析
6.5 本章小結(jié)
第7章 結(jié)論與展望
7.1 主要結(jié)論
7.2 后續(xù)工作展望
參考文獻(xiàn)
《推薦系統(tǒng)中基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究》:
①搜索引擎是指運(yùn)用一定的策略,使用特定的程序?qū)ヂ?lián)網(wǎng)上的信息資源搜集整理,對(duì)信息組織和處理后,供用戶(hù)輸入關(guān)鍵詞查詢(xún)的系統(tǒng)。它搜集并整理互聯(lián)網(wǎng)上的信息并根據(jù)用戶(hù)的查詢(xún)關(guān)鍵詞返回相應(yīng)結(jié)果。搜索引擎不僅能夠滿(mǎn)足人們絕大多數(shù)的搜索需求,還可以按照用戶(hù)的方式對(duì)搜索結(jié)果進(jìn)行個(gè)性化排序。根據(jù)有關(guān)調(diào)查報(bào)告顯示,截至2014年6月,中國(guó)搜索引擎用戶(hù)數(shù)達(dá)到50749萬(wàn)人,較去年同期增長(zhǎng)3711萬(wàn)人,增長(zhǎng)率為7.9%。這表明搜索引擎已經(jīng)逐漸融人人們的日常生活之中。
搜索引擎雖然在用戶(hù)能提供明確需求時(shí)功能強(qiáng)大,但是它只能被動(dòng)地向用戶(hù)展示信息,無(wú)法主動(dòng)地向用戶(hù)提供服務(wù),具有一定的局限性。同時(shí)對(duì)用戶(hù)而言,將需求表達(dá)成一個(gè)或者幾個(gè)合適的關(guān)鍵詞是一個(gè)較大的挑戰(zhàn)。例如,用戶(hù)面對(duì)成千上萬(wàn)的音樂(lè)專(zhuān)輯時(shí),往往難以找出符合自己興趣音樂(lè)的關(guān)鍵詞。此時(shí)搜索引擎難以提供有效的幫助,這就需要一個(gè)更為自動(dòng)化的信息過(guò)濾工具幫助用戶(hù)從龐大的音樂(lè)庫(kù)中找到其感興趣的音樂(lè)。另外,搜索結(jié)果的排序受到用戶(hù)越來(lái)越多的關(guān)注,如何對(duì)搜索結(jié)果進(jìn)行排序顯得尤為重要,而競(jìng)價(jià)排名的出現(xiàn),也成為搜索引擎被人詬病的原因之一。
②推薦系統(tǒng)是一種通過(guò)分析用戶(hù)的歷史行為信息、使用習(xí)慣等向用戶(hù)主動(dòng)推送信息的工具。電子商務(wù)是推薦系統(tǒng)的主要應(yīng)用領(lǐng)域,在電子商務(wù)不斷發(fā)展壯大的今天,各種商品信息在電子商務(wù)網(wǎng)站上不斷涌現(xiàn),用戶(hù)往往需要花費(fèi)大量的時(shí)間在各類(lèi)商品信息中尋找自己想要的商品。推薦系統(tǒng)通過(guò)對(duì)用戶(hù)的歷史消費(fèi)習(xí)慣、點(diǎn)擊情況等信息進(jìn)行分析,向用戶(hù)呈現(xiàn)感興趣的甚至是潛在感興趣的商品,從而減少用戶(hù)瀏覽無(wú)用信息的時(shí)間以幫助用戶(hù)獲得更好的購(gòu)物體驗(yàn),并且能夠?yàn)殡娮由虅?wù)站點(diǎn)帶來(lái)更多的營(yíng)業(yè)額。
推薦系統(tǒng)促進(jìn)了電子商務(wù)的發(fā)展,同時(shí)電子商務(wù)的進(jìn)一步發(fā)展依賴(lài)于推薦系統(tǒng)自身功能的完善。推薦系統(tǒng)需要用戶(hù)大量的歷史記錄作為預(yù)測(cè)的依據(jù),一般來(lái)說(shuō),用戶(hù)提供的歷史數(shù)據(jù)越多,推薦系統(tǒng)向用戶(hù)推薦的結(jié)果就越準(zhǔn)確。推薦系統(tǒng)管理者希望用戶(hù)能夠提供對(duì)項(xiàng)目真實(shí)的評(píng)價(jià)從而使推薦系統(tǒng)能夠產(chǎn)生高質(zhì)量的推薦服務(wù),然而在現(xiàn)實(shí)中,惡意用戶(hù)利用推薦系統(tǒng)評(píng)分驅(qū)動(dòng)的工作機(jī)制與開(kāi)放性的特點(diǎn)來(lái)謀求不正當(dāng)利益。惡意用戶(hù)向推薦系統(tǒng)中注入虛假評(píng)價(jià)信息以達(dá)到干擾推薦系統(tǒng)正常推薦的目的,其結(jié)果是損害正常用戶(hù)的利益和推薦系統(tǒng)的信譽(yù)。例如在電子商務(wù)平臺(tái)中,部分廠(chǎng)商為了銷(xiāo)售更多的商品,向推薦系統(tǒng)注入虛假的評(píng)分信息或評(píng)論信息來(lái)提高商品在推薦系統(tǒng)中的排名;或者使用類(lèi)似的方法打壓競(jìng)爭(zhēng)對(duì)手銷(xiāo)售的產(chǎn)品,以此來(lái)提高自己商品的銷(xiāo)量。現(xiàn)實(shí)生活中也不乏這樣的例子:索尼影業(yè)公司就曾經(jīng)偽造電影評(píng)論信息來(lái)宣傳正在發(fā)行的電影;亞馬遜網(wǎng)站曾遭到外來(lái)的攻擊,當(dāng)用戶(hù)瀏覽與宗教相關(guān)的書(shū)籍時(shí),系統(tǒng)會(huì)向用戶(hù)推薦有關(guān)性方面的書(shū)籍。
為了減少虛假信息對(duì)于推薦系統(tǒng)的影響,推薦系統(tǒng)管理者探討使用各種技術(shù)防御惡意程序的攻擊。例如,實(shí)行實(shí)名制,審核系統(tǒng)用戶(hù)信息,增加惡意用戶(hù)向推薦系統(tǒng)中注入托攻擊概貌的難度;使用驗(yàn)證碼,增加惡意程序的攻擊成本。然而,這些方法能阻止部分惡意程序,但同時(shí)也增加了正常用戶(hù)使用推薦系統(tǒng)的難度,不利于推薦系統(tǒng)的擴(kuò)展。
除了惡意程序?qū)ν扑]系統(tǒng)的攻擊之外,現(xiàn)實(shí)中還有專(zhuān)門(mén)提供托攻擊服務(wù)的人群,被稱(chēng)為“網(wǎng)絡(luò)水軍”。例如手機(jī)軟件公司為了推廣自己開(kāi)發(fā)的軟件,通過(guò)雇傭網(wǎng)絡(luò)水軍來(lái)下載使用自己的軟件,使得軟件在軟件排行榜上的名次上升,吸引更多的用戶(hù)下載使用。網(wǎng)絡(luò)水軍的出現(xiàn)造成部分公司通過(guò)人為操縱下載量的方式長(zhǎng)期占據(jù)軟件排行榜前列導(dǎo)致了不公平競(jìng)爭(zhēng)。
……