[點(diǎn)晴永久免費(fèi)OA]瀏覽器指紋技術(shù)詳解(什么是瀏覽器指紋追蹤,本文提供了JS封裝包,直接調(diào)用即可生成指紋值)
網(wǎng)頁追蹤的五種技術(shù):五種技術(shù):HTTP cookies(又稱作標(biāo)準(zhǔn)信息記錄程序)是由 Web 服務(wù)器保存在用戶瀏覽器(客戶端)上的包含有關(guān)用戶信息的小文本文件,分為第一方cookie和第三方cookie。 其中,第三方cookie是與網(wǎng)站用戶毫無關(guān)系的其他公司為了跟蹤用戶而安置在不同網(wǎng)站上的?;赾ookie在多個(gè)網(wǎng)站跟蹤得來的用戶信息,比如興趣、身體狀況甚至是政治觀點(diǎn)等等,廣告商建立用戶畫像(online profiling),識(shí)別用戶身份特征,并根據(jù)用戶特點(diǎn)推送特定廣告或者將用戶信息轉(zhuǎn)手賣給其他企業(yè)。 無論是第一方cookie還是第三方cookie,網(wǎng)絡(luò)用戶都可以選擇刪除cookies文件來避免互聯(lián)網(wǎng)公司跟蹤自己的網(wǎng)頁瀏覽記錄。Flash cookie是Adobe Flash的開發(fā)者建立在用戶電腦上用以儲(chǔ)存用戶信息的文件。它與HTTP cookie最顯著的不同在于,即使用戶已經(jīng)刪除,F(xiàn)lash cookies仍然能夠在不告知用戶的情況下再次生成,繼續(xù)跟蹤用戶信息。 Etags(實(shí)體標(biāo)簽),開發(fā)本意是希望通過直接保存歷史瀏覽網(wǎng)頁為用戶提供更快速的瀏覽體驗(yàn),但這種技術(shù)也被廣告商用來在用戶端儲(chǔ)存識(shí)別碼。 HTML5 本地儲(chǔ)存方式的優(yōu)點(diǎn)在于儲(chǔ)存時(shí)間長、容量大,在蘋果研發(fā)越來越多的脫離Flash軟件的產(chǎn)品之后,HTML5將成為Flash cookie的替代之選,使用范圍越來越廣。 The Evercookie 跟蹤機(jī)制則是融合前述幾種技術(shù),其特點(diǎn)是重復(fù)——即便用戶刪除了某個(gè)跟蹤文本,另一個(gè)追蹤文本會(huì)立刻恢復(fù)生成識(shí)別碼。 第二大類技術(shù),瀏覽器指紋識(shí)別是指服務(wù)器一端通過瀏覽器直接查詢用戶的電腦屬性,比如用戶使用哪個(gè)瀏覽器、下載了哪些字體,以此識(shí)別用戶特征。由于該活動(dòng)在服務(wù)器一端進(jìn)行,所以用戶很難發(fā)現(xiàn)和阻擋。綜上,跟蹤技術(shù)從舊到新、不斷迭代,都是廣告商為了使這些跟蹤技術(shù)更難被消費(fèi)者察覺和阻擋,以更隱秘的方式剝奪網(wǎng)絡(luò)使用者面對(duì)廣告推送的選擇權(quán),從而使行為廣告成為“人們無法拒絕的offer”。 設(shè)備指紋反欺詐技術(shù) 設(shè)備指紋具備不受瀏覽器兼容性限制、用戶無法修改、不會(huì)被瀏覽器清除、可跨應(yīng)用追蹤等諸多優(yōu)點(diǎn),可謂集美貌與智慧于一身,在網(wǎng)絡(luò)營銷、反欺詐等領(lǐng)域應(yīng)用廣泛。設(shè)備指紋也有門派之分,其中主要分為主動(dòng)式、被動(dòng)式和混合式,其中主動(dòng)式發(fā)展最早、技術(shù)門檻相對(duì)較低,因而目前應(yīng)用比被動(dòng)式和混合式兩種更為廣泛。 主動(dòng)式設(shè)備指紋 主動(dòng)式設(shè)備指紋的應(yīng)用,需要收集諸多信息才能保證設(shè)備識(shí)別的準(zhǔn)確性,如MAC地址、設(shè)備IMEI號(hào)、廣告跟蹤ID、設(shè)備唯一序列號(hào)、地理位置等等。 此外,還要突破瀏覽器兼容性、千變?nèi)f化的設(shè)備型號(hào)、代理、軟件篡改設(shè)備信息等重重難關(guān)。 主動(dòng)式設(shè)備指紋技術(shù): Step 1:準(zhǔn)備好已聯(lián)網(wǎng)的電腦一臺(tái) Step 2:打開以下網(wǎng)站https://github.com/Valve/fingerprintjs2 Step 3:加載fingerprintjs2 Step 4:接著在頁面中加入以下代碼就可以輕松獲得設(shè)備指紋啦 主動(dòng)式設(shè)備指紋技術(shù)存在的弊端: 1.存在明顯的用戶隱私侵犯,并因此可能導(dǎo)致被Google和蘋果Apple Store下架。舉個(gè)例子,金融、支付行業(yè)中有很多業(yè)務(wù)場景對(duì)于用戶隱私的保護(hù)要求很高,就無法使用主動(dòng)式設(shè)備指紋做設(shè)備識(shí)別。 2.主動(dòng)式指紋不能實(shí)現(xiàn)App和mobile web間,不同瀏覽器間的設(shè)備識(shí)別。主動(dòng)式設(shè)備指紋對(duì)于需要跨網(wǎng)頁/應(yīng)用追蹤用戶行為的場景,比如追蹤App安裝究竟來自哪個(gè)廣告渠道,就無能為力。 3.主動(dòng)式設(shè)備指紋所取特征均暴露于客戶端,欺詐者可輕易通過一些一鍵新機(jī)等工具篡改相應(yīng)特征信息,從而使指紋無效。這些場景就需要相對(duì)技術(shù)門檻更高的被動(dòng)式設(shè)備指紋技術(shù)來解決了。 被動(dòng)式設(shè)備指紋技術(shù) 最新的被動(dòng)式設(shè)備指紋技術(shù),從數(shù)據(jù)包的OSI七層協(xié)議中,提取出這臺(tái)設(shè)備的操作系統(tǒng)、協(xié)議棧和網(wǎng)絡(luò)狀態(tài)相關(guān)的特征,并結(jié)合機(jī)器學(xué)習(xí)算法以標(biāo)識(shí)和跟蹤具體的移動(dòng)設(shè)備。相比于主動(dòng)式設(shè)備指紋技術(shù),被動(dòng)式設(shè)備指紋技術(shù)在適用范圍和靈活性上,有著不可比擬的優(yōu)勢(shì): 1)更大的適用范圍,由于被動(dòng)式設(shè)備指紋技術(shù)完全工作在服務(wù)器側(cè),一些無法植入SDK或JS的場景也可使用; 2)跨Web/App,跨瀏覽器的識(shí)別; 3)完全不侵犯用戶隱私,避免了被AppStore下架的風(fēng)險(xiǎn)。 混合式設(shè)備指紋技術(shù) 混合式設(shè)備指紋技術(shù)指將主動(dòng)式和被動(dòng)式設(shè)備指紋技術(shù)整合在同一個(gè)設(shè)備識(shí)別與跟蹤的架構(gòu)中,將主動(dòng)式設(shè)備指紋技術(shù)在客戶端生成的設(shè)備標(biāo)識(shí)符,與被動(dòng)式設(shè)備指紋技術(shù)在服務(wù)器端收集的、協(xié)議棧相關(guān)的特征信息對(duì)應(yīng)起來,使得所有的設(shè)備都有一個(gè)唯一的設(shè)備識(shí)別ID。 混合式設(shè)備指紋技術(shù)融合了主動(dòng)式和被動(dòng)式設(shè)備指紋技術(shù)各自的優(yōu)點(diǎn),在準(zhǔn)確識(shí)別設(shè)備的同時(shí),擴(kuò)大了設(shè)備指紋技術(shù)的適用范圍。 準(zhǔn)確率進(jìn)一步提高: 主動(dòng)式設(shè)備指紋技術(shù)本身已經(jīng)具有很高的準(zhǔn)確率,接近100%。在此基礎(chǔ)上,混合式設(shè)備指紋技術(shù)能夠?qū)⒅鲃?dòng)式和被動(dòng)式的識(shí)別結(jié)果相互印證和校驗(yàn),從而使準(zhǔn)確率進(jìn)一步提高。 適用范圍更廣: 出于隱私保護(hù)的目的,純主動(dòng)式設(shè)備指紋技術(shù)的使用場景越來越受限,同時(shí)其對(duì)于SDK和JS代碼的依賴,致使其無法應(yīng)用在不便于在客戶端植入代碼的場景。例如,Apple公司就嚴(yán)格限制APP中用戶與設(shè)備信息的收集行為,任何超越合理范圍的信息收集都可能被視為違規(guī)行為,而遭到APP下架的懲罰。 而混合式設(shè)備指紋技術(shù)則可根據(jù)用戶的不同場景,來靈活決定設(shè)備指紋的生成和校驗(yàn)方式。對(duì)于用戶隱私保護(hù)要求寬松的場景,可以使用主動(dòng)式設(shè)備指紋技術(shù)來獲得快速、穩(wěn)定的設(shè)備標(biāo)識(shí);而對(duì)于用戶隱私保護(hù)要求嚴(yán)格,或無法嵌入SDK和Javascript代碼的場景,則可以使用被動(dòng)式設(shè)備指紋技術(shù)。 此外,在需要將同一用戶在移動(dòng)Web和App中的行為關(guān)聯(lián)起來的場景中,混合式設(shè)備指紋技術(shù)也有著比主動(dòng)式更大的應(yīng)用范圍。 用戶行為信息分析 在堅(jiān)實(shí)的設(shè)備指紋的基礎(chǔ)上,需要在會(huì)話和賬號(hào)兩層采集和提取用戶行為信息。在會(huì)話的層面上,借助基于概率的聚類模型和模式挖掘算法(sequential pattern mining),將用戶的行為模式,比如事件發(fā)生的次序以及事件發(fā)生的間隔時(shí)間,歸為幾類。并在此基礎(chǔ)上識(shí)別出異常行為模式。 這些標(biāo)示特征為區(qū)分正常用戶和欺詐者或自動(dòng)化工具提供了重要信息;更進(jìn)一步,在賬號(hào)的層面上:首先以賬號(hào)為索引,將會(huì)話層面上提取到的行為信息特征按時(shí)間串聯(lián)起來,得到賬戶層面的異常行為標(biāo)示特征。其次根據(jù)賬號(hào)相關(guān)聯(lián)的歷史行為數(shù)據(jù),提取出用戶的偏好屬性,比如是否為僵尸賬號(hào),相鄰登錄的平均地理距離等。最后,我們將這些信息綜合起來,形成特有的用于反欺詐的用戶畫像。 當(dāng)一個(gè)賬號(hào)再次出現(xiàn)在業(yè)務(wù)中時(shí),用戶畫像中的特征就可以幫助我們?cè)u(píng)估對(duì)應(yīng)業(yè)務(wù)事件的風(fēng)險(xiǎn)。在實(shí)踐中,我們還發(fā)現(xiàn),由“羊毛黨”控制的賬號(hào),通常具有某些相似性,比如所用手機(jī)號(hào)碼都來自某個(gè)號(hào)段,用戶名都由三個(gè)小寫字母,五個(gè)大寫字母和四個(gè)數(shù)字組成。據(jù)此,我們就可以定義賬號(hào)之間的相似度。這樣即使一個(gè)賬號(hào)首次出現(xiàn),我們也可以使用用戶畫像,對(duì)其風(fēng)險(xiǎn)做一個(gè)大致的評(píng)估。 用戶畫像除了本身能直接應(yīng)用于欺詐行為的判斷外。還可作為網(wǎng)絡(luò)圖譜模型的輸入,為欺詐網(wǎng)絡(luò)的發(fā)現(xiàn)提供線索和依據(jù)。 規(guī)則引擎與機(jī)器學(xué)習(xí)模型 目前并沒有一個(gè)通用的反欺詐框架可以識(shí)別并防范所有形式的欺詐。在每一個(gè)領(lǐng)域,金融欺詐都有不同的形式和特征,比如,一個(gè)應(yīng)用于信用卡申請(qǐng)的反欺詐模型并不能直接應(yīng)用于保險(xiǎn)領(lǐng)域,亦無法直接應(yīng)用于信貸領(lǐng)域。 最常用的反欺詐模型,是通過建立一個(gè)規(guī)則引擎或者機(jī)器學(xué)習(xí)模型來描述欺詐行為的特征,從而將欺詐行為從正常操作中區(qū)別開來。在反欺詐規(guī)則引擎中,這些甄別欺詐行為的規(guī)則依賴于從大量歷史案例中總結(jié)出來的“專家知識(shí)”。例如,如果一個(gè)人申請(qǐng)貸款所用的手機(jī)號(hào)與其常用的手機(jī)號(hào)不一致,則這筆申請(qǐng)的欺詐風(fēng)險(xiǎn)就被認(rèn)定稍高一些。 反欺詐機(jī)器學(xué)習(xí)模型,它指的是采用數(shù)據(jù)挖掘方法,基于歷史數(shù)據(jù)(即,已知的欺詐申請(qǐng)和正常申請(qǐng)的數(shù)據(jù))而建立的分類模型。這類模型的訓(xùn)練往往需要大量數(shù)據(jù)。 兩者有何區(qū)別?規(guī)則引擎可以看作是一種特殊的最簡單的機(jī)器學(xué)習(xí)模型:決策樹模型。決策樹模型具有極好的可解釋性,因而,即使數(shù)據(jù)量不足,也可以通過專家知識(shí)來補(bǔ)全規(guī)則集。而廣義上的反欺詐機(jī)器學(xué)習(xí)模型往往指的是采用更復(fù)雜的算法建立的模型(如隨即森林、深度學(xué)習(xí)等)。這些模型的訓(xùn)練需要大量的歷史數(shù)據(jù)并且其結(jié)果通常很難解讀。 不論是規(guī)則引擎還是機(jī)器學(xué)習(xí)模型,都是從歷史案例中發(fā)現(xiàn)金融欺詐時(shí)重復(fù)出現(xiàn)的個(gè)體行為模式。這個(gè)方法在很多領(lǐng)域被證明為有效(例如,用于審核個(gè)人還款能力意愿的信用評(píng)分模型),然而在解決金融欺詐問題時(shí)表現(xiàn)一般,原因有兩個(gè): 其一,金融欺詐的模式隨時(shí)間不斷演化和發(fā)展,而不僅僅是重復(fù)出現(xiàn)在歷史案例中的個(gè)體行為模式; 其二,隨著反欺詐技術(shù)的進(jìn)步,金融欺詐越來越難以由個(gè)體完成,而是需要通過團(tuán)伙有組織的進(jìn)行。 關(guān)系圖譜反欺詐 關(guān)系圖譜提供了全新的反欺詐分析角度。 關(guān)系圖譜是描述個(gè)體及個(gè)體之間關(guān)系的圖。下圖給出了一個(gè)移動(dòng)支付場景的關(guān)系圖譜示例,個(gè)體類型可以包括IP地址、設(shè)備、支付賬戶、賬戶聯(lián)系人等,個(gè)體之間也可以存在不同的關(guān)系,比如IP登錄行為、設(shè)備登錄行為、聯(lián)系人登記行為等。 關(guān)系圖譜把不同的個(gè)體按照其關(guān)系連接在一起,從而提供了從“關(guān)系”的角度分析問題的能力。這更有利于從正常行為中識(shí)別出到異常的團(tuán)伙欺詐行為。
接下來,我們來討論關(guān)系圖譜在反欺詐中的應(yīng)用場景,主要分為監(jiān)督模型和無監(jiān)督模型兩種情況。所謂的監(jiān)督模型,指的是在已知“好”和“壞”標(biāo)簽的前提下,嘗試從歷史數(shù)據(jù)中,挖掘出欺詐團(tuán)伙的典型特征和行為模式,從而能夠有效的識(shí)別出金融欺詐團(tuán)伙。監(jiān)督模型雖然在預(yù)測準(zhǔn)確性上有不錯(cuò)的表現(xiàn),但是,實(shí)際情況中,“好”和“壞”的標(biāo)簽往往很難得到。因此,在沒有標(biāo)簽信息時(shí),無監(jiān)督模型分析也變得尤為重要。當(dāng)然,本文提到的分析方法只是關(guān)系圖譜在反欺詐場景中的冰山一角,更多的算法模型需要結(jié)合實(shí)際業(yè)務(wù)需求進(jìn)行設(shè)計(jì)和開發(fā)。 典型運(yùn)用一:異常檢測 異常檢測是在無監(jiān)督模型學(xué)習(xí)中比較有代表性的方法,即在數(shù)據(jù)中找出具有異常性質(zhì)的點(diǎn)或團(tuán)體。在檢測欺詐團(tuán)體的情況下,異常檢測被認(rèn)為是比較有效果的。 以貸款申請(qǐng)為例,許多團(tuán)伙會(huì)選擇共享一些申請(qǐng)信息,如提供同一個(gè)皮包公司的地址作為公司信息,或者聯(lián)系人電話重合程度高。因此,在關(guān)系網(wǎng)絡(luò)中,大多數(shù)的正常的個(gè)體應(yīng)該是獨(dú)立的節(jié)點(diǎn),或者與另一個(gè)節(jié)點(diǎn)組成規(guī)模為二的團(tuán)體(在這種情況下,多數(shù)可能為家人或親友關(guān)系)。若出現(xiàn)三個(gè)點(diǎn)以上甚至十幾個(gè)點(diǎn)關(guān)系密切時(shí),則這些團(tuán)體可被歸為異常。 異常檢測并不能夠明確的給出一個(gè)團(tuán)體是否欺詐,但是可以通過這種方法排查出可疑的團(tuán)伙,從而進(jìn)行調(diào)查。該算法并不是基于歷史數(shù)據(jù)挖掘隱藏的欺詐模式,因而常常能夠有效地識(shí)別出新出現(xiàn)的未曾記錄的欺詐行為。 典型運(yùn)用二:團(tuán)體分群 團(tuán)體分群即是對(duì)給定網(wǎng)絡(luò)中的團(tuán)體依據(jù)以上特征進(jìn)行區(qū)分,從而挖掘有潛在欺詐風(fēng)險(xiǎn)的團(tuán)體的方法。舉一個(gè)簡單的例子,以團(tuán)體中的男性占比和年齡差者兩個(gè)特征來對(duì)網(wǎng)絡(luò)中的團(tuán)體進(jìn)行分群。作為以家人關(guān)系而形成的團(tuán)體,一般由三人形成,多為兩男一女或兩女一男,男性占比33%或67%,并且年齡差一般為20-30歲。具有這種性質(zhì)的團(tuán)體一般為家庭團(tuán)體,因而風(fēng)險(xiǎn)性較小。但對(duì)于人數(shù)較多,男性占比高,而且年齡差較小的團(tuán)體,則有可能是欺詐團(tuán)伙,需要進(jìn)一步調(diào)查。 以上,我們對(duì)設(shè)備指紋、用戶行為信息、規(guī)則引擎、機(jī)器學(xué)習(xí)、關(guān)系圖譜等反欺詐技術(shù)做了一個(gè)簡單的介紹。在反欺詐實(shí)踐中,這些提取出來的特征,結(jié)合多層動(dòng)態(tài)模型,能有效地識(shí)別出高風(fēng)險(xiǎn)薅羊毛行為,幫助企業(yè)打擊“羊毛黨”。 該文章在 2022/7/15 9:28:02 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |