在ASP中用“正則表達(dá)式對象”來校驗(yàn)數(shù)據(jù)的合法性
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
我們在制作網(wǎng)站的時(shí)候,尤其是各種電子商務(wù)網(wǎng)站,首先都會(huì)讓用戶填寫一些表格來獲取注冊用戶的各種信息,因?yàn)橛脩粲锌赡茌斎敫魇礁鳂拥男畔?而有些不符合要求的數(shù)據(jù)會(huì)給我們的后端asp處理程序帶來不必要的麻煩,甚至導(dǎo)致網(wǎng)站出現(xiàn)一些安全問題。因此我們在將這些信息保存到網(wǎng)站的數(shù)據(jù)庫之前,要對這些用戶所輸入的信息進(jìn)行數(shù)據(jù)的合法性校驗(yàn),以便后面的程序可以安全順利的執(zhí)行。所以我們一般會(huì)在后端編寫一個(gè)asp的校驗(yàn)程序來分析用戶輸入的數(shù)據(jù)是否是合法的。
或許有人會(huì)問了,使用運(yùn)行在客戶端的javascript不是可以更好更快的來校驗(yàn)用戶的數(shù)據(jù)嗎?的確,這樣在大多的情況下是可以的,為什么是大多情況下呢?因?yàn)槟憔帉懙膉avascript不一定可以完全正常的同時(shí)運(yùn)行在ie以及netscape上面,因?yàn)槲④浀膉script并不全和javascript相同,再加上還有一些瀏覽器不一定和微軟以及netscape兼容的很好,所以很有可能在客戶端的javascript不會(huì)精確的校驗(yàn)用戶輸入的各種數(shù)據(jù),而asp程序是運(yùn)行在服務(wù)器端的,只是和你的服務(wù)器的環(huán)境有關(guān),無論客戶端是什么瀏覽器,對于你的asp程序來說都是沒有分別的,所以選擇使用后端的asp程序來進(jìn)行數(shù)據(jù)合法性的校驗(yàn)是一個(gè)好的選擇。 在使用asp來進(jìn)行后端的數(shù)據(jù)合法性校驗(yàn)的時(shí)候,有些人為滿足不同環(huán)境下面的數(shù)據(jù)校驗(yàn),編寫了很多的函數(shù)來實(shí)現(xiàn),比如,我們想要校驗(yàn)用戶輸入的url 地址是否合法,是可以自己編寫一段代碼來逐個(gè)逐個(gè)字符的分析用戶輸入的信息,要分析的信息量小了,那還比較好辦,若是分析的條件千變?nèi)f化,那可就慘了,不但要編寫很長很繁瑣的代碼,而且運(yùn)行的效率極其低下,有沒有好的解決辦法呢?有,那就是vbscritp5.0提供的“正則表達(dá)式”對象,只要你的服務(wù)器安裝了ie5.x,就會(huì)帶vbscript5.0。其實(shí),“正則表達(dá)式”原本是unix下面的專利,尤其是在perl語言中使用的最為廣泛,正是由于“正則表達(dá)式”的強(qiáng)大功能,才使得微軟慢慢將正則表達(dá)式對象移植到了視窗系統(tǒng)上面,利用 “正則表達(dá)式”對象,我們就可以非常方便的對各種數(shù)據(jù)進(jìn)行合法性的校驗(yàn)了。 首先,讓我們來了解一下究竟什么是vbscript的“正則表達(dá)式”對象,我們先來看一段程序: function checkexp(patrn, strng) dim regex, match ' 建立變量。 set regex = new regexp ' 建立正則表達(dá)式。 regex.pattern = patrn ' 設(shè)置模式。 regex.ignorecase = true ' 設(shè)置是否區(qū)分字符大小寫。 regex.global = true ' 設(shè)置全局可用性。 matches = regex.test(strng) ' 執(zhí)行搜索。 checkexp = matches end function 在這段程序程序中,我們看到可以使用“new regexp”來得到一個(gè)正則表達(dá)式對象,然后對這個(gè)對象進(jìn)行正則匹配模板的賦值,也就是告訴正則表達(dá)式對象,你想要匹配一個(gè)什么樣子的模板,然后使用方法test來檢測待處理的數(shù)據(jù)究竟和我們給出的模版是否相匹配,如果不匹配,那就表明待處理的數(shù)據(jù)不是合法的數(shù)據(jù),從而也就實(shí)現(xiàn)了數(shù)據(jù)合法性的校驗(yàn),我們可以看出,使用一個(gè)設(shè)計(jì)合理的匹配模板,我們可以輕松的校驗(yàn)一批格式類似的數(shù)據(jù)信息。 當(dāng)然,vbscript5.0中的“正則表達(dá)式”對象還有很多的其他的方法和屬性,比如方法replace(),利用他我們就可以很快的實(shí)現(xiàn)現(xiàn)在網(wǎng)上很時(shí)髦的ubb風(fēng)格的論壇以及bbs,這不在我們討論范圍之內(nèi),以后再加以論述,我們現(xiàn)在就看看在數(shù)據(jù)校驗(yàn)方面正則表達(dá)式對象常用的方法和屬性: 常用方法: execute 方法 描述:對指定的字符串執(zhí)行正則表達(dá)式搜索。 語法:object.execute(string) execute 方法的語法包括以下幾個(gè)部分: object:必需的??偸且粋€(gè) regexp 對象的名稱。 string:必需的。要在其上執(zhí)行正則表達(dá)式的文本字符串。 說明:正則表達(dá)式搜索的設(shè)計(jì)模式是通過 regexp 對象的 pattern 來設(shè)置的。execute 方法返回一個(gè) matches 集合,其中包含了在 string 中找到的每一個(gè)匹配的 match 對象。如果未找到匹配,execute 將返回空的 matches 集合。 test方法 描述:對指定的字符串執(zhí)行一個(gè)正則表達(dá)式搜索,并返回一個(gè) boolean 值指示是否找到匹配的模式。 語法:object.test(string) test 方法的語法包括以下幾個(gè)部分: object:必需的。總是一個(gè) regexp 對象的名稱。 string:必需的。要執(zhí)行正則表達(dá)式搜索的文本字符串。 說明:正則表達(dá)式搜索的實(shí)際模式是通過regexp對象的pattern屬性來設(shè)置的。regexp.global屬性對test方法沒有影響。如果找到了匹配的模式,test方法返回true;否則返回false。 常用屬性: global屬性 描述:設(shè)置或返回一個(gè) boolean 值,該值指明在整個(gè)搜索字符串時(shí)模式是全部匹配還是只匹配第一個(gè)。 語法:object.global [= true | false ] object 參數(shù)總是 regexp 對象。如果搜索應(yīng)用于整個(gè)字符串,global 屬性的值為 true,否則其值為 false。默認(rèn)的設(shè)置為 true。 ignorecase屬性 描述:設(shè)置或返回一個(gè)boolean值,指明模式搜索是否區(qū)分大小寫。 語法:object.ignorecase [= true | false ] object 參數(shù)總是一個(gè) regexp 對象。如果搜索是區(qū)分大小寫的,則 ignorecase 屬性為 false;否則為 true。缺省值為 true。 pattern屬性 描述:設(shè)置或返回被搜索的正則表達(dá)式模式。 這是一個(gè)最重要的屬性,我們主要是設(shè)置這個(gè)屬性來實(shí)現(xiàn)數(shù)據(jù)校驗(yàn)的。 語法:object.pattern [= "searchstring"] pattern 屬性的語法包含以下幾個(gè)部分: object:必需的??偸且粋€(gè) regexp 對象變量。 searchstring:可選的。被搜索的正則字符串表達(dá)式。它可能包含設(shè)置部分表格中的各種正則表達(dá)式字符。 設(shè)置:在書寫正則表達(dá)式的模式時(shí)使用了特殊的字符和序列。下表描述了可以使用的字符和序列,并給出了實(shí)例。 字符描述: \:將下一個(gè)字符標(biāo)記為特殊字符或字面值。例如"n"與字符"n"匹配。"\n"與換行符匹配。序列"\\"與"\"匹配,"\("與"("匹配。 ^ :匹配輸入的開始位置。 $ :匹配輸入的結(jié)尾。 * :匹配前一個(gè)字符零次或幾次。例如,"zo*"可以匹配"z"、"zoo"。 + :匹配前一個(gè)字符一次或多次。例如,"zo+"可以匹配"zoo",但不匹配"z"。 ? :匹配前一個(gè)字符零次或一次。例如,"a?ve?"可以匹配"never"中的"ve"。 .:匹配換行符以外的任何字符。 (pattern) 與模式匹配并記住匹配。匹配的子字符串可以從作為結(jié)果的 matches 集合中使用 item [0]...[n]取得。如果要匹配括號字符(和 ),可使用"\(" 或 "\)"。 x|y:匹配 x 或 y。例如 "z|food" 可匹配 "z" 或 "food"。"(z|f)ood" 匹配 "zoo" 或 "food"。 {n}:n 為非負(fù)的整數(shù)。匹配恰好n次。例如,"o{2}" 不能與 "bob 中的 "o" 匹配,但是可以與"foooood"中的前兩個(gè)o匹配。 {n,} :n 為非負(fù)的整數(shù)。匹配至少n次。例如,"o{2,}"不匹配"bob"中的"o",但是匹配"foooood"中所有的o。"o{1,}"等價(jià)于"o+"。"o{0,}"等價(jià)于"o*"。 {n,m} :m 和 n 為非負(fù)的整數(shù)。匹配至少 n 次,至多 m 次。例如,"o{1,3}" 匹配 "fooooood"中前三個(gè)o。"o{0,1}"等價(jià)于"o?"。 [xyz] :一個(gè)字符集。與括號中字符的其中之一匹配。例如,"[abc]" 匹配"plain"中的"a"。 [^xyz] :一個(gè)否定的字符集。匹配不在此括號中的任何字符。例如,"[^abc]" 可以匹配"plain"中的"p". [a-z] :表示某個(gè)范圍內(nèi)的字符。與指定區(qū)間內(nèi)的任何字符匹配。例如,"[a-z]"匹配"a"與"z"之間的任何一個(gè)小寫字母字符。 [^m-z] :否定的字符區(qū)間。與不在指定區(qū)間內(nèi)的字符匹配。例如,"[m-z]"與不在"m"到"z"之間的任何字符匹配。 \b :與單詞的邊界匹配,即單詞與空格之間的位置。例如,"er\b" 與"never"中的"er"匹配,但是不匹配"verb"中的"er"。 \b :與非單詞邊界匹配。"ea*r\b"與"never early"中的"ear"匹配。 \d :與一個(gè)數(shù)字字符匹配。等價(jià)于[0-9]。 \d :與非數(shù)字的字符匹配。等價(jià)于[^0-9]。 \f :與分頁符匹配。 \n :與換行符字符匹配。 \r :與回車字符匹配。 \s :與任何白字符匹配,包括空格、制表符、分頁符等。等價(jià)于"[ \f\n\r\t\v]"。 \s :與任何非空白的字符匹配。等價(jià)于"[^ \f\n\r\t\v]"。 \t :與制表符匹配。 \v :與垂直制表符匹配。 \w :與任何單詞字符匹配,包括下劃線。等價(jià)于"[a-za-z0-9_]"。 \w :與任何非單詞字符匹配。等價(jià)于"[^a-za-z0-9_]"。 \num :匹配 num個(gè),其中 num 為一個(gè)正整數(shù)。引用回到記住的匹配。例如,"(.)\1"匹配兩個(gè)連續(xù)的相同的字符。 \n:匹配 n,其中n 是一個(gè)八進(jìn)制換碼值。八進(jìn)制換碼值必須是 1, 2 或 3 個(gè)數(shù)字長。 例如,"\11" 和 "\011" 都與一個(gè)制表符匹配。"\0011"等價(jià)于"\001" 與 "1"。八進(jìn)制換碼值不得超過 256。否則,只有前兩個(gè)字符被視為表達(dá)式的一部分。允許在正則表達(dá)式中使用ascii碼。 \xn:匹配n,其中n是一個(gè)十六進(jìn)制的換碼值。十六進(jìn)制換碼值必須恰好為兩個(gè)數(shù)字長。例如,"\x41"匹配"a"。"\x041"等價(jià)于"\x04" 和 "1"。允許在正則表達(dá)式中使用 ascii 碼。 好了,常用的方法和屬性就是這些了,上面的語法介紹的已經(jīng)很詳細(xì)了,我們就沒有必要在羅嗦了,接下來我們來看看在具體的例子里面如何使用這些方法和屬性來校驗(yàn)數(shù)據(jù)的合法性,我們還是舉個(gè)例子吧,比如,我們想要對用戶輸入的電子郵件進(jìn)行校驗(yàn),那么,什么樣的數(shù)據(jù)才算是一個(gè)合法的電子郵件呢?我可以這樣輸入:uestc95@263.net,當(dāng)然我也會(huì)這樣輸入:xxx@yyy.com.cn,但是這樣的輸入就是非法的:xxx@@com.cn或者@xxx.com.cn,等等,所以我們得出一個(gè)合法的電子郵件地址至少應(yīng)當(dāng)滿足以下幾個(gè)條件: 1. 必須包含一個(gè)并且只有一個(gè)符號“@” 2. 必須包含至少一個(gè)至多三個(gè)符號“.” 3. 第一個(gè)字符不得是“@”或者“.” 4. 不允許出現(xiàn)“@.”或者.@ 5. 結(jié)尾不得是字符“@”或者“.” 所以根據(jù)以上的原則和上面表中的語法,我們很容易的就可以得到需要的模板如下:"(\w)+[@]{1}(\w)+[.]{1,3}(\w)+" 接下來我們仔細(xì)分析一下這個(gè)模板,首先“\w”表示郵件的開始字符只能是包含下劃線的單詞字符,這樣,滿足了第三個(gè)條件;“[@]{1}”表示在電子郵件中應(yīng)當(dāng)匹配并且只能匹配一次字符“@”,滿足了條件一;同樣的“[.]{1,3}”表示在電子郵件中至少匹配1個(gè)至多匹配3個(gè)字符“.” ,滿足了第二個(gè)條件;模板最后的“(\w)+”表示結(jié)尾的字符只能是包含下劃線在內(nèi)的單詞字符,滿足了條件五;模板中間的“(\w)+”滿足了條件四。 然后,我們就直接調(diào)用剛才的那個(gè)函數(shù)checkexp("(\w)+[@]{1}(\w)+[.]{1}(\w)+",待校驗(yàn)的字符串)就好了,如果返回true就表示數(shù)據(jù)是合法的,否則就是不正確的,怎么樣,簡單吧。我們還可以寫出來校驗(yàn)身份證號碼的模板:"([0-9]){15}";校驗(yàn)url的模板:"^http://{1}((\w)+[.]){1,3}"等等;我們可以看到,這些模板為我們提供了很好的可重利用的模塊,利用自己或者別人提供的各種模板,我們就可以方便快捷的進(jìn)行數(shù)據(jù)的合法性校驗(yàn)了,相信你一定會(huì)寫出非常通用的模板的。 這樣,我們只要定制不同的模板,就可以實(shí)現(xiàn)對不同數(shù)據(jù)的合法性校驗(yàn)了。所以,正則表達(dá)式對象中最重要的屬性就是:“pattern”屬性,只要真正掌握了這個(gè)屬性,才可以自由的運(yùn)用正則表達(dá)式對象來為我們的數(shù)據(jù)校驗(yàn)進(jìn)行服務(wù)。 該文章在 2011/4/19 11:00:18 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |