丁香婷婷综合在线麻豆,丰满少妇被猛烈进入高清播放,无限资源在线观看视频,AV官网在线观看,无遮挡粉嫩小泬久久久久,五十六十路熟女免费一区二区,最新亚洲中文AV在线不卡,国产干逼逼视频,白嫩极品在线播放,五十六十路熟女免费一区二区

Asp.net/C#網(wǎng)頁數(shù)據(jù)采集

admin

2021年1月29日 18:17 本文熱度 2905

早在以前就聽說過數(shù)據(jù)采集這個神奇的功能，當時對這個是多么的奢望啊。 ~00~，后來想要給自己開個采集的網(wǎng)站，就想到了整個電影的采集站。

在好奇的動力下，開始瘋狂的查閱以及學習關(guān)于網(wǎng)頁采集，數(shù)據(jù)采集等相關(guān)信息。不過網(wǎng)上大部都是asp的和php的，關(guān)于.net的很少。無奈之下只要硬著頭皮學習。經(jīng)過幾天的努力，最終還是給我研究出來了。心里還是挺高興的襖。其實網(wǎng)頁采集也沒有用到什么高深的技術(shù)，都是些普普通通的技術(shù)，只不過效果比較神奇，就會讓人感覺到整個都比較深奧，如果你想學習.net的數(shù)據(jù)采集，以及思路，那么請看完。

數(shù)據(jù)采集大體可以分為兩部曲：

一部曲：

因為要采集別人網(wǎng)頁上的內(nèi)容，所有我們先要得到要采集網(wǎng)頁上的html代碼，獲取html代碼還是比較簡單。利用WebClient的DownloadData(url)得帶byte數(shù)組，然后在轉(zhuǎn)換成string字符串。

具體代碼如下：

/// <summary>

/// 獲取網(wǎng)頁源代碼

/// </summary>

/// <param name="url">URL路徑</param>

/// <param name="encoding">編碼方式</param>

public string GetHTML(string url, string encoding)

{

WebClient web = new WebClient();

byte[] buffer = web.DownloadData(url);

return Encoding.GetEncoding(encoding).GetString(buffer);

}

二部曲：

現(xiàn)在我們得到了目標網(wǎng)頁的html代碼，那么我們就開始時得扣取我們想要的數(shù)據(jù)。扣取數(shù)據(jù)無疑就要用到強大的正則表達式了。利用正則表達式的匹配來獲取我們要的內(nèi)容，這里可以過濾掉制定的html代碼，剩下的就是內(nèi)容了。

具體代碼如下：

Html html = new Html();

//得到指定頁面的html代碼，第一個參數(shù)為url(貌似都知道),第二個是目標網(wǎng)頁的編碼集

string htmlCode = html.GetHTML("http://gvod.tom59.cn/List.asp?ClassId=3", "gb2312");

//正則表達式

Regex regexarticles = new Regex("<td\\s+height=\"\\d+\"><a\\s+href=\".+DataId=(?<id>\\d+)\"\\s+target=\"_blank\">(?<title>.+)</a>.*</td>");

//所有匹配表達式的內(nèi)容

MatchCollection marticles = regexarticles.Matches(htmlCode);

///遍歷匹配內(nèi)容

foreach (Match m in marticles)

{

Console.Write("標題:" + m.Groups["title"].Value+"\n");

Console.Write("id:" + m.Groups["id"].Value + "\n");

Console.Write("\n");

}

以上就是采集數(shù)據(jù)的核心代碼，關(guān)于正則表達式我在這里就不詳細講解了(其實正則表達式我也是菜鳥哈)。

該文章在 2021/1/29 18:17:01 編輯過

關(guān)鍵字查詢

網(wǎng)頁

數(shù)據(jù)

相關(guān)文章

正在查詢...

點晴ERP是一款針對中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國內(nèi)大量中小企業(yè)的青睞。

點晴PMS碼頭管理系統(tǒng)主要針對港口碼頭集裝箱與散貨日常運作、調(diào)度、堆場、車隊、財務(wù)費用、相關(guān)報表等業(yè)務(wù)管理，結(jié)合碼頭的業(yè)務(wù)特點，圍繞調(diào)度、堆場作業(yè)而開發(fā)的。集技術(shù)的先進性、管理的有效性于一體，是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。

點晴WMS倉儲管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質(zhì)期管理,貨位管理,庫位管理,生產(chǎn)管理,WMS管理系統(tǒng),標簽打印,條形碼,二維碼管理,批號管理軟件。

點晴免費OA是一款軟件和通用服務(wù)都免費，不限功能、不限時間、不限用戶的免費OA協(xié)同辦公管理系統(tǒng)。