利用WebClient正则表达式下载资源
来源:互联网 发布:龙虎榜数据怎么来的 编辑:程序博客网 时间:2024/05/21 19:22
//我们拿下载图片举个例子
static WebClient client = new WebClient();
class Program
{
static WebClient client = new WebClient();
static void Main(string[] args) { string[] str = GetHvtImgUrls(@"http://www.imooc.com/");//下载地址 string url = ""; for (int i = 0; i < str.Length; i++) { url = str[i]; if (url.EndsWith(".jpg"))//判断是否是以jpg来结尾的 { if (!url.Contains("http:"))//判断是不是以hppt:开头的 { url = "http:" + url; } string filepath = @"D:\path练习\" + Guid.NewGuid() + ".jpg"; client.DownloadFile(url, filepath); } } } /// <summary> /// 取得HTML中所有图片的 URL。 /// </summary> /// <param name="sHtmlText">HTML代码</param> /// <returns>图片的URL列表</returns> public static string[] GetHvtImgUrls(string url) { string content = client.DownloadString(url);//获取返回的信息 // 定义正则表达式用来匹配 img 标签 (正则表达式很多,若想了解跟多欢迎点击https://baike.baidu.com/item/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F/1700215?fr=aladdin) Regex m_hvtRegImg = new Regex(@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>", RegexOptions.IgnoreCase); // 搜索匹配的字符串 MatchCollection matches = m_hvtRegImg.Matches(content); int m_i = 0; string[] sUrlList = new string[matches.Count]; // 取得匹配项列表 foreach (Match match in matches) sUrlList[m_i++] = match.Groups["imgUrl"].Value; return sUrlList; }
阅读全文
0 0
- 利用WebClient正则表达式下载资源
- 利用WebClient异步下载文件
- 正则表达式资源
- 正则表达式的资源
- 正则表达式学习资源
- C#开发学习笔记:利用WebClient下载文件
- C#利用WebClient 两种方式下载文件
- 正则表达式抓取网页资源
- 正则表达式学习资源汇总
- 正则表达式应用--提取CSDN所有下载资源页面URl的思路与代码实现
- 利用WebClient上传文件
- 使用WebClient实现下载
- WebClient下载文件代码!
- WebClient下载文件
- HTTP下载webClient
- C#下载文件:WebClient
- 使用WebClient下载
- WebClient下载图片示例
- Java基础
- Mysql中,int(10)中10的意义
- OpenGL+Qt界面(一) 资料以及相关的博客
- 模仿某网站做的简约风格
- 第1次C练习
- 利用WebClient正则表达式下载资源
- 文件读写的一些坑
- 数据结构实验之栈与队列六:下一较大值(二)
- maven安装配置
- 深入理解Java虚拟机(二)
- 分布式的Raft算法
- COCOS2D-X在给弹出框加入弹出效果过程中遇到的问题以及解决办法
- C的内存虚拟地址空间结构
- Java语言中几个常用的包