从url中提取域名的几种方法
来源:互联网 发布:软件删除system32 编辑:程序博客网 时间:2024/06/05 09:33
自己用python3实现的方法:
import refrom urllib import parse#from urlparse import urlparsetopHostPostfix = ( '.com','.la','.io','.co','.info','.net','.org','.me','.mobi', '.us','.biz','.xxx','.ca','.co.jp','.com.cn','.net.cn', '.org.cn','.mx','.tv','.ws','.ag','.com.ag','.net.ag', '.org.ag','.am','.asia','.at','.be','.com.br','.net.br', '.bz','.com.bz','.net.bz','.cc','.com.co','.net.co', '.nom.co','.de','.es','.com.es','.nom.es','.org.es', '.eu','.fm','.fr','.gs','.in','.co.in','.firm.in','.gen.in', '.ind.in','.net.in','.org.in','.it','.jobs','.jp','.ms', '.com.mx','.nl','.nu','.co.nz','.net.nz','.org.nz', '.se','.tc','.tk','.tw','.com.tw','.idv.tw','.org.tw', '.hk','.co.uk','.me.uk','.org.uk','.vg', ".com.hk")urls = open("f://1.txt") #从1.txt中提取urlsfor url in urls: regx = r'[^\.]+('+'|'.join([h.replace('.',r'\.') for h in topHostPostfix])+')$' pattern = re.compile(regx,re.IGNORECASE) parts = parse.urlparse(url) host = parts.netloc m = pattern.search(host) res = m.group() if m else host print ("unkonw") if not res else res print(res) file_name = "f:/2.txt" #提取的域名写入2.txt file_open = open(file_name,"a") file_open.write(res+"\n") file_open.close()更多python2相关方法参见:https://yq.aliyun.com/ziliao/143478
阅读全文
0 0
- 从url中提取域名的几种方法
- Python实现从url中提取域名的几种方法
- [Python]从url中解析域名的几种方法
- PHP 从 URL 中提取域名 函数
- JavaScript趣题:从URL中提取域名
- php中提取URL中域名的2个方法
- js提取url参数的几种方法(转载)
- js提取url参数的几种方法。(搜集)
- 根据url提取网站域名的方法小结
- 根据url提取网站域名的方法小结
- 【Python】从字符串中提取字母字符串的几种方法
- 从url中提取文件的扩展名
- 正则提取的url中的域名以及替换域名的方法 preg_match()和preg_replace()
- 从URL中取得域名
- 从URL 中取出域名
- 提取字符串中url的方法
- java如何提取url里的域名
- 从html文件中提取超链接URL的shell脚本
- Java关于流的使用
- 拨号上网设置定时自动断网重连
- netty分割符和定长解码器的应用
- MySql 中 一次update更新多条数据
- eclips添加testNG框架
- 从url中提取域名的几种方法
- 翻转后的棋盘
- Android P2P 连接对话框按键
- JS 图片压缩上传并在iOS中矫正方向
- 数据压缩实验五
- ORACLE RMAN恢复测试脚本
- 【技巧】LESS CSS 框架简介
- 线性代数Eigen库安装使用教程
- 我新开的博客,提醒我现在也是一个做技术的人了。