获取网页字符编码的正则表达式
来源:互联网 发布:js实现股票分时图代码 编辑:程序博客网 时间:2024/05/02 13:35
- $wcharset = preg_match("/<meta.+?charset=[^\w]?([-\w]+)/i",$filecnt,$temp) ? strtolower($temp[1]):"";
- $wtitle = preg_match("/<title>(.*)<\/title>/isU",$filecnt,$temp) ? $temp[1]:"";
这个网上的,还不是最好的。
最完美的正则表达式是这样的:
preg_match('/<meta[^>]*?charset=(["\']?)([a-zA-z0-9\-\_]+)(\1)[^>]*?>/is', $html, $charset);
/<meta[^>]*?charset=(["\']?)([a-zA-z0-9\-\_]+)(\1)[^>]*?>/is
为什么说完美呢,看看图就知道了:
group2就是要取的值。
将meta中可能写入其它项都考虑到了,而且也考虑到可能有引号可能没有引号,可能是双引号也可能是单引号。
其实最牛的是这个可视化正则表达式检测。
网址为:https://jex.im/regulex/
通过它,发现找出html标签的最佳正则是
<([^>]+?)>
/<meta[^>]*?charset=(["\']?)([a-zA-z0-9\-\_]+)(\1)[^>]*?>/is
为什么说完美呢,看看图就知道了:
group2就是要取的值。
将meta中可能写入其它项都考虑到了,而且也考虑到可能有引号可能没有引号,可能是双引号也可能是单引号。
其实最牛的是这个可视化正则表达式检测。
网址为:https://jex.im/regulex/
通过它,发现找出html标签的最佳正则是
<([^>]+?)>
0 0
- 获取网页字符编码的正则表达式
- 匹配网页编码格式的正则表达式
- 用正则表达式获取网页的email
- 正则表达式 获取 两字符之间的
- java--字符编码,正则表达式
- PHP 正则表达式 获取网页charset 编码 ,可以获取任意网页charset(代码备份)
- 正则表达式获取网页链接
- 正则表达式获取网页链接
- 正则表达式获取网页名称
- 正则表达式的字符
- 正则表达式获取网页中所有图片的路径
- swift 获取网页中图片地址的正则表达式
- C#中获取匹配正则表达式的字符
- C#中获取匹配正则表达式的字符
- C#中获取匹配正则表达式的字符
- java在字符串中获取满足正则表达式的字符
- java 正则表达式获取两个字符中间的字符串
- Python字符编码与正则表达式指南
- 程序4-2
- 分段选择控件UISegmentedControl、UISwitch、UISlider
- SQLite的使用
- 目录权限
- 1102. Invert a Binary Tree (25)
- 获取网页字符编码的正则表达式
- QT5.5+vs2010环境搭建
- android学习笔记--单元测试
- github 下载 单个 部分 文件夹
- [LeetCode 201] Bitwise AND of Numbers Range
- autoLayout-自动布局
- Task '' not found in root project '***'.
- C++----Vector的使用
- 数据科学家应该具备的知识