获取网页字符编码的正则表达式

来源：互联网发布：js实现股票分时图代码编辑：程序博客网时间：2024/05/02 13:35

$wcharset = preg_match("/<meta.+?charset=[^\w]?([-\w]+)/i",$filecnt,$temp) ? strtolower($temp[1]):"";
$wtitle = preg_match("/<title>(.*)<\/title>/isU",$filecnt,$temp) ? $temp[1]:"";

这个网上的，还不是最好的。

最完美的正则表达式是这样的：

preg_match('/<meta[^>]*?charset=(["\']?)([a-zA-z0-9\-\_]+)(\1)[^>]*?>/is', $html, $charset);

/<meta[^>]*?charset=(["\']?)([a-zA-z0-9\-\_]+)(\1)[^>]*?>/is
为什么说完美呢，看看图就知道了：

group2就是要取的值。

将meta中可能写入其它项都考虑到了，而且也考虑到可能有引号可能没有引号，可能是双引号也可能是单引号。

其实最牛的是这个可视化正则表达式检测。

网址为：https://jex.im/regulex/
通过它，发现找出html标签的最佳正则是

<([^>]+?)>

0 0

获取网页字符编码的正则表达式
匹配网页编码格式的正则表达式
用正则表达式获取网页的email
正则表达式获取两字符之间的
java--字符编码，正则表达式
PHP 正则表达式获取网页charset 编码，可以获取任意网页charset（代码备份）
正则表达式获取网页链接
正则表达式获取网页链接
正则表达式获取网页名称
正则表达式的字符
正则表达式获取网页中所有图片的路径
swift 获取网页中图片地址的正则表达式
C#中获取匹配正则表达式的字符
C#中获取匹配正则表达式的字符
C#中获取匹配正则表达式的字符
java在字符串中获取满足正则表达式的字符
java 正则表达式获取两个字符中间的字符串
Python字符编码与正则表达式指南
程序4-2
分段选择控件UISegmentedControl、UISwitch、UISlider
SQLite的使用
目录权限
1102. Invert a Binary Tree (25)
获取网页字符编码的正则表达式
QT5.5+vs2010环境搭建
android学习笔记--单元测试
github 下载单个部分文件夹
[LeetCode 201] Bitwise AND of Numbers Range
autoLayout-自动布局
Task '' not found in root project '***'.
C++----Vector的使用
数据科学家应该具备的知识