【Java】如何检测、替换4个字节的utf-8编码(此范围编码包含emoji表情)
来源:互联网 发布:polycom网络设置 编辑:程序博客网 时间:2024/06/01 09:05
项目有个需求,是保存从手机端H5页面提交的信息。
大家知道,手机端输入法中经常有自带的表情,其中emoji表情非常流行,如果用户输入emoji表情,由于有部分emoji表情是4个字节的utf-8编码,我们的MySQL数据库在现有版本和编码设置下只能保存3个字节的utf-8编码(如要保存4个字节的utf-8编码则需升级版本和设置另一种编码)。相关信息可见文章《十分钟搞清字符集和字符编码》。
我们的需求不需要支持emoji表情,如果遇到emoji弹出提示或过滤即可。
msg.replaceAll(“[\ud800\udc00-\udbff\udfff\ud800-\udfff]”, “”);
0 0
- 【Java】如何检测、替换4个字节的utf-8编码(此范围编码包含emoji表情)
- MySQL 解决 emoji表情 的方法,使用utf8mb4 字符集(4字节 UTF-8 Unicode 编码)
- UTF-8编码Emoji表情或者某些特殊字符是4个字节导致数据插不进去
- emoji 表情 编码整理
- emoji表情编码集
- Unicode编码的emoji表情如何在前端页面展示(JS)
- 检测字符串包含emoji表情
- emoji字符的Unicode编码范围
- 常用汉字的UTF-8编码及编码范围
- 常用汉字的UTF-8编码及编码范围
- Emoji的编码格式(emoji 简介)
- mysql中的utf8mb4,可以支持Emoji表情的编码格式
- 微信emoji表情编码的处理与储存
- 如何判断输入的内容中是否包含emoji表情
- 如何截取包含中文、Emoji表情的字符串
- mysql存储emoji表情(utf8mb4编码)报错
- MySQL字符编码的讨论:如何处理emoji等4字节的Unicode字符 - utf8mb4 vs. utf8 Collations
- 如何设置Java JDK的默认编码为UTF-8
- git pull更新错误解决办法
- Qml关于注册c++对象
- 使用java websocket简单实现即时聊天
- java__do while 阶乘
- h.264 aac librtmp推流应用
- 【Java】如何检测、替换4个字节的utf-8编码(此范围编码包含emoji表情)
- 数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第二章课后习题答案
- 郭霖大神的6篇博客笔记汇总
- 一天搞定CSS: CSS选择器优先级--08
- SpringMVC常用注解
- JVM内存分析
- setEnv for compile rom
- 【笔记】Maven的安装,配置及Eclipse搭建Maven项目
- JavaScript---DOM模型之DOM树节点的增、删、改、查(一)