使用COMPOSE和UNISTR创建沉音字符
来源:互联网 发布:imagesloaded.js下载 编辑:程序博客网 时间:2024/05/16 08:48
<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
很多语言,包括英语在内,都使用沉音字符(accentedcharacter)。因为这些字符不属于ASCII字符集,所以如果不查看Unicode值也不使用Unicode编辑器并将其转成一个已知字符集,就很难编写使用这些字符的代码。
9i引入了COMPOSE函数,该函数接受一串Unicode字符并规则化其文本。这就意味着它可以接受一个字母和一个组合标记,比如说‘a'(Unicode字符0097)和沉音符(Unicode字符0300),然后创建一个单独的由两个标记组合而成的字符。COMPOSE使用特殊的组合标记,而没有使用ASCII中相应的音节标记,它所使用的特殊的组合标记是Unicode标准的一部分。上面的例子的结果应该是Unicode字符00E0(有一个沉音符的小写拉丁字母‘a')。
在ANSI中最常见的组合字符有:
·U+0300:沉音符(graveaccent)(`)
·U+0301:重音符(acuteaccent)(')
·U+0302:抑扬音符号(circumflexaccent)(^)
·U+0303:颚化符号(tilde)(~)
·U+0308:元音变音
如果没有特殊的或者键盘驱动程序的话,很难在键盘上输入Unicode字符0097和0300。因此,以纯ASCII文本输入Unicode序列的一个方法是使用UNISTR函数。这个函数接受一个ASCII字符串然后以国家字符集(通常作为16位Unicode或者UTF-8字符集安装)创建一个Unicode字符的序列。它使用十六进制占位符序列映射任何非ASCII字符,映射方式与类似。
要输入a后接一个沉音符组合字符的序列,可以使用UNISTR(‘a/0300'),而不要试图直接在代码中输入字符。这个函数在任何字符集以及任何具有基于Unicode的国家字符集的下都可以正常运行。可以将多个组合字符放在函数中——可以在UNISTR函数中混合使用ASCII和Unicode占位符。例如,可以像下面这样使用UNISTR函数:
selectCOMPOSE(UNISTR('Unlessyouarenai/0308ve,meetmeatthecafe/0301with
yourre/0301sume/0301.'))fromdual;
在将UNISTR函数的输出与COMPOSE组合时,可以在不查找任何值的情况下生成一个Unicode字符。例如:
select'itistrue'ifCOMPOSE(UNISTR('a/0300'))=UNISTR('/00e0');
COMPOSE函数返回一个NVARCHAR2字符串,返回的NVARCHAR2字符串通常是基于Unicode的。如果是在本地使用这些字符,在结果中具有一个隐式地TO_CHAR时,数据库将尝试将Unicode字符映射到本地字符集。不是所有的字符都可以被映射,有一些字符组合在COMPOSE中不能工作,因为Unicode协会没有在Oracle所用的级别定义它们。
要快速地检查字符如何在一个特定的环境下查询,可以运行一个与下面的脚本类似的脚本,以查看在输出组合字符如何被映射。你可能需要确定一下NLS_LANG设置以确保这些字符正确地返回:
createorreplacetypehexrange_tblastableofvarchar2(4);
/
showerrors;
createorreplacefunctionhexrange(n1varchar2,n2varchar2)
returnhexrange_tblpipelined
is
begin
foriinto_number(n1,'000X')..to_number(n2,'000X')loop
piperow(to_char(i,'FM000X'));
endloop;
return;
endhexrange;
/
showerrors;
selectcolumn_valueCOMPOSEr,
COMPOSE(UNISTR('a/'||column_value))a,
COMPOSE(UNISTR('c/'||column_value))c,
COMPOSE(UNISTR('e/'||column_value))e,
COMPOSE(UNISTR('i/'||column_value))i,
COMPOSE(UNISTR('n/'||column_value))n,
COMPOSE(UNISTR('o/'||column_value))o,
COMPOSE(UNISTR('r/'||column_value))r,
COMPOSE(UNISTR('s/'||column_value))s,
COMPOSE(UNISTR('u/'||column_value))u,
COMPOSE(UNISTR('y/'||column_value))y
fromtable(hexrange('0300','0327'))x;
下面轻松一下,这里有一小段PL/SQL脚本,这段脚本使用COMPOSE和UNISTR创建一种特殊效果,很多SMS用户、和垃圾邮件发送者都使用这种效果使可读英文文本难于扫描,因为它使用字符重音版本的一个随机序列。我使用DBMS_RANDOM随机选取一个可由不同字符使用的组合字符,然后让SQL进行组合并进行反向转换以生成ANSI/Latin-1输出。这段脚本在代码中使用了EMP表的ENAME字段。1<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 160x600, 创建于 08-4-23MSDN */google_ad_slot = "4367022601";google_ad_width = 160;google_ad_height = 600;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
很多语言,包括英语在内,都使用沉音字符(accentedcharacter)。因为这些字符不属于ASCII字符集,所以如果不查看Unicode值也不使用Unicode编辑器并将其转成一个已知字符集,就很难编写使用这些字符的代码。
9i引入了COMPOSE函数,该函数接受一串Unicode字符并规则化其文本。这就意味着它可以接受一个字母和一个组合标记,比如说‘a'(Unicode字符0097)和沉音符(Unicode字符0300),然后创建一个单独的由两个标记组合而成的字符。COMPOSE使用特殊的组合标记,而没有使用ASCII中相应的音节标记,它所使用的特殊的组合标记是Unicode标准的一部分。上面的例子的结果应该是Unicode字符00E0(有一个沉音符的小写拉丁字母‘a')。
在ANSI中最常见的组合字符有:
·U+0300:沉音符(graveaccent)(`)
·U+0301:重音符(acuteaccent)(')
·U+0302:抑扬音符号(circumflexaccent)(^)
·U+0303:颚化符号(tilde)(~)
·U+0308:元音变音
如果没有特殊的或者键盘驱动程序的话,很难在键盘上输入Unicode字符0097和0300。因此,以纯ASCII文本输入Unicode序列的一个方法是使用UNISTR函数。这个函数接受一个ASCII字符串然后以国家字符集(通常作为16位Unicode或者UTF-8字符集安装)创建一个Unicode字符的序列。它使用十六进制占位符序列映射任何非ASCII字符,映射方式与类似。
要输入a后接一个沉音符组合字符的序列,可以使用UNISTR(‘a/0300'),而不要试图直接在代码中输入字符。这个函数在任何字符集以及任何具有基于Unicode的国家字符集的下都可以正常运行。可以将多个组合字符放在函数中——可以在UNISTR函数中混合使用ASCII和Unicode占位符。例如,可以像下面这样使用UNISTR函数:
selectCOMPOSE(UNISTR('Unlessyouarenai/0308ve,meetmeatthecafe/0301with
yourre/0301sume/0301.'))fromdual;
在将UNISTR函数的输出与COMPOSE组合时,可以在不查找任何值的情况下生成一个Unicode字符。例如:
select'itistrue'ifCOMPOSE(UNISTR('a/0300'))=UNISTR('/00e0');
COMPOSE函数返回一个NVARCHAR2字符串,返回的NVARCHAR2字符串通常是基于Unicode的。如果是在本地使用这些字符,在结果中具有一个隐式地TO_CHAR时,数据库将尝试将Unicode字符映射到本地字符集。不是所有的字符都可以被映射,有一些字符组合在COMPOSE中不能工作,因为Unicode协会没有在Oracle所用的级别定义它们。
要快速地检查字符如何在一个特定的环境下查询,可以运行一个与下面的脚本类似的脚本,以查看在输出组合字符如何被映射。你可能需要确定一下NLS_LANG设置以确保这些字符正确地返回:
createorreplacetypehexrange_tblastableofvarchar2(4);
/
showerrors;
createorreplacefunctionhexrange(n1varchar2,n2varchar2)
returnhexrange_tblpipelined
is
begin
foriinto_number(n1,'000X')..to_number(n2,'000X')loop
piperow(to_char(i,'FM000X'));
endloop;
return;
endhexrange;
/
showerrors;
selectcolumn_valueCOMPOSEr,
COMPOSE(UNISTR('a/'||column_value))a,
COMPOSE(UNISTR('c/'||column_value))c,
COMPOSE(UNISTR('e/'||column_value))e,
COMPOSE(UNISTR('i/'||column_value))i,
COMPOSE(UNISTR('n/'||column_value))n,
COMPOSE(UNISTR('o/'||column_value))o,
COMPOSE(UNISTR('r/'||column_value))r,
COMPOSE(UNISTR('s/'||column_value))s,
COMPOSE(UNISTR('u/'||column_value))u,
COMPOSE(UNISTR('y/'||column_value))y
fromtable(hexrange('0300','0327'))x;
下面轻松一下,这里有一小段PL/SQL脚本,这段脚本使用COMPOSE和UNISTR创建一种特殊效果,很多SMS用户、和垃圾邮件发送者都使用这种效果使可读英文文本难于扫描,因为它使用字符重音版本的一个随机序列。我使用DBMS_RANDOM随机选取一个可由不同字符使用的组合字符,然后让SQL进行组合并进行反向转换以生成ANSI/Latin-1输出。这段脚本在代码中使用了EMP表的ENAME字段。1<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 160x600, 创建于 08-4-23MSDN */google_ad_slot = "4367022601";google_ad_width = 160;google_ad_height = 600;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
- 使用COMPOSE和UNISTR 创建沉音字符
- 使用COMPOSE和UNISTR创建沉音字符
- docker-compose安装和使用
- 使用Docker Compose创建监控环境
- Java 8:使用compose和andThen组合函数
- docker-compose的使用
- Docker compose的使用
- 字符设备的创建和上层应用如何使用
- Python下字符串的创建和转义字符的使用
- Docker-compose使用全解
- Docker-compose使用全解
- 使用docker compose部署服务
- Docker-compose使用全解
- Docker & Docker-Compose安装、使用
- Docker-Compose简介安装使用
- Docker和Docker-compose安装
- Compose使用实例:Quickstart: Docker Compose and Django
- 学习使用Docker、Docker-Compose和Rancher搭建部署Pipeline(一)
- 编程语言层次
- Split命令分割分区的方法
- Accessibility and Ergonomic Guidelines for Windows Mobile(from MSDN)
- 中国网民强力声援海外华人状告CNN和卡弗蒂
- sql中sequence的用法
- 使用COMPOSE和UNISTR创建沉音字符
- 设计模式中结构型模式(四)装饰模式(Decorator)
- sql,EAN-13位条码,存储过程
- SQL的一些攻击
- 了解一下NULLs怎样影响IN和EXISTS
- 最小化表锁以优化数据库性能Minimizing Table Locks to Optimize Performance
- 对于跨不同服务器的sql脚本执行语言的摘要
- Hibernate对集合的加载
- Windows Update Agent 5.8.02469下载