javascript字符串

来源:互联网 发布:kcf跟踪算法原理 编辑:程序博客网 时间:2024/05/24 15:40

多行

字符串默认只能写在一行内,分成多行将会报错。

可以使用连接运算符(+)连接多个单行字符串,用来模拟多行字符串。

var str= 'Hello' +    'world' +    'I\'m' +    'coming'; // "Hello world I'm coming"

也可以在每一行的尾部使用反斜杠

var str= "Hello \world \I'm \coming"; // "Hello world I'm coming"

不过这种方式有两点需要注意
(1) 它是ECMAScript 5新添加的,老式浏览器(如IE 8)不支持
(2) 反斜杠的后面必须是换行符,而不能有其他字符(比如空格),否则会报错。


转义

如果非特殊字符前面使用反斜杠,则反斜杠会被省略。

'\a'; // "a"

字符串与数组

字符串可以被视为字符数组,可以使用数组的方括号运算符,用来返回某个位置的字符,但无法改变字符串之中的单个字符。

length属性返回字符串的长度,该属性也是无法改变的。

字符串与数组的关系仅此而已。


字符集

JavaScript使用Unicode字符集,使用16位(即2个字节)的UTF-16格式储存。也就是说,JavaScript的单位字符长度固定为2个字节。

对于U+0000到U+FFFF之间的字符,一个16位就够了(即2个字节);对于U+10000到U+10FFFF之间的字符,就需要2个16位(即4个字节),而且前两个字节在0xD800到0xDBFF之间,后两个字节在0xDC00到0xDFFF之间。浏览器会正确将这四个字节识别为一个字符,但是JavaScript内部的字符长度总是固定为16位,会把这四个字节视为两个字符。

var s1 = '©';var s2 = '��';console.log(s1.length); // 1console.log(s2.length); // 2console.log(s2.charAt(0) + s2.charAt(1)); // ��

处理字符串时要考虑字符编码的问题

// 把字符串变成数组function getSymbols(string) {    var length = string.length;    var index = -1;    var output = [];    var character;    var charCode;    while (++index < length) {        character = string.charAt(index);        charCode = character.charCodeAt(0);        if (charCode >= 0xD800 && charCode <= 0xDBFF) {            output.push(character + string.charAt(++index));        } else {            output.push(character);        }    }    return output;}

方法

String

用来生成字符串的包装对象

如果不用new,还可以当作工具方法使用,将任意类型的值转为字符串

String(true) // "true"String(5) // "5"

fromCharCode

String对象直接提供的方法,根据Unicode编码,生成一个字符串。

String.fromCharCode(104, 101, 108, 108, 111); // "hello"String.fromCharCode(0x20BB7); // "ஷ"String.fromCharCode(0xD842, 0xDFB7); // "��"

charAt

返回一个字符串的给定位置的字符,位置从0开始编号。

charCodeAt

返回给定位置字符的Unicode编码(十进制表示)。

concat

用于连接两个字符串,原字符串不受影响,返回一个新字符串。

可以接受多个字符串。

"a".concat("b","c"); // "abc"

substring、substr、slice

这三个方法都用来返回一个字符串的子串,而不会改变原字符串。

它们都可以接受一个或两个参数
第一个参数都是子字符串的开始位置

如果省略第二个参数,则表示子字符串一直持续到原字符串结束

第二个参数对于slice和substring方法,表示子字符串的结束位置;对于substr,表示子字符串的长度。
如果第一个参数大于第二个参数,slice方法并不会自动调换参数位置,而是返回一个空字符串。

如果参数为负,对于slice方法,表示字符位置从尾部开始计算。对于substring方法,会自动将负数转为0。对于substr方法,负数出现在第一个参数,表示从尾部开始计算的字符位置;负数出现在第二个参数,将被转为0。

indexOf、lastIndexOf

一个字符串在另一个字符串中的位置,如果返回-1,就表示不匹配。

还可以接受第二个参数,对于indexOf,表示从该位置开始向后匹配;对于lastIndexOf,表示从该位置起向前匹配。
不可为负数。

trim

去除字符串两端的空格

"  hello world  ".trim(); // "hello world"

toLowerCase、toUpperCase

localeCompare

比较两个字符串。它返回一个数字,如果小于0,表示第一个字符串小于第二个字符串;如果等于0,表示两者相等;如果大于0,表示第一个字符串大于第二个字符串。

'apple'.localeCompare('banana'); // -1'apple'.localeCompare('apple'); // 0

下面是与搜索和替换相关的有4个方法,它们都允许使用正则表达式

match

match方法返回一个数组,成员为匹配的第一个字符串。如果没有找到匹配,则返回null。返回数组还有index属性和input属性,分别表示匹配字符串开始的位置(从0开始)和原始字符串。

var matches = "cat, bat, sat, fat".match("at");console.log(matches) // ["at"]matches.index // 1matches.input // "cat, bat, sat, fat"

search方法的用法等同于match,但是返回值为匹配的第一个位置。如果没有找到匹配,则返回-1。

"cat, bat, sat, fat".search("at"); // 1

replace

用于替换匹配的子字符串,一般情况下只替换第一个匹配(除非使用带有g修饰符的正则表达式)。

"aaa".replace("a", "b"); // "baa"

split

按照给定规则分割字符串,返回一个由分割出来的各部分组成的新数组。

"a|b|c".split("|"); // ["a", "b", "c"]

如果分割规则为空字符串,则返回数组的成员是原字符串的每一个字符。

"a|b|c".split(""); // ["a", "|", "b", "|", "c"]

如果省略分割规则,则返回数组的唯一成员就是原字符串。

"a|b|c".split(); // ["a|b|c"]

如果满足分割规则的两个部分紧邻着(即中间没有其他字符),则返回数组之中会有一个空字符串。

"a||c".split("|"); // ["a", "", "c"]

如果满足分割规则的部分处于字符串的开头或结尾(即它的前面或后面没有其他字符),则返回数组的第一个或最后一个成员是一个空字符串。

"|b|c".split("|"); // ["", "b", "c"]"a|b|".split("|"); // ["a", "b", ""]

split方法还可以接受第二个参数,限定返回数组的最大成员数。

"a|b|c".split("|", 0) // []"a|b|c".split("|", 1) // ["a"]"a|b|c".split("|", 2) // ["a", "b"]"a|b|c".split("|", 3) // ["a", "b", "c"]"a|b|c".split("|", 4) // ["a", "b", "c"]

1 0
原创粉丝点击