1. Golang 字符串

1.1. 基础概念

ASCII 是英文"American Standard Code for Information Interchange"的缩写，中文译为美国信息交换标准代码，它是由美国国家标准学会 (ANSI) 制定的单字节字符编码方案，它使用单个字节 (byte) 的二进制数来编码一个字符。

Unicode 编码规范为世界上现存的所有自然语言中的每一个字符，都设定了一个唯一的二进制编码。它以 ASCII 编码集为出发点，并突破了 ASCII 只能对拉丁字母进行编码的限制。Unicode 编码规范通常使用十六进制表示法来表示 Unicode 代码的整数值，并提供了三种不同的编码格式，即：UTF-8、UTF-16 和 UTF-32。

runerune

1.2. 字符串编码

rune

func main() {
	str := "Go 爱好者"
	fmt.Printf("The string: %q\n", str)
	fmt.Printf("runes(char): %q\n", []rune(str))   //['G' 'o' '爱' '好' '者']
	fmt.Printf("runes(hex): %x\n", []rune(str))    //[47 6f 7231 597d 8005]
	fmt.Printf("bytes(hex): [% x]\n", []byte(str)) //[47 6f e7 88 b1 e5 a5 bd e8 80 85]
}

对于第 3 行输出，前面解释的比较清楚，就不赘述。对于第 4 行输出，就是通过 UTF-8 编码，3 个字节的 16 进制展现。第 5 行输出，把每个字符的 UTF-8 编码值都拆成相应的字节序列。

一句话总结一下：一个 string 类型的值在底层就是一个能够表达若干个 UTF-8 编码值的字节序列。

1.3. 遍历字符串

range 遍历：

func main() {
	str := "Go 爱好者"
	fmt.Printf("range 遍历：\n")
	for i, c := range str {
		fmt.Printf("%d: %q [% x]\n", i, c, []byte(string(c)))
	}
	fmt.Printf("for 遍历：\n")
	for i := 0; i < len(str); i++ {
		fmt.Printf("%d: [%c] [%x]\n", i, str[i], str[i])
	}
}

输出如下：

range 遍历：
0: 'G' [47]
1: 'o' [6f]
2: ' ' [20]
3: '爱' [e7 88 b1]
6: '好' [e5 a5 bd]
9: '者' [e8 80 85]
for 遍历：
0: [G] [47]
1: [o] [6f]
2: [ ] [20]
3: [ç] [e7]
4: [ˆ] [88]
5: [±] [b1]
6: [å] [e5]
7: [¥] [a5]
8: [½] [bd]
9: [è] [e8]
10: [€] [80]
11: [
] [85]

rangerunefor

1.4. 类型转换

[]rune[]bype

func main() {
	str := "hello, world!"
	bs := []byte(str)  // string 转 byte
	str2 := string(bs) // byte 转 string
	rs := []rune(str)  // string 转 rune
	str3 := string(rs) // rune 转 string
}

stringrunebyte

1.5. 总结

stringrunestringfor range