go 数值类型之间的转化


分类: Golang
评论: 1

go 数值类型之间的转化



分类: Golang
评论: 1

数值类型之间的转化

整型之间的转化

关于数值类型之间的转化,在进行类型转化时只需要调用要转化的数据类型对应的函数即可:

v1 := uint(16)   // 初始化 v1 类型为 unit
v2 := int8(v1)   // 将 v1 转化为 int8 类型并赋值给 v2
v3 := uint16(v2) // 将 v2 转化为 uint16 类型并赋值给 v3

看起来很简单,不过需要注意,在有符号与无符号以及高位数字向低位数字转化时,需要注意数字的溢出和截断。

比如我们看这个例子:

v1 := uint(-255)

由于 uint 是无符号整型,无符号数字不包含负数,所以上述转化编译时会报溢出错误:

constant -255 overflows uint

我们将上述代码改造如下,将无符号数字转化为有符号数字:

v1 := uint(255)
v2 := int8(v1)  // v2 = -1

由于 int8 能够表示的范围是 -128~127,255 超出其表示范围,所以,会截取后8位,v1 是一个无符号整型,后八位都是 1,int8 是一个有符号的整型,所以最高位作为符号位,因此转化后的数字 v2 是负数,取 1111 1111 的补码,所以转化结果是 -1。

有人可能困惑为啥是 -1,而不是 -127,这就要了解计算机底层是如何表示数字的了。

原码、反码和补码

计算机底层是通过二进制表示数字的,我们把这种二进制形式的数字称之为机器数,数字是有正负之分的,这个正负是通过机器数的第一位作为标识的(俗称符号位):0 表示正数,1 表示负数。为区别有符号数真实值与形式值的不同,又将带符号位的机器数对应的真正数值称为机器数的真值(无符号数的真值就是自身)。

除了基本的二进制数字外,计算机还提供了三种数字编码方式:原码、反码和补码。

原码就是符号位+真值,比如:

[+1]原 = 0000 0001
[-1]原 = 1000 0001

以 8 位二进制数表示范围为例,使用原码的话对应的区间范围是 [11111111, 01111111],即 [-127, 127]

我们接着来看反码,正数的反码是自身,负数的反码是在其原码基础上,符号位不变,其余各位按位取反。比如:

[+1]反 = 0000 0001
[-1]反 = 1111 1110

以 8 位二进制数表示范围为例,使用反码的话对应的区间范围是 [11111111, 01111111],还是 [-127, 127]

上面两种编码都存在一个问题,那就是数字 0 存在 +0-0 两种编码:

[+0]原 = 0000 0000
[-0]原 = 1000 0000
[+0]反 = 0000 0000
[-0]反 = 1111 1111

这就导致数字 0 在计算机中的编码不唯一,对于凡事要求确定性的计算机来说,这是绝对不行的,为了解决这个问题,计算机科学家们又提出补码的概念。

正数的补码和反码一样,都是其自身,而负数的补码是在其原码基础上,符号位不变,其余各位按位取反,最后+1(即反码+1)。比如:

[+1]补 = 0000 0001
[-1]补 = 1111 1111

就是这个简单的 +1,却非常巧妙地解决了数字 0 双重编码的问题,现在,+0 的补码是 0000 0000,但是 -0 的补码变成了 1000 0001,所以只有一个表示 0 的编码了。

不仅如此,所有的负数都整体做了 +1 操作,之前的 1111 1111 由于进位溢出,变成了 1000 0000,我们将这个数字用于表示 -128,所以对于 8 位机器数,通过补码表示的话,现在的情况是:

这也是目前计算机系统底层 8 位整型数字的区间范围,所以计算机底层是通过补码来表示数字的,也只能通过补码来表示。

了解到这里,我们再来看为什么 uint 类型的 255 转化为 int8 类型的值后是 -1。

255 是无符号正数,补码和原码都是 255,即 16 个 1 组成的机器数,转化为 int8 类型后,由于 int8 只能存放 8 位机器数,所以会截取 255 后 8 位数字,也就是 1111 1111int8 是有符号数字,第一位是符号位,所以真值是后 7 位,计算机底层通过补码表示数字,需要将其转化为补码,而这个数字又是负数,所以需要将后 7 位按位取反再 +1,也就是 1000 0001,即 -1

整型与浮点型之间的转化

然后,我们再来看下整型和浮点型之间的转化,浮点型转化为整型时,小数位被丢弃:

v1 := 99.99

v2 := int(v1)  // v2 = 99

将整型转化为浮点型时,比较简单,直接调用对应的函数即可:

v1 := 99

v2 := float64(v2) // v2 = 99

数值和布尔类型之间的转化

目前 Go 语言不支持将数值类型转化为布尔型,你需要自己根据需求去实现类似的转化。

字符串和其他基本类型之间的转化

将整型转化为字符串

整型数据可以通过 Unicode 字符集转化为对应的 UTF-8 编码的字符串:

v1 := 65
v2 := string(v1)  // v2 = A
v3 := 30028
v4 := string(v3)  // v4 = 界

Unicode 兼容 ASCII 字符集,所以 65 被转化为 A。

此外,还可以将 byte 数组或者 rune 数组转化为字符串,因为字符串底层就是通过这两个基本字符类型构建的:

v1 := []byte{'h', 'e', 'l', 'l', 'o'}
v2 := string(v1)  // v2 = hello
b := []rune{'你', '好', ',', '中', '国'}
fmt.Println(string(b))

当然了,byteuint8 的别名,runeuint32 的别名,所以也可以看做是整型数组和字符串之间的转化。

strconv 包

Go 语言默认不支持将字符串类型强制转化为数值类型,即使字符串中包含数字也不行。

如果要实现更强大的基本数据类型与字符串之间的转化,可以使用 Go 官方 strconv 包提供的函数:

func TestA1(t *testing.T) {
	v1 := "100"
	i, err := strconv.Atoi(v1)
	fmt.Println(i, err)
	v2 := 100
	fmt.Printf("%T %s\n", strconv.Itoa(v2), strconv.Itoa(v2))

	v3 := "true"
	b1, err := strconv.ParseBool(v3)
	b2 := strconv.FormatBool(b1)
	fmt.Printf("%T %t\n", b1, b1)
	fmt.Printf("%T %s\n", b2, b2)

	v4 := "100"
	v41, _ := strconv.ParseInt(v4, 10, 64)
	v42 := strconv.FormatInt(v41, 10)
	fmt.Printf("%T %d\n", v41, v41)
	fmt.Printf("%T %s\n", v42, v42)

	v43, _ := strconv.ParseFloat(v4, 64)
	v44 := strconv.FormatFloat(v43, 'E', -1, 64)
	fmt.Printf("%T %f\n", v43, v43)
	fmt.Printf("%T %s\n", v44, v44)
	fmt.Println('E')

	s1 := strconv.Quote("你好,中国")
	s2 := strconv.QuoteToASCII(s1)
	fmt.Printf("%T %s\n", s1, s1)
	fmt.Printf("%T %s\n", s2, s2)
}