python中的字符编码
Python中字符串编码类型
- utf-8
- gb2312
- gbk
在Python中,一般用decode()和encode()来对字符串进行解码和编码。
默认情况下,用unicode作为编码的基础类型。
str ------> unicode ------> str
1 | u = u'中国人' # 定义变量的时候显式指定unicode类型 |
如上面代码,str\str1\str2均为字符串类型(str),给字符串操作带来较大的复杂性。
在新版本的python3中,取消了unicode类型,代替它的是使用unicode字符的字符串类型(str),字符串类型(str)成为了基础类型,而编码后的变为了**字节类型(bytes)**但是两个函数的使用方法不变:
bytes ------> str(unicode)------>bytes
1 | u = '中国人' #指定字符串类型对象u |