国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

600 字搞懂字節(jié)、字符、編碼、解碼

2023-07-22 12:09 作者:Mr藍(lán)琿  | 我要投稿

字符(Character)就是我們看得到、讀得懂的東西,比如 e?是個(gè)英文字符,?是個(gè)中文字符。


字節(jié)(Byte)就是 8 比特二進(jìn)制,比如 01100101。 01100101 是二進(jìn)制表示形式,用十六進(jìn)制表示就是 65。 這種表示方法難讀懂多了,卻是計(jì)算機(jī)用來表示數(shù)據(jù)的基本方法。


編碼(Encode),涉及到編碼方法。 將 'e' 用 ASCII 編碼編碼成十六進(jìn)制, 得到 65, 用一個(gè)字節(jié)表示。將 '一' 用 uft8 編碼編碼成十六進(jìn)制,得到 e4 b8 80, 用三個(gè)字節(jié)表示。 編碼是將字符轉(zhuǎn)化為字節(jié)的過程。解碼(Decode)是將字節(jié)轉(zhuǎn)化為字符的過程,其將用十六進(jìn)制表示的數(shù)據(jù)解開成我們讀得懂的字符。


下面以字符 e、é、 為例,理解字符,字節(jié),編碼,解碼之間的區(qū)別與聯(lián)系。


以下 Python 代碼將字節(jié) 65 e9 解碼為 。 解碼方法是 latin-1。 \x 是個(gè)轉(zhuǎn)義符,代表后面的數(shù)字是十六進(jìn)制。將字節(jié) 65 解碼,得到字符 e, 將字節(jié) e9 解碼, 得到字符 é。

用 latin-1 編碼 eé,得到兩個(gè)字節(jié),65 e9?


以下 Python 代碼將三個(gè)字節(jié) 65 c3 a9 解碼為 。 與上例不同,這里的解碼方法是 utf8。 同樣是 é, latin-1 將其編碼成 e9, 占一個(gè)字節(jié),而 utf8 將其編碼成 c3 a9,占兩個(gè)字節(jié)。

用 utf8 編碼 eé, 得到三個(gè)字節(jié),65 c3 a9?


以下 Python 代碼將中文字符 以 utf8 編碼表示,表示為 e4 b8 80,用了三個(gè)字節(jié)。 可見,使用 utf8 編碼,每個(gè)字符可以是不等長的,編碼 é 用兩個(gè)字節(jié), 而編碼 用三個(gè)字節(jié)。 問題:使用?utf8?編碼,編碼 e 會(huì)用幾個(gè)字節(jié)?


用 utf9 編碼中文字符?一, 得到三個(gè)字節(jié),e4 b8 80




600 字搞懂字節(jié)、字符、編碼、解碼的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
琼结县| 潢川县| 尚志市| 河北区| 博乐市| 女性| 察隅县| 阳高县| 新干县| 巫溪县| 伊宁市| 云南省| 河曲县| 凤凰县| 德令哈市| 巴东县| 永昌县| 屏边| 木兰县| 吴江市| 绩溪县| 烟台市| 安阳县| 滨州市| 淮阳县| 德安县| 黑河市| 普陀区| 湛江市| 绩溪县| 高台县| 巫溪县| 承德县| 本溪| 施秉县| 新乡县| 睢宁县| 丹东市| 左贡县| 汤阴县| 剑阁县|