gbk:徹底搞懂困擾程式設計師多年的GBK 和 UTF8-字體教程免费ppt模版下载-道格办公

其實當你了解了這兩種編碼方式後，就會知道GBK是中國標準，UTF8是網路傳輸標準，Unicode是全球標準。

我們先介紹下GBK:（GBK的發展史）

那我們不得不提的是區位碼：

其中前兩位為“區”，後兩位為“位”，中文漢字的編號區號是從16開始的，位元號從1開始。前面的區號有一些符號、數字、字母、注音符號（台）、製表符、日文等等。簡單來說就是0~1599表示的是除漢字之外的字號。 1600~9999其中部分代表漢字編號，當然當時的漢字數量應該沒有佔用完所有的編號。

接下來發展到GB2312：

是基於區位碼的，用雙字節編碼表示中文和中文符號。一般編碼方式是：0xA0+區號，0xA0+位號。如下表中的 “安”，區位號是1618（十進位），那麼“安”字的GB2312編碼就是 0xA0+16 0xA0+18 也就是 0xB0 0xB2 。根據區位碼表，GB2312的漢字編碼範圍是0xB0A1~0xF7FE

以ASCII編碼，也就是說現代的GBK編碼是相容ASCII編碼的。例如一個數字2，對應的二進位是0x32，而不是 0xA3 0xB2。那麼問題來了，0xA3 0xB2 又對應到什麼呢？還是２。注意看了，這裡的２跟2是不是有點不太一樣？！確實是不一樣的。這裡的雙位元組２是全角的二，ASCII的2是半角的二，一般輸入法裡的切換全角半角就是這裡不同。