国产精品久久久亚洲一区,亚洲欧美日韩国产一区二区,男女男99热,日韩伦乱无码

iso認(rèn)證咨詢公司,全國認(rèn)證咨詢服務(wù)!
iso認(rèn)證咨詢公司客服

GB 和 GBK 的區(qū)別

豆豆兒軟糖

豆豆兒軟糖

簡單的說就是GB可以輸出簡體中文,GBK則可以輸出簡/繁體中文!


一、GB字庫:

全稱GB2312或GB2312-80是一個(gè)簡體中文字符集的中國國家標(biāo)準(zhǔn),全稱為《信息交換用漢字編碼字符集--基本集》,由中國國家標(biāo)準(zhǔn)總局 發(fā)布,1981年5月1日實(shí)施。GB2312編碼通行于大陸;新加坡等地也采用此編碼。幾乎所有的中文系統(tǒng)和國際化的軟件都支持GB2312。

GB2312標(biāo)準(zhǔn)共收錄6763個(gè)漢字, GB2312中對所收漢字進(jìn)行了“分區(qū)”處理,每區(qū)含有94個(gè)漢字/符號。這種表示方式也稱為區(qū)位碼。

01-09區(qū)為特殊符號。16-55區(qū)為一級漢字共有漢字3755個(gè),按拼音排序;56-87區(qū)為二級漢字共有漢字3008個(gè),按部首/筆畫排序;10-15區(qū)及88-94區(qū)則未有編碼。


二、GBK字庫:

GBK全名為漢字內(nèi)碼擴(kuò)展規(guī)范,英文名Chinese Internal Code Specification。K 即是“擴(kuò)展”所對應(yīng)的漢語拼音(KuoZhan)中“擴(kuò)”字的聲母。 1993年,Unicode
1.1版本推出,收錄了中國大陸、臺灣、日本及韓國通用字符集的漢字,總共有20,912個(gè)。中國大陸訂定了等同于Unicode
1.1版本的“GB13000.1-93”“信息技術(shù) 通用多八位編碼字符集(UCS) 第一部分:體系結(jié)構(gòu)與基本多文種平面”。

由于GB2312-80只收錄了6763個(gè)漢字,有不少漢字,如部分于GB2312-80推出后才簡化的漢字(如“啰”),部分人名用字(如中國前總理朱镕基的“镕”字),臺灣及香港使用的繁體字,日語及朝鮮語漢字等,并未有收錄在內(nèi)。 中國大陸于是利用了GB2312-80未有使用的編碼空間,收錄了所有出現(xiàn)于Unicode
1.1及GB13000.1-93之中的漢字,制定了GBK編碼。微軟在它出品的Windows 98中,即采用了GBK編碼。在微軟的系統(tǒng)內(nèi)稱為CP936字碼表。

格子少年

格子少年

關(guān)于GB與BIG5碼的判別,沒有100%可靠的方法。但是從兩個(gè)編碼系統(tǒng)漢字的分布來看,

還有可以作一定的判斷的。

GB碼的編碼范圍是首字節(jié)A1-F7,尾字節(jié)A1-FE,而且首字節(jié)A1-A9是符號區(qū),AA-AF這

一段沒有定義。BIG5碼的編碼范圍是首字節(jié)A1-F9,尾字節(jié)分兩段,分別是40-7E及

A1-FE,首字節(jié)A1-A3是符號區(qū),A4-C5是常用漢字區(qū)。

這樣我們可以找到幾個(gè)依據(jù):

1)尾字節(jié)40-7E是BIG5碼特有的,可以以此來判別,但是現(xiàn)在GBK在這個(gè)碼區(qū)也定義了

字符,不過這些漢字的使用頻度不高,所以仍然可以作為一條依據(jù),但無法保證100%

正確;

2)首字節(jié)A4-A9在GB中為日文假名、希臘字母、俄文字母和制表符,正常文本中很少

出現(xiàn),AA-AF則根本沒有定義,但這個(gè)范圍卻是BIG5碼的常用漢字,所以如果文本中

頻繁出現(xiàn)這個(gè)范圍的碼,也可以認(rèn)為是BIG5碼。尤其是首字節(jié)位于AA-AF之間,尾字

節(jié)位于A1-FE的,幾乎100%是BIG5碼無疑,因?yàn)榧词乖贕BK中,這個(gè)范圍也是沒有定

義的。

為了提高識別的正確率,最好多種判據(jù)同時(shí)使用。另外還可以通過分析漢字出現(xiàn)的頻

率,或查找某些常用的詞組來判別。因?yàn)樽銎饋肀容^復(fù)雜,就不多說了。

首字節(jié)C6-D7,尾字節(jié)A1-FE在GB中屬于一級字庫,是常用漢字,而在BIG5中,C6-C7沒

有明確定義,但通常用來放日文假名和序號,C8-D7屬于罕用漢字區(qū)。所以如果這個(gè)范

圍的碼出現(xiàn)較多,可以判別為GB碼。

曦汝

曦汝

問題不是很清楚呀,麻煩說清楚點(diǎn)。

doreen

doreen

GBK 是又一個(gè)漢字編碼標(biāo)準(zhǔn),全稱《漢字內(nèi)碼擴(kuò)展規(guī)范》(GBK),英文名稱 Chinese Internal Code Specification ,中華人民共和國全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會 1995 年 12 月 1 日制訂,國家技術(shù)監(jiān)督局標(biāo)準(zhǔn)化司、電子工業(yè)部科技與質(zhì)量監(jiān)督司 1995 年 12 月 15 日聯(lián)合以技監(jiān)標(biāo)函 [1995] 229 號文件的形式,將它確定為技術(shù)規(guī)范指導(dǎo)性文件,發(fā)布和實(shí)施。這一版的 GBK 規(guī)范為
1.0 版。GB 即“國標(biāo)”,K 是“擴(kuò)展”的漢語拼音第一個(gè)字母。

GBK 向下與 GB 2312 編碼兼容,向上支持 ISO 1064
6.1 國際標(biāo)準(zhǔn),是前者向后者過渡過程中的一個(gè)承上啟下的標(biāo)準(zhǔn)。

ISO 10646 是國際標(biāo)準(zhǔn)化組織 ISO 公布的一個(gè)編碼標(biāo)準(zhǔn),即 Universal Multilpe-Octet Coded Character Set(簡稱 UCS),大陸譯為《通用多八位編碼字符集》,臺灣譯為《廣用多八位元編碼字元集》,它與 Unicode 組織的 Unicode 編碼完全兼容。ISO 1064
6.1 是該標(biāo)準(zhǔn)的第一部分《體系結(jié)構(gòu)與基本多文種平面》。我國 1993 年以 GB 13000.1 國家標(biāo)準(zhǔn)的形式予以認(rèn)可(即 GB 13000.1 等同于 ISO 1064
6.1)。

ISO 10646 是一個(gè)包括世界上各種語言的書面形式以及附加符號的編碼體系。其中的漢字部分稱為“CJK 統(tǒng)一漢字”(C 指中國,J 指日本,K 指朝鮮)。而其中的中國部分,包括了源自中國大陸的 GB 231
2、GB 1234
5、《現(xiàn)代漢語通用字表》等法定標(biāo)準(zhǔn)的漢字和符號,以及源自臺灣的 CNS 11643 標(biāo)準(zhǔn)中第
1、2 字面(基本等同于 BIG-5 編碼)、第 14 字面的漢字和符號。


一、字匯

GBK 規(guī)范收錄了 ISO 1064
6.1 中的全部 CJK 漢字和符號,并有所補(bǔ)充。具體包括:


1. GB 2312 中的全部漢字、非漢字符號。


2. GB 13000.1 中的其他 CJK 漢字。以上合計(jì) 20902 個(gè) GB 化漢字。


3. 《簡化字總表》中未收入 GB 13000.1 的 52 個(gè)漢字。


4. 《康熙字典》及《辭海》中未收入 GB 13000.1 的 28 個(gè)部首及重要構(gòu)件。


5. 13 個(gè)漢字結(jié)構(gòu)符。


6. BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 個(gè)圖形符號。


7. GB 12345 增補(bǔ)的 6 個(gè)拼音符號。


8. 漢字“○”。


9. GB 12345 增補(bǔ)的 19 個(gè)豎排標(biāo)點(diǎn)符號(GB 12345 較 GB 2312 增補(bǔ)豎排標(biāo)點(diǎn)符號 29 個(gè),其中 10 個(gè)未被 GB 13000.1 收入,故 GBK 亦不收)。


10. 從 GB 13000.1 的 CJK 兼容區(qū)挑選出的 21 個(gè)漢字。

1
1. GB 13000.1 收入的 31 個(gè) IBM OS/2 專用符號。


二、碼位分配及順序

GBK 亦采用雙字節(jié)表示,總體編碼范圍為 8140-FEFE,首字節(jié)在 81-FE 之間,尾字節(jié)在 40-FE 之間,剔除 xx7F 一條線??傆?jì) 23940 個(gè)碼位,共收入 21886 個(gè)漢字和圖形符號,其中漢字(包括部首和構(gòu)件)21003 個(gè),圖形符號 883 個(gè)。

全部編碼分為三大部分:


1. 漢字區(qū)。包括:

a. GB 2312 漢字區(qū)。即 GBK/2: B0A1-F7FE。收錄 GB 2312 漢字 6763 個(gè),按原順序排列。

b. GB 13000.1 擴(kuò)充漢字區(qū)。包括:

(1) GBK/3: 8140-A0FE。收錄 GB 13000.1 中的 CJK 漢字 6080 個(gè)。

(2) GBK/4: AA40-FEA0。收錄 CJK 漢字和增補(bǔ)的漢字 8160 個(gè)。CJK 漢字在前,按 UCS 代碼大小排列;增補(bǔ)的漢字(包括部首和構(gòu)件)在后,按《康熙字典》的頁碼/字位排列。


2. 圖形符號區(qū)。包括:

a. GB 2312 非漢字符號區(qū)。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符號外,還有 10 個(gè)小寫羅馬數(shù)字和 GB 12345 增補(bǔ)的符號。計(jì)符號 717 個(gè)。

b. GB 13000.1 擴(kuò)充非漢字區(qū)。即 GBK/5: A840-A9A0。BIG-5 非漢字符號、結(jié)構(gòu)符和“○”排列在此區(qū)。計(jì)符號 166 個(gè)。


3. 用戶自定義區(qū):分為(1)(2)(3)三個(gè)小區(qū)。

(1) AAA1-AFFE,碼位 564 個(gè)。

(2) F8A1-FEFE,碼位 658 個(gè)。

(3) A140-A7A0,碼位 672 個(gè)。

第(3)區(qū)盡管對用戶開放,但限制使用,因?yàn)椴慌懦磥碓诖藚^(qū)域增補(bǔ)新字符的可能性。


三、字形

GBK 對字形作了如下的規(guī)定:


1. 原則上與 GB 13000.1 G列(即源自中國大陸法定標(biāo)準(zhǔn)的漢字)下的字形/筆形保持一致。


2. 在 CJK 漢字認(rèn)同規(guī)則的總框架內(nèi),對所有的 GBK 編碼漢字實(shí)施“無重碼正形”(“GB 化”);即在不造成重碼的前提下,盡量采用中國新字形。


3. 對于超出 CJK 漢字認(rèn)同規(guī)則的、或認(rèn)同規(guī)則尚未明確規(guī)定的漢字,在 GBK 碼位上暫安放舊字形。這樣,在許多情況下 GBK 收入了同一漢字的新舊兩種字形。


4. 非漢字符號的字形,凡 GB 2312 已經(jīng)包括的,與 GB 2312 保持一致;超出 GB 2312 的部分,與 GB 13000.1 保持一致。


5. 帶聲調(diào)的拼音字母取半角形式。

熱門產(chǎn)品
最新知識

中國環(huán)保產(chǎn)品認(rèn)證目錄,環(huán)保產(chǎn)品認(rèn)證目錄

小編為您整理中國環(huán)保產(chǎn)品認(rèn)證范圍、中國環(huán)保產(chǎn)品認(rèn)證的認(rèn)證標(biāo)志、中國環(huán)保產(chǎn)品認(rèn)證的介紹、什么是中國環(huán)保產(chǎn)品認(rèn)證、中國環(huán)保產(chǎn)品認(rèn)證的特點(diǎn)相關(guān)iso認(rèn)證公司知識,詳情可查看下方正文!

企業(yè)外部信用評級?企業(yè)外部信用評級aa

小編為您整理新疆外部信用評級aa+企業(yè)都有哪些、云南企業(yè)外部信用評級aaa級企業(yè)有哪家、哪些企業(yè)需要信用評級、企業(yè)主體信用評級條件、企業(yè)為什么要做信用評級相關(guān)iso認(rèn)證公司知識,詳情可查看下方正文!

宿遷體系認(rèn)證公司,宿遷體系認(rèn)證咨詢公司

小編為您整理宿遷哪家公司做認(rèn)證體系、宿遷連云港為何全面排查大頭娃娃涉事iso三體系認(rèn)證、宿遷fsc森林認(rèn)證在哪里、宿遷哪里可以提供辦理ISO9001認(rèn)證、在宿遷辦理質(zhì)量管理體系認(rèn)證證書在哪辦理相關(guān)iso認(rèn)證公司知識,詳情可查看下方正文!

iso20000管理體系認(rèn)證報(bào)價(jià),iso20000報(bào)價(jià)

小編為您整理ISO20000業(yè)務(wù)人員應(yīng)該如何報(bào)價(jià)人數(shù)120人、ISO20000,ISO20000標(biāo)準(zhǔn),IT服務(wù)管理體系認(rèn)證,什么是ISO20000標(biāo)準(zhǔn)、iso9000質(zhì)量管理體系審核報(bào)價(jià)國家有沒有標(biāo)準(zhǔn)、管理體系認(rèn)證iso20000什么意思、管理體系認(rèn)證iso20000什么意思相關(guān)iso認(rèn)證公司知識,詳情可查看下方正文!

提供iso14000體系認(rèn)證,椒江提供iso14000認(rèn)證體系

小編為您整理請?zhí)峁┮恍㊣SO14000認(rèn)證的資料、ISO14000審核需要提供哪些資料、ISO14000審核需要提供哪些資料、哪里有提供ISO14000的服務(wù)呢、為什么要做ISO14000體系認(rèn)證相關(guān)iso認(rèn)證公司知識,詳情可查看下方正文!

最新問答
熱門專題