Introduction
InternalcodereferstothebinarycharactercodeusedinthecomputerChinesecharactersystem.Itistheexchangecodebetweenthecommunicationinput,outputandthesystemplatform.TheinternalcodecanachieveuniversalandhighThepurposeofefficienttransmissionoftext.Forexample,whatisstoredandcalledinMSWordisinternalcodeinsteadofgraphictext.EnglishASCIIcharactersarerepresentedbyaone-byteinternalcode.Chinesecharacterssuchasthenationalstandardcharacterset,GB2312,GB12345,andGB13000allusedouble-byteinternalcodes,GB18030(27,533Chinesecharacters)double-byteinternalcodeChinesecharactersare20,902,andtheremaining6,631Chinesecharactersuseafour-byteinternalcode.
Classification
Characterencoding:Thecharacterencodingisthebinarynumbercorrespondingtothecharactersofthecharacterset.ThemostcommonlyusedcharactersetisANSI,andthebinaryencodingcorrespondingtotheANSIcharactersetisCalledANSIcode,DOSandWindowssystemsbothuseANSIcode,butthecharactercodeusedinthesystemmustundergobinaryconversion,whichiscalledsysteminternalcode.
Chinesecharacterinternalcode:ANSIcodeisasinglebyte(8-bitbinarynumber)encodingset,whichcanonlyrepresent256charactersatmost,andcannotrepresentmanyChinesecharacters.TheANSIcodeofvariouscountriesandregionsOnthebasisofthis,avarietyofdifferentChinesecharacterencodingsetsaredesignedtobeabletohandlealargenumberofChinesecharacters.ThesecodesusesinglebytetorepresentANSIEnglishcharacters(thatis,compatiblewithANSIcode),andusedoublebytestorepresentChinesecharacters.SincetherecanonlybeoneChinesecharacterinternalcodeinasystem,thecharactersofotherChinesecharacterinternalcodescannotberecognized,whichcausescommunicationinconvenience.
GBcode:GBcodeisasimplifiedChinesecharactercodingschemeannouncedbythecountryin1980,andiswidelyusedinmainlandChinaandSingapore,alsoknownasthenationalstandardcode.Thenationalstandardcodeencodes6763Chinesecharactersets,coveringmostoftheChinesecharactersinuse.
GBKcode:GBKcodeisanextendedcharacterencodingofGBcode,whichencodesmorethan20,000simplifiedandtraditionalChinesecharacters.SimplifiedversionsofWin95andWin98bothuseGBKassysteminternalcode.
BIG5code:BIG5codeisaChinesecharacterencodingfortraditionalChinesecharacters,whichiscommonlyusedincomputersystemsinTaiwanandHongKong.
HZcode:HZcode je kód čínského znaku široce používaný na internetu.
ISO-2022CJKcode:ISO-2022isacodingstandardestablishedbytheInternationalStandardsOrganization(ISO)forvariouslanguagecharacters.Two-byteencodingisadopted,inwhichtheChineseencodingiscalledISO-2022CN,andtheJapaneseandKoreanencodingsarecalledJPandKRrespectively.Generally,thethreearecollectivelyreferredtoastheCJKcode.TheCJKcodeismainlyusedintheInternetnetwork.
Unicodecode:Unicodecodeisalsoaninternationalstandardcode,whichusestwo-byteencodingandisnotcompatiblewithANSIcode.Itisusedinthenetwork,Windowssystemandmanylarge-scalesoftware.
Internalcodeconversion
Duetohistoricalandregionalreasons,sometimesmultipleencodingschemesappearinonetext,especiallyChinesecharacters.Sincecharactersdifferentfromthesysteminternalcodecannotbedisplayednormallyinthesystem,theinternalcodeconversionofthecharactersmustbecarriedout,thatis,thecharactersthatarenotthesysteminternalcodeareconvertedintotheinternalcodecharactersthatcanberecognizedbythesystem.NJStarissuchanexcellentsoftware.OtherssuchasSitongLifang,MagicWin98,Cross-StraitCommunication,ChineseCharacterCommunication,etc.areallsuchinternalcodeconversiontools.
Vzájemná konverze
Vztah konverze mezi kódem umístění, národním standardním kódem a interním kódem stroje:
(1)Thelocationcodeisfirstconvertedintohexadecimalnumberrepresentation
(2)(Šestnáctkové znázornění kódu umístění)+2020H=kód národní normy;
(3)národní standardní kód+8080H=interní kód stroje
Příklad:Použití čínského znaku"大"jako příklad,kód oblasti"大"je2083
Řešení: 1. Kód oblasti je 20 a číslo bitu je 83
2.Thelocationnumber2083isconvertedtohexadecimalandexpressedas1453H
3,1453H+2020H=3473H, získat národní standardní kód3473H
4,3473H+8080H=B4F3H, získat interní kódB4F3H
Shrnutí:Dvě reprezentace kódování znaků:ASCII(reprezentace znaků);GB2312(národní standardní kód,čínské kódování znaků)
Související rozdíly
1.Externí kód je znakem, který zadáte z vnějšího světa. Po zadání tohoto znaku bude existovat odpovídající kód umístění (tj. 94*94 mřížka šachovnice, čínský znak bude odpovídat+umístění mřížky na její straně, +
2,thelocationcodecanbeconvertedintothenationalstandardcodeafterconversion(sothelocationcode→nationalstandardcodestepjustmeansconversion),
3,Thenationalstandardcodecanbeconvertedintotheinternalcode(usuallyrepresentedbyahexadecimalnumber)afterconversion.