GetEncoding 方法依賴于基礎(chǔ)平臺(操作系統(tǒng))支持大部分代碼頁。但是,對于下列情況提供系統(tǒng)支持:默認(rèn)編碼,即在執(zhí)行此方法的計(jì)算機(jī)的區(qū)域設(shè)置中指定的編碼;Little-Endian Unicode (UTF-16LE);Big-Endian Unicode (UTF-16BE);Windows 操作系統(tǒng) (windows-1252);UTF-7;UTF-8;ASCII 以及 GB18030(簡體中文)。
指定下表中列出的其中一個(gè)名稱以獲取具有對應(yīng)代碼頁的系統(tǒng)支持的編碼。
代碼頁 | 名稱 |
---|
1200 | “UTF-16LE”、“utf-16”、“ucs-2”、“unicode”或“ISO-10646-UCS-2” |
1201 | “UTF-16BE”或“unicodeFFFE” |
1252 | “windows-1252” |
65000 | “utf-7”、“csUnicode11UTF7”、“unicode-1-1-utf-7”、“unicode-2-0-utf-7”、“x-unicode-1-1-utf-7”或“x-unicode-2-0-utf-7” |
65001 | “utf-8”、“unicode-1-1-utf-8”、“unicode-2-0-utf-8”、“x-unicode-1-1-utf-8”或“x-unicode-2-0-utf-8” |
20127 | “us-ascii”、“us”、“ascii”、“ANSI_X3.4-1968”、“ANSI_X3.4-1986”、“cp367”、“csASCII”、“IBM367”、“iso-ir-6”、“ISO646-US”或“ISO_646.irv:1991” |
54936 | “GB18030” |
某些平臺可能不支持特定的代碼頁。例如,Windows 98 的美國版本可能不支持日語 Shift-jis 代碼頁(代碼頁 932)。這種情況下,GetEncoding 方法將在執(zhí)行下面的 C# 代碼時(shí)引發(fā) NotSupportedException:
Encoding enc = Encoding.GetEncoding("shift-jis");
-------------------------------------------------------------------------------------------------------------------------------
全部代碼頁/編碼名稱對照表:
代碼頁(codepage)
名稱(name)
顯示名稱
37
IBM037
IBM EBCDIC(美國 - 加拿大)
437
IBM437
OEM 美國
500
IBM500
IBM EBCDIC(國際)
708
ASMO-708
阿拉伯字符 (ASMO 708)
720
DOS-720
阿拉伯字符 (DOS)
737
ibm737
希臘字符 (DOS)
775
ibm775
波羅的海字符 (DOS)
850
ibm850
西歐字符 (DOS)
852
ibm852
中歐字符 (DOS)
855
IBM855
OEM 西里爾語
857
ibm857
土耳其字符 (DOS)
858
IBM00858
OEM 多語言拉丁語 I
860
IBM860
葡萄牙語 (DOS)
861
ibm861
冰島語 (DOS)
862
DOS-862
希伯來字符 (DOS)
863
IBM863
加拿******************語 (DOS)
864
IBM864
阿拉伯字符 (864)
865
IBM865
北歐字符 (DOS)
866
cp866
西里爾字符 (DOS)
869
ibm869
現(xiàn)代希臘字符 (DOS)
870
IBM870
IBM EBCDIC(多語言拉丁語 2)
874
windows-874
泰語 (Windows)
875
cp875
IBM EBCDIC(現(xiàn)代希臘語)
932
shift_jis
日語 (Shift-JIS)
936
gb2312
簡體中文 (GB2312)
*
949
ks_c_5601-1987
朝鮮語
950
big5
繁體中文 (Big5)
1026
IBM1026
IBM EBCDIC(土耳其拉丁語 5)
1047
IBM01047
IBM 拉丁語 1
1140
IBM01140
IBM EBCDIC(美國 - 加拿大 - 歐洲)
1141
IBM01141
IBM EBCDIC(德國 - 歐洲)
1142
IBM01142
IBM EBCDIC(丹麥 - 挪威 - 歐洲)
1143
IBM01143
IBM EBCDIC(芬蘭 - 瑞典 - 歐洲)
1144
IBM01144
IBM EBCDIC(意大利 - 歐洲)
1145
IBM01145
IBM EBCDIC(西班牙 - 歐洲)
1146
IBM01146
IBM EBCDIC(英國 - 歐洲)
1147
IBM01147
IBM EBCDIC(法國 - 歐洲)
1148
IBM01148
IBM EBCDIC(國際 - 歐洲)
1149
IBM01149
IBM EBCDIC(冰島語 - 歐洲)
1200
utf-16
Unicode
*
1201
UnicodeFFFE
Unicode (Big-Endian)
*
1250
windows-1250
中歐字符 (Windows)
1251
windows-1251
西里爾字符 (Windows)
1252
Windows-1252
西歐字符 (Windows)
*
1253
windows-1253
希臘字符 (Windows)
1254
windows-1254
土耳其字符 (Windows)
1255
windows-1255
希伯來字符 (Windows)
1256
windows-1256
阿拉伯字符 (Windows)
1257
windows-1257
波羅的海字符 (Windows)
1258
windows-1258
越南字符 (Windows)
1361
Johab
朝鮮語 (Johab)
10000
macintosh
西歐字符 (Mac)
10001
x-mac-japanese
日語 (Mac)
10002
x-mac-chinesetrad
繁體中文 (Mac)
10003
x-mac-korean
朝鮮語 (Mac)
*
10004
x-mac-arabic
阿拉伯字符 (Mac)
10005
x-mac-hebrew
希伯來字符 (Mac)
10006
x-mac-greek
希臘字符 (Mac)
10007
x-mac-cyrillic
西里爾字符 (Mac)
10008
x-mac-chinesesimp
簡體中文 (Mac)
*
10010
x-mac-romanian
羅馬尼亞語 (Mac)
10017
x-mac-ukrainian
烏克蘭語 (Mac)
10021
x-mac-thai
泰語 (Mac)
10029
x-mac-ce
中歐字符 (Mac)
10079
x-mac-icelandic
冰島語 (Mac)
10081
x-mac-turkish
土耳其字符 (Mac)
10082
x-mac-croatian
克羅地亞語 (Mac)
20000
x-Chinese-CNS
繁體中文 (CNS)
20001
x-cp20001
TCA 臺灣
20002
x-Chinese-Eten
繁體中文 (Eten)
20003
x-cp20003
IBM5550 臺灣
20004
x-cp20004
TeleText 臺灣
20005
x-cp20005
Wang 臺灣
20105
x-IA5
西歐字符 (IA5)
20106
x-IA5-German
德語 (IA5)
20107
x-IA5-Swedish
瑞典語 (IA5)
20108
x-IA5-Norwegian
挪威語 (IA5)
20127
us-ascii
US-ASCII
*
20261
x-cp20261
T.61
20269
x-cp20269
ISO-6937
20273
IBM273
IBM EBCDIC(德國)
20277
IBM277
IBM EBCDIC(丹麥 - 挪威)
20278
IBM278
IBM EBCDIC(芬蘭 - 瑞典)
20280
IBM280
IBM EBCDIC(意大利)
20284
IBM284
IBM EBCDIC(西班牙)
20285
IBM285
IBM EBCDIC(英國)
20290
IBM290
IBM EBCDIC(日語片假名)
20297
IBM297
IBM EBCDIC(法國)
20420
IBM420
IBM EBCDIC(阿拉伯語)
20423
IBM423
IBM EBCDIC(希臘語)
20424
IBM424
IBM EBCDIC(希伯來語)
20833
x-EBCDIC-KoreanExtended
IBM EBCDIC(朝鮮語擴(kuò)展)
20838
IBM-Thai
IBM EBCDIC(泰語)
20866
koi8-r
西里爾字符 (KOI8-R)
20871
IBM871
IBM EBCDIC(冰島語)
20880
IBM880
IBM EBCDIC(西里爾俄語)
20905
IBM905
IBM EBCDIC(土耳其語)
20924
IBM00924
IBM 拉丁語 1
20932
EUC-JP
日語(JIS 0208-1990 和 0212-1990)
20936
x-cp20936
簡體中文 (GB2312-80)
*
20949
x-cp20949
朝鮮語 Wansung
*
21025
cp1025
IBM EBCDIC(西里爾塞爾維亞 - 保加利亞語)
21866
koi8-u
西里爾字符 (KOI8-U)
28591
iso-8859-1
西歐字符 (ISO)
*
28592
iso-8859-2
中歐字符 (ISO)
28593
iso-8859-3
拉丁語 3 (ISO)
28594
iso-8859-4
波羅的海字符 (ISO)
28595
iso-8859-5
西里爾字符 (ISO)
28596
iso-8859-6
阿拉伯字符 (ISO)
28597
iso-8859-7
希臘字符 (ISO)
28598
iso-8859-8
希伯來字符 (ISO-Visual)
*
28599
iso-8859-9
土耳其字符 (ISO)
28603
iso-8859-13
愛沙尼亞語 (ISO)
28605
iso-8859-15
拉丁語 9 (ISO)
29001
x-Europa
歐羅巴
38598
iso-8859-8-i
希伯來字符 (ISO-Logical)
*
50220
iso-2022-jp
日語 (JIS)
*
50221
csISO2022JP
日語(JIS- 允許 1 字節(jié)假名)
*
50222
iso-2022-jp
日語(JIS- 允許 1 字節(jié)假名 - SO/SI)
*
50225
iso-2022-kr
朝鮮語 (ISO)
*
50227
x-cp50227
簡體中文 (ISO-2022)
*
51932
euc-jp
日語 (EUC)
*
51936
EUC-CN
簡體中文 (EUC)
*
51949
euc-kr
朝鮮語 (EUC)
*
52936
hz-gb-2312
簡體中文 (HZ)
*
54936
GB18030
簡體中文 (GB18030)
*
57002
x-iscii-de
ISCII 梵文
*
57003
x-iscii-be
ISCII 孟加拉語
*
57004
x-iscii-ta
ISCII 泰米爾語
*
57005
x-iscii-te
ISCII 泰盧固語
*
57006
x-iscii-as
ISCII 阿薩姆語
*
57007
x-iscii-or
ISCII 奧里雅語
*
57008
x-iscii-ka
ISCII 卡納達(dá)語
*
57009
x-iscii-ma
ISCII 馬拉雅拉姆語
*
57010
x-iscii-gu
ISCII 古吉拉特語
*
57011
x-iscii-pa
ISCII 旁遮普語
*
65000
utf-7
Unicode (UTF-7)
*
65001
utf-8
Unicode (UTF-8)
*
65005
utf-32
Unicode (UTF-32)
*
65006
utf-32BE
Unicode (UTF-32 Big-Endian)
該文章在 2024/1/22 2:12:41 編輯過