当前位置:  技术问答>java相关

关于Java中编码的问题

    来源: 互联网  发布时间:2015-03-16

    本文导语:  在Java中使用了Unicode编码,在程序中显式的指定编码时,表示Unicode的字符串是什么? “ISO-8859-1”到底是什么样的编码? |    Supported Encodings  The classes java.io.InputStreamReader, java.io.OutputStrea...

在Java中使用了Unicode编码,在程序中显式的指定编码时,表示Unicode的字符串是什么?
“ISO-8859-1”到底是什么样的编码?

|
 
 Supported Encodings 


The classes java.io.InputStreamReader, java.io.OutputStreamWriter, and java.lang.String can convert between Unicode and a number of other character encodings. The supported encodings vary between different implementations of the Java 2 platform. The java.lang package specification lists the encodings that any implementation of the Java 2 platform, Standard Edition, v. 1.3 is required to support. Note that some of the required encodings have canonical names in Sun's implementations that are different from the names shown in the specification. The required names of these encodings are supported through an alias mechanism: US-ASCII maps to ASCII, ISO-8859-1 to ISO8859_1, UTF-8 to UTF8, utf-8BE to UnicodeBigUnmarked, and utf-8LE to UnicodeLittleUnmarked.

Sun's Java 2 Software Development Kit, Standard Edition, v. 1.3.1 for all platforms and the Java 2 Runtime Environment, Standard Edition, v. 1.3.1 for Solaris and Linux support all encodings shown on this page. Sun's Java 2 Runtime Environment, Standard Edition, v. 1.3.1 for Windows comes in two different versions: US-only and international. The US-only version only supports the encodings shown in the first table. The international version (which includes the libi18n.jar file) supports all encodings shown on this page.

Basic Encoding Set (contained in rt.jar)
Canonical Name 
 Description 
 
ASCII 
 American Standard Code for Information Interchange 
 
Cp1252 
 Windows Latin-1 
 
ISO8859_1 
 ISO 8859-1, Latin alphabet No. 1 
 
UnicodeBig 
 Sixteen-bit Unicode Transformation Format, big-endian byte order, with byte-order mark 
 
UnicodeBigUnmarked 
 Sixteen-bit Unicode Transformation Format, big-endian byte order 
 
UnicodeLittle 
 Sixteen-bit Unicode Transformation Format, little-endian byte order, with byte-order mark 
 
UnicodeLittleUnmarked 
 Sixteen-bit Unicode Transformation Format, little-endian byte order 
 
UTF8 
 Eight-bit Unicode Transformation Format 
 
utf-8 
 Sixteen-bit Unicode Transformation Format, byte order specified by a mandatory initial byte-order mark 
 


Extended Encoding Set (contained in i18n.jar)
Canonical Name 
 Description 
 
Big5 
 Big5, Traditional Chinese 
 
Big5_HKSCS 
 Big5 with Hong Kong extensions, Traditional Chinese 
 
Cp037 
 USA, Canada (Bilingual, French), Netherlands, Portugal, Brazil, Australia 
 
Cp273 
 IBM Austria, Germany 
 
Cp277 
 IBM Denmark, Norway 
 
Cp278 
 IBM Finland, Sweden 
 
Cp280 
 IBM Italy 
 
Cp284 
 IBM Catalan/Spain, Spanish Latin America 
 
Cp285 
 IBM United Kingdom, Ireland 
 
Cp297 
 IBM France 
 
Cp420 
 IBM Arabic 
 
Cp424 
 IBM Hebrew 
 
Cp437 
 MS-DOS United States, Australia, New Zealand, South Africa 
 
Cp500 
 EBCDIC 500V1 
 
Cp737 
 PC Greek 
 
Cp775 
 PC Baltic 
 
Cp838 
 IBM Thailand extended SBCS 
 
Cp850 
 MS-DOS Latin-1 
 
Cp852 
 MS-DOS Latin-2 
 
Cp855 
 IBM Cyrillic 
 
Cp856 
 IBM Hebrew 
 
Cp857 
 IBM Turkish 
 
Cp858 
 Variant of Cp850 with Euro character 
 
Cp860 
 MS-DOS Portuguese 
 
Cp861 
 MS-DOS Icelandic 
 
Cp862 
 PC Hebrew 
 
Cp863 
 MS-DOS Canadian French 
 
Cp864 
 PC Arabic 
 
Cp865 
 MS-DOS Nordic 
 
Cp866 
 MS-DOS Russian 
 
Cp868 
 MS-DOS Pakistan 
 
Cp869 
 IBM Modern Greek 
 
Cp870 
 IBM Multilingual Latin-2 
 
Cp871 
 IBM Iceland 
 
Cp874 
 IBM Thai 
 
Cp875 
 IBM Greek 
 
Cp918 
 IBM Pakistan (Urdu) 
 
Cp921 
 IBM Latvia, Lithuania (AIX, DOS) 
 
Cp922 
 IBM Estonia (AIX, DOS) 
 
Cp930 
 Japanese Katakana-Kanji mixed with 4370 UDC, superset of 5026 
 
Cp933 
 Korean Mixed with 1880 UDC, superset of 5029 
 
Cp935 
 Simplified Chinese Host mixed with 1880 UDC, superset of 5031 
 
Cp937 
 Traditional Chinese Host miexed with 6204 UDC, superset of 5033 
 
Cp939 
 Japanese Latin Kanji mixed with 4370 UDC, superset of 5035 
 
Cp942 
 IBM OS/2 Japanese, superset of Cp932 
 
Cp942C 
 Variant of Cp942 
 
Cp943 
 IBM OS/2 Japanese, superset of Cp932 and Shift-JIS 
 
Cp943C 
 Variant of Cp943 
 
Cp948 
 OS/2 Chinese (Taiwan) superset of 938 
 
Cp949 
 PC Korean 
 
Cp949C 
 Variant of Cp949 
 
Cp950 
 PC Chinese (Hong Kong, Taiwan) 
 
Cp964 
 AIX Chinese (Taiwan) 
 
Cp970 
 AIX Korean 
 
Cp1006 
 IBM AIX Pakistan (Urdu) 
 
Cp1025 
 IBM Multilingual Cyrillic: Bulgaria, Bosnia, Herzegovinia, Macedonia (FYR) 
 
Cp1026 
 IBM Latin-5, Turkey 
 
Cp1046 
 IBM Arabic - Windows 
 
Cp1097 
 IBM Iran (Farsi)/Persian 
 
Cp1098 
 IBM Iran (Farsi)/Persian (PC) 
 
Cp1112 
 IBM Latvia, Lithuania 
 
Cp1122 
 IBM Estonia 
 
Cp1123 
 IBM Ukraine 
 
Cp1124 
 IBM AIX Ukraine 
 
Cp1140 
 Variant of Cp037 with Euro character 
 
Cp1141 
 Variant of Cp273 with Euro character 
 
Cp1142 
 Variant of Cp277 with Euro character 
 
Cp1143 
 Variant of Cp278 with Euro character 
 
Cp1144 
 Variant of Cp280 with Euro character 
 
Cp1145 
 Variant of Cp284 with Euro character 
 
Cp1146 
 Variant of Cp285 with Euro character 
 
Cp1147 
 Variant of Cp297 with Euro character 
 
Cp1148 
 Variant of Cp500 with Euro character 
 
Cp1149 
 Variant of Cp871 with Euro character 
 
Cp1250 
 Windows Eastern European 
 
Cp1251 
 Windows Cyrillic 
 
Cp1253 
 Windows Greek 
 
Cp1254 
 Windows Turkish 
 
Cp1255 
 Windows Hebrew 
 
Cp1256 
 Windows Arabic 
 
Cp1257 
 Windows Baltic 
 
Cp1258 
 Windows Vietnamese 
 
Cp1381 
 IBM OS/2, DOS People's Republic of China (PRC) 
 
Cp1383 
 IBM AIX People's Republic of China (PRC) 
 
Cp33722 
 IBM-eucJP - Japanese (superset of 5050) 
 
EUC_CN 
 GB2312, EUC encoding, Simplified Chinese 
 
EUC_JP 
 JIS X 0201, 0208, 0212, EUC encoding, Japanese 
 
EUC_JP_LINUX 
 JIS X 0201, 0208, EUC encoding, Japanese 
 
EUC_KR 
 KS C 5601, EUC encoding, Korean 
 
EUC_TW 
 CNS11643 (Plane 1-3), EUC encoding, Traditional Chinese 
 
GBK 
 GBK, Simplified Chinese 
 
ISO2022CN 
 ISO 2022 CN, Chinese (conversion to Unicode only) 
 
ISO2022CN_CNS 
 CNS 11643 in ISO 2022 CN form, Traditional Chinese (conversion from Unicode only) 
 
ISO2022CN_GB 
 GB 2312 in ISO 2022 CN form, Simplified Chinese (conversion from Unicode only) 
 
ISO2022JP 
 JIS X 0201, 0208 in ISO 2022 form, Japanese 
 
ISO2022KR 
 ISO 2022 KR, Korean 
 
ISO8859_2 
 ISO 8859-2, Latin alphabet No. 2 
 
ISO8859_3 
 ISO 8859-3, Latin alphabet No. 3 
 
ISO8859_4 
 ISO 8859-4, Latin alphabet No. 4 
 
ISO8859_5 
 ISO 8859-5, Latin/Cyrillic alphabet 
 
ISO8859_6 
 ISO 8859-6, Latin/Arabic alphabet 
 
ISO8859_7 
 ISO 8859-7, Latin/Greek alphabet 
 
ISO8859_8 
 ISO 8859-8, Latin/Hebrew alphabet 
 
ISO8859_9 
 ISO 8859-9, Latin alphabet No. 5 
 
ISO8859_13 
 ISO 8859-13, Latin alphabet No. 7 
 
ISO8859_15_FDIS 
 ISO 8859-15, Latin alphabet No. 9 
 
JIS0201 
 JIS X 0201, Japanese 
 
JIS0208 
 JIS X 0208, Japanese 
 
JIS0212 
 JIS X 0212, Japanese 
 
JISAutoDetect 
 Detects and converts from Shift-JIS, EUC-JP, ISO 2022 JP (conversion to Unicode only) 
 
Johab 
 Johab, Korean 
 
KOI8_R 
 KOI8-R, Russian 
 
MS874 
 Windows Thai 
 
MS932 
 Windows Japanese 
 
MS936 
 Windows Simplified Chinese 
 
MS949 
 Windows Korean 
 
MS950 
 Windows Traditional Chinese 
 
MacArabic 
 Macintosh Arabic 
 
MacCentralEurope 
 Macintosh Latin-2 
 
MacCroatian 
 Macintosh Croatian 
 
MacCyrillic 
 Macintosh Cyrillic 
 
MacDingbat 
 Macintosh Dingbat 
 
MacGreek 
 Macintosh Greek 
 
MacHebrew 
 Macintosh Hebrew 
 
MacIceland 
 Macintosh Iceland 
 
MacRoman 
 Macintosh Roman 
 
MacRomania 
 Macintosh Romania 
 
MacSymbol 
 Macintosh Symbol 
 
MacThai 
 Macintosh Thai 
 
MacTurkish 
 Macintosh Turkish 
 
MacUkraine 
 Macintosh Ukraine 
 
SJIS 
 Shift-JIS, Japanese 
 
TIS620 
 TIS620, Thai 
 



--------------------------------------------------------------------------------
Copyright © 1996-2001 Sun Microsystems, Inc. All Rights Reserved. 

Please send comments to: java-intl@java.sun.com 
 
Java Software 
 

|
看看这个文件
jdk1.4jrelibcharsets.jar
jdk1.3jrelibi18n.jar

    
 
 

您可能感兴趣的文章:

  • java命名空间javax.print类docflavor的类成员方法:默认编码和平台编码定义及介绍
  • 求救:JAVA 中汉字编码怎样变成 VC 下的汉字编码?
  • Java读写包括中文的txt文件时不同编码格式问题解决
  • 网页的编码问题!或者java的编码问题,由此引出一条解决中文问题的思路
  • 免费的Java地理编码库 JGeocoder
  • java自动根据文件内容的编码来读取避免乱码
  • 简洁实用的Java Base64编码加密异常处理类代码
  • Solaris下如何修改java虚拟机的默认编码
  • 运行java程序时出现 警告:编码 UTF8 的不可映射字符
  • java用的是unicode, c 用的哪种字符编码?
  • Java是否有能够将经过quoted-printable编码的字符序列转换为原文的函数?
  • 请问有谁有JAVA的编码规范
  • 求助:java中 xp和unix的编码问题
  • 再来讨论一下JAVA中的汉字编码问题
  • 献身java的编码员都是受虐待狂
  • 关于java编码规范
  • 请教:linux里取出mysql的数据为乱码,作了编码处理还是不行(java)
  • 请教 java 编码问题。
  • 在java里有关编码和解码的问题:比如对中文编码成BASE64或quoted-printable或者是其他的,应该用什么类什么方法?请赐教!!
  • java 中中文编码问题 是不是 与本地系统有关?
  • java按指定编码写入和读取文件内容的类分享
  • 菜鸟的问题:java与java script 的异同??
  • java新手的问题,java高手帮忙...
  • 低级问题:.java文件交付用户怎么运行,难道也是DOS下:java xx.java?有没有.exe?
  • 请各位java高手几个java有关的问题?
  • java.sql.Date和java.uitl.Date的问题?
  • 问大哥大姐们个问题啊,小第编了自己的第一个JAVA问题。用JAVAC编译能通过啊!可是用JAVA不能执行啊!
  • 最入门级的java问题,如何运行HelloWorld.java
  • 请教一些JAVA的基本问题,初学JAVA有些迷糊,帮帮忙!总迷糊实在受不了了!
  • Linux下面的开发好的Java程序,如何部署到其他机器?开发好的Java图形程序,终端上能否用?等问题
  • 关于JAVA应用程序(Java Application)的deliver问题
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • java命名空间java.sql类types的类成员方法: java_object定义及介绍
  • 我想学JAVA ,是买THINK IN JAVA 还是JAVA2核心技术:卷1 好???
  • java命名空间java.awt.datatransfer类dataflavor的类成员方法: imageflavor定义及介绍
  • 请问Java高手,Java的优势在那里??,Java主要适合于开发哪类应用程序
  • java命名空间java.lang.management类managementfactory的类成员方法: getcompilationmxbean定义及介绍
  • 如何将java.util.Date转化为java.sql.Date?数据库中Date类型对应于java的哪个Date呢
  • java命名空间java.lang.management接口runtimemxbean的类成员方法: getlibrarypath定义及介绍
  • 谁有电子版的《Java编程思想第二版(Thinking in java second)》和《Java2编程详解(special edition java2)》?得到给分
  • java命名空间java.lang.management接口runtimemxbean的类成员方法: getstarttime定义及介绍
  • 本人想学java,请问java程序员的待遇如何,和java主要有几个比较强的方向
  • java命名空间java.awt.datatransfer类dataflavor的类成员方法: stringflavor定义及介绍
  • 我对JAVA一窍不通,可惜别人却给我一个Java的project,要我做一个安装程序,请问哪里有JAVA INSTALLER下载,而且我要不要安装java的sdk才能完成此项任务?
  • java命名空间java.security类keystore的类成员方法: getdefaulttype定义及介绍
  • 新年第一天,让我们讨论一下未来一年JAVA的发展趋势! 个人认为,JAVA将主要朝ERP和JAVA手机方面发展!
  • java命名空间java.lang.management接口runtimemxbean的类成员方法: getclasspath定义及介绍
  • 我想学Java,但不知道Java的实用的开发工具有那些,Java主要用在哪些方面,EJB到底是什么东西??
  • java命名空间java.awt.datatransfer类dataflavor的类成员方法: javaserializedobjectmimetype定义及介绍
  • redhat7.3下,java程序打印中文直接用java命令执行正常,用crontab执行java命令为乱码
  • java命名空间java.awt.datatransfer类dataflavor的类成员方法: javafilelistflavor定义及介绍
  • 各位学java的朋友,学java的未来是什么,你们学java都用来开发什么项目啊!来者给分!!
  • java命名空间java.lang.management接口runtimemxbean的类成员方法: getvmname定义及介绍
  • 请问java程序中的import为什么有的用java.….*,而有的又用java.….…,有什么区别吗?


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3