java 字符深入知识，待整理-白红宇

java 字符深入知识，待整理

阅读量：5236 次

发布时间：2019-06-14

本文共 1123 字，大约阅读时间需要 3 分钟。

'编'，"编"，为什么获取到的字节数组长度不一样

http://www.cnblogs.com/yongdaimi/p/5899328.html

Unicode 官网

http://unicode.org/

utf-8 汉字对照表

http://blog.chinaunix.net/uid-25544300-id-3281847.html

提及内码与外码

https://www.zhihu.com/question/27562173

code unit 和 code point

http://www.jianshu.com/p/a7db6ac53d57

编码问题，写的很细，但是目前看不懂

http://www.fmddlmyy.cn/text6.html

http://www.cnblogs.com/kingcat/archive/2012/10/16/2726334.html

http://www.cnblogs.com/iforever/p/4520692.html

https://www.zhihu.com/question/23374078

http://blog.csdn.net/u012897297/article/details/18452097

http://alexiter.iteye.com/blog/1533109

http://blog.sina.com.cn/s/blog_6d3fcc7e0101a4pn.html

http://blog.csdn.net/ppdyhappy/article/details/51435527

金丝燕

http://swiftlet.net/archives/category/char-encoding

Unicoce码又称为UCS

Unicode的学名是"Universal Multiple-Octet Coded Character Set"，简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。

UCS只是规定如何编码，并没有规定如何传输、保存这个编码。例如“汉”字的UCS编码是6C49，我可以用4个ascii数字来传输、保存这个编码；也可以用utf-8编码:3个连续的字节E6 B1 89来表示它。关键在于通信双方都要认可。UTF-8、UTF-7、UTF-16都是被广泛接受的方案。UTF-8的一个特别的好处是它与ISO-8859-1完全兼容。UTF是“UCS Transformation Format”的缩写。

转载于:https://www.cnblogs.com/mrxiaohe/p/6678603.html

你可能感兴趣的文章

vb.net 浏览文件夹读取指定文件夹下的csv文件并验证，显示错误信息