Unicode 与 ISO/IEC 10646似乎很多人认为这些字符都是由于一时兴趣而随意糊乱加入到 Unicode 标准之中, 好像只有这样想才能解释为什么加入这些字符:“哦,这都是他们没有仔细地观察分析而加入的。嗯,应该是这样!”。但事实上,远不是这么简单。其实,Unicode 标准是根据国际标准,ISO/IEC 10646 ("信息技术—通用多八位编码字符集 (UCS)"),还有就是在 Unicode 标准的每一个版本中具体内容。然而,这里的 Unicode 标准一定是被工作委员会认可,并通过依靠着国家标准化组织(比如 ANSI, BSI, DIN)的ISO/IEC 10646 投票决定。虽然 Unicode 协会是代表委员会作为 ISO/IEC 10646 直接联络成员,也作为间接地联系着美国国家机构,但他却在这些方面扮演着十分重要的角色(更多的关于 Unicode 与 ISO/IEC 10646 标准之间的相关信息可以通过阅读我的博客来了解: Unicode and ISO/IEC 10646)。 |
于2012年1月发布的Unicode 6.1是符合于2012年6月发布的ISO/IEC 10646:2012国际编码标准 (以一些列PDF文件的形式和一些列电子书形式出现在ISO 网站上的)的。其实ISO/IEC 10646:2012修正版1早在一年前就已经发布了,后来把来自Amd.1 (土耳其里拉标志)的唯一一个特性加入到了于2012年9月发布的Unicode标准6.2版中去了。 ISO/IEC 10646:2012修正版2目前正出去最后的投票阶段,预计今年年底或明年初发布。 把来自Amd.2 (Arabic Letter Mark, Left-To-Right Isolate, Right-To-Left Isolate, First Strong Isolate, Pop Directional Isolate) 的5大特性加入到了于2012年9月发布的Unicode标准6.3版中去了。Unicode 7.0版本的全部特性都会采用ISO/IEC 10646:2012+Amendments 1和2标准,也就是说最新发布的encoded7.0特性是加入到修正版1(1,769个特性)和修正版2(1,070个特性),再减去6.2和6.3版本已经有的特性(1,769 + 1,070 - 6 = 2,833 ,也就是Unicode 7.0的特性)的结果.
修正案1 ("Linear A, Palmyrene, Manichaean, Khojki, Khudawadi, Bassa Vah, Duployan, 以及其它字符") 已经被发布了,所以Unicode中的字符位置和字符名称没有什么可改变的。该修正案包含1769个新字符,下表中是详细内容。你可以从这里或这里下载包含新字符的代码图表。
Block | Characters | Documents |
---|---|---|
Greek and Coptic [0370..03FF] | 037F: Capital letter yot | N3997 |
Armenian [0530..058F] | 058D..058E: 2 Armenian eternity signs | N3923 |
Arabic [0600..06FF] | 0605: Mark used with Coptic numbers | N3843 N3990 |
Arabic Extended-A [08A0..08FF] | 08A1: 1 letter used for Fulfulde | N3882 N3988 |
08AD..08B1: 5 letters used for Bashkir, Belarusian, Crimean Tatar, and Tatar languages | N4072 | |
08FF: 1 letter used for Palula and Shina | N4072 | |
Devanagari [0900..097F] | 0978: 1 letter used for Marwari | N3970 |
Telugu [0C00..0C7F] | 0C00: Candrabindu | N3964 |
Kannada [0C80..0CFF] | 0C81: Candrabindu | N3964 |
Malayalam [0D00..0D7F] | 0D01: Candrabindu | N3964 |
Sinhala [0D80..0DFF] | 0DE6..0DEF: 10 digits for astrological use | N3888 |
Limbu [1900..194F] | 191D..191E: 2 consonant conjuncts | N3975 |
Combining Diacritical Marks Supplement [1DC0..1DFF] | 1DE7..1DF4: 14 combining letters used for Teuthonista phonetic transcription | N4081 N4106 |
Currency Symbols [20A0..20CF] | 20BA: Turkish Lira sign (Unicode 6.2) | N4273 |
Miscellaneous Technical [2300..23FF] | 23F4..23FA: 7 wingdings and webdings symbols | N4022 N4115 |
Dingbats [2700..27BF] | 2700: 1 Wingdings and Webdings symbol | N4022 N4115 |
Miscellaneous Symbols and Arrows [2B00..2BFF] | 2B4D..2B4F, 2B5A..2B73, 2B76..2B95, 2B98..2BB9, 2BBD..2BC8, 2BCA..2BD1: 115 wingdings and webdings symbols | N4022 N4115 |
Supplement Punctuation [2E00-2E7F] | 2E3C: Stenographic full stop | N3895 |
2E3D..2E3E: 2 marks for Lithuanian dialectology | N4070 | |
2E3F: Capitulum | N4022 | |
2E40: Double hyphen | N3983 | |
2E41..2E42: 2 marks for Old Hungarian | N3664 | |
Cyrillic Extended-B [A640..A69F] | A698..A69B: 4 early Cyrillic letters | N3974 |
A69C..A69D: 2 modifier letters used for Lithuanian dialectology | N4070 | |
Latin Extended-D [A720..A7FF] | A794..A795: 2 letters used for Lithuanian dialectology | N4070 |
A798..A79F: 8 letters used for Teuthonista phonetic transcription | N4081 N4106 | |
Combining Half Marks [FE20..FE2F] | FE27..FE2D: 7 combining half marks | N4078 |
Old Italic [10300..1032F] | 1031F: 1 letter used in a South Picene inscription | N4046 |
Enclosed Alphanumeric Supplement [1F100..1F1FF] | 1F10B..1F10C: 2 wingdings and webdings symbols | N4022 N4115 |
Miscellaneous Symbols and Pictographs [1F300..1F5FF] | 1F321..1F32C, 1F336, 1F394..1F395, 1F397, 1F39C..1F39D, 1F3F1..1F3F6, 1F441, 1F53E..1F53F, 1F544..1F54A, 1F568..1F56A, 1F56D..1F56F, 1F571, 1F573, 1F577..1F578, 1F57B, 1F57D..1F57F, 1F582..1F587, 1F589..1F593, 1F597..1F5A3, 1F5A5..1F5BB, 1F5BF..1F5C1, 1F5C4..1F5D1, 1F5D4..1F5DB, 1F5F4..1F5FA: 133 wingdings and webdings symbols | N4022 N4115 N4239 |
Emoticons [1F600..1F64F] | 1F641..1F642: 2 wingdings and webdings symbols | N4022 N4115 |
Transport and Map Symbols [1F680..1F6FF] | 1F6C6..1F6CA, 1F6E0: 6 wingdings and webdings symbols | N4022 N4115 |
Linear A 碑,位于Chania Archaeological 博物馆
{CC BY-SA 3.0 by Ursus}