设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

Unicode 7.0有什么新特性?

2013-11-25 11:24| 发布者: joejoe0332| 查看: 4414| 评论: 0|原作者: 开源中国社区|来自: 开源中国社区

摘要: Unicode的前两个发布版本(6.2和6.3)非常让人失望,因为加入到标准中的新字符数非常之少(6.2中有1个而6.3中有5个),所以对于那些认为Unicode中的110000个字符还不是太够的人来说,Unicode 7.0将会更加激动人心。 ...


  Unicode 与 ISO/IEC 10646


  似乎很多人认为这些字符都是由于一时兴趣而随意糊乱加入到 Unicode 标准之中, 好像只有这样想才能解释为什么加入这些字符:“哦,这都是他们没有仔细地观察分析而加入的。嗯,应该是这样!”。但事实上,远不是这么简单。其实,Unicode 标准是根据国际标准,ISO/IEC 10646 ("信息技术—通用多八位编码字符集 (UCS)"),还有就是在 Unicode 标准的每一个版本中具体内容。然而,这里的 Unicode 标准一定是被工作委员会认可,并通过依靠着国家标准化组织(比如 ANSI, BSI, DIN)的ISO/IEC 10646 投票决定。虽然 Unicode 协会是代表委员会作为 ISO/IEC 10646 直接联络成员,也作为间接地联系着美国国家机构,但他却在这些方面扮演着十分重要的角色(更多的关于 Unicode 与 ISO/IEC 10646 标准之间的相关信息可以通过阅读我的博客来了解: Unicode and ISO/IEC 10646)。


  于2012年1月发布的Unicode 6.1是符合于2012年6月发布的ISO/IEC 10646:2012国际编码标准 (以一些列PDF文件的形式和一些列电子书形式出现在ISO 网站上的)的。其实ISO/IEC 10646:2012修正版1早在一年前就已经发布了,后来把来自Amd.1 (土耳其里拉标志)的唯一一个特性加入到了于2012年9月发布的Unicode标准6.2版中去了。 ISO/IEC 10646:2012修正版2目前正出去最后的投票阶段,预计今年年底或明年初发布。 把来自Amd.2 (Arabic Letter Mark, Left-To-Right Isolate, Right-To-Left Isolate, First Strong Isolate, Pop Directional Isolate) 的5大特性加入到了于2012年9月发布的Unicode标准6.3版中去了。Unicode 7.0版本的全部特性都会采用ISO/IEC 10646:2012+Amendments 1和2标准,也就是说最新发布的encoded7.0特性是加入到修正版1(1,769个特性)和修正版2(1,070个特性),再减去6.2和6.3版本已经有的特性(1,769 + 1,070 - 6 = 2,833 ,也就是Unicode 7.0的特性)的结果.


  修正案 1


  修正案1 ("Linear A, Palmyrene, Manichaean, Khojki, Khudawadi, Bassa Vah, Duployan, 以及其它字符") 已经被发布了,所以Unicode中的字符位置和字符名称没有什么可改变的。该修正案包含1769个新字符,下表中是详细内容。你可以从这里这里下载包含新字符的代码图表。


  已经存在部分的补充 (339个字符)

Block Characters Documents
Greek and Coptic
[0370..03FF]
037F: Capital letter yot N3997
Armenian
[0530..058F]
058D..058E: 2 Armenian eternity signs N3923
Arabic
[0600..06FF]
0605: Mark used with Coptic numbers N3843
N3990
Arabic Extended-A
[08A0..08FF]
08A1: 1 letter used for Fulfulde N3882
N3988
08AD..08B1: 5 letters used for Bashkir, Belarusian, Crimean Tatar, and Tatar languages N4072
08FF: 1 letter used for Palula and Shina N4072
Devanagari
[0900..097F]
0978: 1 letter used for Marwari N3970
Telugu
[0C00..0C7F]
0C00: Candrabindu N3964
Kannada
[0C80..0CFF]
0C81: Candrabindu N3964
Malayalam
[0D00..0D7F]
0D01: Candrabindu N3964
Sinhala
[0D80..0DFF]
0DE6..0DEF: 10 digits for astrological use N3888
Limbu
[1900..194F]
191D..191E: 2 consonant conjuncts N3975
Combining Diacritical Marks Supplement
[1DC0..1DFF]
1DE7..1DF4: 14 combining letters used for Teuthonista phonetic transcription N4081
N4106
Currency Symbols
[20A0..20CF]
20BA: Turkish Lira sign (Unicode 6.2) N4273
Miscellaneous Technical
[2300..23FF]
23F4..23FA: 7 wingdings and webdings symbols N4022
N4115
Dingbats
[2700..27BF]
2700: 1 Wingdings and Webdings symbol N4022
N4115
Miscellaneous Symbols and Arrows
[2B00..2BFF]
2B4D..2B4F, 2B5A..2B73, 2B76..2B95, 2B98..2BB9, 2BBD..2BC8, 2BCA..2BD1: 115 wingdings and webdings symbols N4022
N4115
Supplement Punctuation
[2E00-2E7F]
2E3C: Stenographic full stop N3895
2E3D..2E3E: 2 marks for Lithuanian dialectology N4070
2E3F: Capitulum N4022
2E40: Double hyphen N3983
2E41..2E42: 2 marks for Old Hungarian N3664
Cyrillic Extended-B
[A640..A69F]
A698..A69B: 4 early Cyrillic letters N3974
A69C..A69D: 2 modifier letters used for Lithuanian dialectology N4070
Latin Extended-D
[A720..A7FF]
A794..A795: 2 letters used for Lithuanian dialectology N4070
A798..A79F: 8 letters used for Teuthonista phonetic transcription N4081
N4106
Combining Half Marks
[FE20..FE2F]
FE27..FE2D: 7 combining half marks N4078
Old Italic
[10300..1032F]
1031F: 1 letter used in a South Picene inscription N4046
Enclosed Alphanumeric Supplement
[1F100..1F1FF]
1F10B..1F10C: 2 wingdings and webdings symbols N4022
N4115
Miscellaneous Symbols and Pictographs
[1F300..1F5FF]
1F321..1F32C, 1F336, 1F394..1F395, 1F397, 1F39C..1F39D, 1F3F1..1F3F6, 1F441, 1F53E..1F53F, 1F544..1F54A, 1F568..1F56A, 1F56D..1F56F, 1F571, 1F573, 1F577..1F578, 1F57B, 1F57D..1F57F, 1F582..1F587, 1F589..1F593, 1F597..1F5A3, 1F5A5..1F5BB, 1F5BF..1F5C1, 1F5C4..1F5D1, 1F5D4..1F5DB, 1F5F4..1F5FA: 133 wingdings and webdings symbols N4022
N4115
N4239
Emoticons
[1F600..1F64F]
1F641..1F642: 2 wingdings and webdings symbols N4022
N4115
Transport and Map Symbols
[1F680..1F6FF]
1F6C6..1F6CA, 1F6E0: 6 wingdings and webdings symbols N4022
N4115

  Linear A 碑,位于Chania Archaeological 博物馆


{CC BY-SA 3.0 by Ursus}


酷毙

雷人
1

鲜花

鸡蛋

漂亮

刚表态过的朋友 (1 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部