设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

Unicode 7.0有什么新特性?

2013-11-25 11:24| 发布者: joejoe0332| 查看: 4415| 评论: 0|原作者: 开源中国社区|来自: 开源中国社区

摘要: Unicode的前两个发布版本(6.2和6.3)非常让人失望,因为加入到标准中的新字符数非常之少(6.2中有1个而6.3中有5个),所以对于那些认为Unicode中的110000个字符还不是太够的人来说,Unicode 7.0将会更加激动人心。 ...

Sanskrit Dhāraṇī ,汉语和悉昙文字,来自于Yarkhoto

IDP: Berlin-Brandenburgische Akademie der Wissenschaften: SHT 7175


  新增部分(822字符)

Block Characters Documents
Old Permic
[10350..1037F]
10350..1037A: 43 letters used for the Old Permic script N4263
Caucasian Albanian
[10530..1056F]
10530..10563, 1056F: 53 letters and marks used for the Caucasian Albanian script N4131
Psalter Pahlavi
[10B80..10BAF]
10B80..10B91, 10B99..10B9C, 10BA9..10BAF: 29 letters, marks and numbers used for the Psalter Pahlavi script N4040
Mahajani
[11150..1117F]
11150..11176: 39 letters and signs used for the Mahajani script N4126
Grantha
[11300..1137F]
11301..11303, 11305..1130C, 1130F..11310, 11313..11328, 1132A..11330, 11332..11333, 11335..11339, 1133C..11344, 11347..11348, 1134B..1134D, 11357, 1135D..11363, 11366..1136C, 11370..11374: 83 letters, numbers and signs used for the Grantha script N4135
N4136
Siddham
[11580..115FF]
11580..115B5, 115B8..115C9: 72 letters, signs and marks used for the Siddham script N4294
Modi
[11600..1165F]
11600..11644, 11650..11659: 79 letters, signs and numbers used for the Modi script N4034
Warang Citi
[118A0..118FF]
118A0..118F2, 118FF: 84 letters and numbers used for the Warang Citi script N4259
Pahawh Hmong
[16B00..16B8F]
16B00..16B45, 16B50..16B59, 16B5B..16B61, 16B63..16B77, 16B7D..16B8F: 127 letters and signs used for the Pahawh Hmong script N4175
N4377
Mende Kikakui
[1E800..1E8DF]
1E800..1E8C4, 1E8C7..1E8D6: 213 syllables and numbers used for the Mende Kikakui script N4167
N4311
N4377

 

  跨越7.0


  新的版本(第四版)的ISO/IEC 10646将会于明年发布,而且新版的修正案已经在日程中。ISO/IEC 10646:2014(字符编码草案) 将会囊括 Haran,old Hungarian (如果匈牙利的人们积极投票支持的话),SHarad,Multani,Ahom,Early Dynasitic Cuneiform,Anatolian Hieroglyph,Sutton Signwriting,以及在一个新的CJK-E区位块中的5762个汉字。修正案1(字符编码草案)目前添加了对Nüshu (Nushu)和Tamil的支持,随着进程的继续,更多的语言会被添加进来。字符列表,编码的分配,以及字符的命名都还没有固定,字符集与以上相关的地 方都应该严肃对待。


  第一次,我认为是一个很好的动作,Unicode组织在发布Unicode的beta版之前发起了ISO投票(因为发布之后,对于修改字符的位置和名称就太晚了),希望大众能够对于建议的字符集有所反馈。在修正案1里面,ISO/IEC 10646:2014的PRI #256 和 ISO/IEC 10646:2014 的 PRI #255中可以看到这些 . 新的语言和字符被添加进ISO/IEC 10646:2014和它的修正案将会包含在未来两到三年的Unicode 7.1和7.2中(这是可能的版本号,现在还没有确定)。


  如果你们当中有人注意到关于如何处理在汉字注音和 'Phags-pa音译中使用的中间点字母(最初由我在2009年1月提出的编码意见, 然后几乎得到又失去每一张选票),这个起伏不定的进程,现在终于在今年夏天于维尔纽斯召开的WG2会议上达成了协议。这个字符最终使用 LATIN LETTER SINOLOGICAL DOT下面的U+A78F,我希望能够在 ISO/IEC 10646:2014 修正案1的后续修正版中看到它(它现在不在修正案1中,也许会添加)。


  唐古拉语是 历史的奇迹,我知道许多人想要看到它被编码进Unicode,作为一系列编码唐古拉语字符和词组提案的主要作者,我也是极其期待的。虽然第一个编码唐古拉 语的提案在2008年就被(Richard Cook)提出来了,但是在字符集上却很难达成协议,导致唐古拉语的编码进度迟缓。由Henry Luce基金会支持的一个编码唐古拉语的研讨会,将会在今年的12月于北京举行(届时我也会出席),如果一切进展顺利的话,唐古拉语是可能参与 ISO/IEC 10646:2014 Amd. 2的投票的,从而被收录进Unicode 7.2或者8.0。


酷毙

雷人
1

鲜花

鸡蛋

漂亮

刚表态过的朋友 (1 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部