【关于编码和定码的讨论】

admin 提交于 周日, 11/27/2016 - 00:31

表音方块字研发工作包括对普通话及方言语音的编码。目前已经编码的音节共有30000个,已经在已发布的字体、输入法中使用。这些音节包括普通话、韩语、粤语、两岸客家话、闽南话。

为了方便大家了解和使用,这里对编码的方式进行简单的介绍。首先,表音方块字使用唯一的Unicode编码,和现有汉字及外国文字(如日文、韩文)等不重码,可以在同一篇文章中使用。编码分批进行。最早编码的是普通话语音,包括有对应汉字的1200多个带声调音节,以及没有对应汉字、但是可以通过汉语拼音现有声韵母拼出的音节,总共5000个。这些没有对应汉字的音节包括网上经常讨论的duang(򰕡), biang(򰉤򰉥򰉦򰉧)等。第二个系统编码的方言/语言是朝鲜话/韩语,共有10000左右音节。这是因为韩语音节已经比较成熟,一定程度上也可以用于我国其他方言书写,以及外文音译。接着是粤语(广州话)音节,包括粤语的6个舒声调和三个入声。【普通话、韩语、粤语】音节是目前已经定码的部分。软件升级时,这些编码不会变动,大家可以放心使用。

目前,仍在测试阶段的语言有,【客家话、闽南话、西南官话】。还未开发的语言有【吴语、少数民族语言】等。测试阶段的语言的编码,仍有可能改变,请大家仅仅就测试使用,暂时不要大量用于文章的书写。定码时我们会向大家说明,同时欢迎大家对其进行测试和反馈。

谢谢大家的关注和支持!

添加新评论

文章分享到