教培参考
教育培训行业知识型媒体
发布时间: 2024年11月24日 19:44
一、阿拉伯语
阿拉伯语是红十字国际委员会五种工作词汇众所周知,主要就原产于阿曼,中东,采用人口数约 4 亿+。
1. 原产库尔如下表所示
2. Unicode
阿拉伯语特别针对相同的国际标准,Unicode(数据流)也相同。比如:ISO8859-6.Windows CP1256. Unicode等;
a. ISO8859-6
ISO8859-6
b. Windows CP1256
Windows CP1256
c. Unicode
Unicode
表明:
1. ISO8859-6 是IEC内ISO/IEC 8859的其中两个8位Unicode,供当代阿拉伯语采用,它等同亚美尼亚国际标准ASMO-708.
2. CP1256 是由 Microsoft 制订的两个 8 位Unicode,主要就应用于Dos,Windows 控制系统,其扩充性非常有限。
3. Unicode 是为的是化解现代的字符串代码方案的局限性而产生的,它为五种词汇中的每一字符串预设了标准化且惟一的十进制代码,以满足用户跨词汇、虚拟化进行文档切换、处置的要求。
归纳:1. 2 由于许多阿拉伯语采用的拉丁字母都没能*支援,故也已被Unicode逐渐替代。若要同时实现阿拉伯语的显示,重中之重根据网络平台市场需求(优先选择数据流),不然所推荐 Unicode 形式,易于中后期扩充。
二、亚美尼亚拉丁字母
亚美尼亚拉丁字母为阿拉伯语的手写形式。除阿拉伯语,还有其他词汇也采用亚美尼亚拉丁字母,如: 阿拉伯语(土耳其)、印地语(伊拉克,巴基斯坦)、土库曼语(伊拉克)、伊萨诸语言(乌兹别克)、乌兹别克语(乌兹别克族)等。每一拉丁字母都有惟一相关联代码,手写方向从右至左,无大、小写之分,但有正体字、印刷体和表演艺术体之别,且手写时均有独写与连用之分。
原产库尔如下表所示:
扩充补足拉丁字母 (unicode)
Arabic Extended-A
根据拉丁字母分类
表明: Unicode 特别针对不通词汇或特殊市场需求,做的一些字符串补足。
三、亚美尼亚符号
亚美尼亚符号即展示形态(或样式),有些拉丁字母存在多形态,需根据前后拉丁字母,择其形态。许多小语种都存在这种多形态现象,有些符号在矢量字库中甚至没有映射代码。亚美尼亚符号主要就分如下表所示 3 种:
1. 独立形态 (1个符号相关联1个代码)
在前面展示的字符串图形中的小图片,都属这类符号。
2. 含映射代码的独立、连用,合成形态。(1个符号相关联1个代码)
在unicode中,包含了亚美尼亚文特有的2个代码段。
#FB50-FDFF #亚美尼亚表達形式A (Arabic Presentation Form-A)
#FE70-FEFF #亚美尼亚表達形式B (Arabic Presentation Form-B)
表明:根据当前拉丁字母(代码)的前后拉丁字母(代码),决定当前拉丁字母的显示形态(即符号),化解方法:生成点阵信息,建立映射关系。
注意:这些符号的代码不会出现在信息存储或传递中。
3. 不含映射代码的独立、连用,合成形态。(符号没有相关联代码)
表明: 点阵形式,这类符号在某些场景中也会需要显示,相同字体,由于处置形式相同,字符串数也会相同,故化解方案亦不一样。化解方法: 自定义代码,生成点阵信息,建立映射关系。
建议:要同时实现这类市场需求,重中之重确定字体,再考虑进一步动作。
四、阿拉伯语与其他词汇的关系
如西欧国家,德语,法语,西班牙语等,都共用拉丁文拉丁字母,但是彼此却各不相同。阿拉伯语与阿拉伯语,印地语等,虽说同采用亚美尼亚拉丁字母,但采用方法,表达的意思各有相同,甚至都未必同源。参阅如下表所示图述:
词汇来源比较
归纳:一套字库可以支持多种词汇,多种词汇可以共用拉丁字母,但是词汇未必能共用。