本文是一篇信息技术论文范文,信息技术类毕业论文,关于计算机相关参考文献新疆相关开题报告范文。适合信息技术及汉字及部件方面的的大学硕士和本科毕业论文以及信息技术相关开题报告范文和职称论文写作参考文献资料下载。
香港电脑汉字楷体字形参考指引
(Version05R)
(2001年4月22日星期日)
主题内容:
1.1本指引根据汉字的构形规律及香港常用字字形原则制定,旨在列出适合香港使用的电脑用汉字楷体字形原则.
1.2本指引适用於ISO/IEC10646标准中基本多文种平面(BMP)及A扩充集(ExtensionA)的汉字及《香港增补字符集》(HongKongSupplementaryCharacterSet)的汉字.但是本指引并不适用於ISO/IEC10646中所包括的内地已规范的简化字及仅在日本,韩国,越南,或新加坡一地使用的汉字.
1.3本指引以国家语言文字工作委员会於一九九七年十二月一日发布的《信息处理用GB13000.1字符集汉字部件规范》(文件号:GF3001-1997)为基础,以定义汉字部件形状的方式来定义汉字字形.本指引只描述汉字部件的笔画结构,并不对汉字或其部件的大小和比例构成限制.本指引包括一《香港电脑汉字字形基础部件表》,载列用以构成1.2段所述汉字的各个部件.
1.5本指引只适用於电脑使用的楷体字形.
适用范围
本指引主要供电脑厂商参考,可用於电脑中文处理领域的出版,印刷,教学,设计,管理,和科研等方面.
引用标准
ISO/IEC10646《信息技术通用多八位编码字符集》
3.2GB13000.1《信息技术通用多八位编码字符集(UCS),第一部分体系结构与基本多文种平面
3.3GB/T13443-92《信息交换用汉字128X128点阵楷体字模集及数据集》
3.4GB/T12200.1-90《汉语信息处理词汇01部分:基本术语》
3.5GB/T12200.1-94《汉语信息处理词汇02部分:汉语和汉字》
4.参考文献
4.1《信息处理用GB13000.1字符集汉字部件规范》(GF3001-1997),国家语言文字工作委员会,语言文字规范,一九九八年五月.
4.2《常用字字形表(二零零零年修订本)》,香港教育学院出版,二零零零年.
4.3TheUnicodeStandardVersion3.0,TheUnicodeConsortium(2000)
4.4《国字标准字体宋体母稿》,教育部字序,台湾教育部,一九九八年二月.
4.5《简化字总表》,中国文字改革委员会1964年编印,1986年新版.
4.6《现代汉语通用字─笔顺规范》,国家语言文字工作委员会,语文出版社,1987年8月.
4.7《现代汉字学纲要》,苏培成着,北京大学出版社﹐一九九四年十月.
4.8《汉字笔画定量研究》﹐马显彬﹐语文建设通讯(香港)﹐二零零零年四月.
术语
5.1汉字Chinesecharacter/Hanzi(GB12200.1—90)
记录汉语的书写符号系统.汉字也被其他一些国家或民族用作为书写符号.
5.2简化字simplifiedChinesecharacter(GB12200.1—90)
采用同音代替,改换声旁,草书楷化,偏旁简化类推等方法制定的一批笔画较少的汉字.在内地,这些字取代了笔画较多的汉字作为正体.特指4.5段内地於1986年公布的《简化字总表》所收纳的2,235字.
统一的中日韩文字UnifiedCJKIdeographs(ISO/IEC10646《信息技术通用多八位编码字符集》)
ISO/IEC10646标准中所包括的中国,日本,韩国及其它国家和地区经认同规则整合後被采用的汉字的统称.
原字集CJKIdeographSources(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》)
ISO/IEC10646标准中基本多文种平面内的中日韩文字是在整合中国,日本,韩国及其它国家和地区原有的电脑文字标准後得到的.这些原有的电脑文字标准或规范被称为原字集.原字集颁布国家和地区均有代号,其中G,H,J,K,S,T,V分别代表中国,香港,日本,韩国,新加坡,台湾和越南.
认同规则UnificationProcedure(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)
是ISO/IEC10646标准使用一套汉字统一整合的规则,以避免将不同原字集中仅有很小差异的异体汉字分别编码.根据认同规则被认同的汉字不会分别编码,但ISO/IEC10646标准并不限制同码异体汉字的具体字形.
原字集分别编码原则SourceSeparationRule(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)
凡在原字集中具有单独代码的异体字,ISO/IEC10646标准中仍保持单独代码,以保证ISO/IEC10646与原字集之间的映射关系.
5.7楷体KaiTi(GB/T12200.2—94)
汉字主要印刷体之一.由手写的正规楷书发展而来.
5.8笔画stroke(GB/T12200.2—94)
构成楷书汉字字形的最小连笔单位.
5.9笔形strokefeature(GF3001-1997)
笔画的具体形状.楷书汉字的笔形依据笔势和走向可以分为数十种,其基本的类别为"一"(横),""(竖),""(撇),","(点),""(折).
5.10笔顺strokeorder(GF3001-1997)
书写每个汉字时笔画的次序和方向.
5.11笔数strokecount(GB/T12200.2—94)
构成一个汉字或汉字部件的笔画数目.
5.12汉字部件Chinesecharacterponent(GB/T12200.2—94)
由笔画组成的具有组配汉字功能的构字单位.简称"部件".
例如:"木,心,口,也".
5.13基础部件basicponent(GF3001-1997)
最小的不再拆分的部件叫基础部件,也称单纯部件.基础部件处於汉字结构的最低层,又称末级部件.例如"男"中的"田","力".
5.14主形部件main-glyphponent
来源相同的一组部件中,形状没有受到位置影响而变化的具有代表性的部件,例如:"又"(见於"设"字)与""(见於"灿"字)两者之中,"又"为主形部件.主形部件具有代表和称说本组部件的作用.
5.15变体部件ponentvariant
来源相同的一组部件中,形状受到位置影响而变化的部件.例如:"又"(见於"设"字)与""(见於"灿"字)两者之中,""为变体部件.
5.16形似部件non-cognateponents
形状相似但不同源的两个或多个部件.
5.17部件拆分(GF3001-1997)ponentdeposition
将汉字拆分为部件称部件拆分.
5.18有理据拆分和无理据拆分structural-baseddepositionandpromiseddeposition
根据结构理据所进行的部件拆分,称有理据拆分,当无法分析理据或理据与字形发生矛盾时,依照字形所进行的部件拆分,称无理据拆分.
部件拆分原则
本指引作部件拆分的目的是以定义汉字部件形状的方式来定义汉字字形,并以《信息处理用GB13000.1字符集汉字部件规范》第5段的《汉字基础部件表》使用规则所载的部件拆分原则为基础.具体的拆分原则如下:
6.1不违背形体的原则:
交重不拆,
相离相接可拆,
少数不影响结构和笔数的笔画搭挂,按相接处理.
6.2遵照结构规律的原则:
字形合乎理据,进行有理据拆分.无法分析理据或形源矛盾的,依形进行无理据拆分.
拆分按汉字的组合层次进行.
6.3相关对应的原则:
同源部件尽量统一处理,
主形和变体尽量统一处理.
合理控制下限的原则:
两个以上的相离或相接部分,若其中一个无构成其他字的能力,则不再拆分.
两个相离的对称部分,不分开用以构字的,不再拆分.
拆分中有一个为单笔的应为有理拆分.
最後一次拆分,不可拆分为两个以上的单笔.
依笔形区分部件的原则:
主形部件和变体部件分别列出.
属於不同源的部件,笔形完全相同的,当作同一部件.
部件的大小和笔画的绝对长短粗细不作为区分部件的标准.
综合衡量的原则:以上原则无法兼顾时,权衡利弊,综合处理.
7.《香港电脑汉字楷体字形基本部件表》
7.1部件数量和来源
本表列载的基础部件现合共625个,是对本指引适用范围内的汉字进行拆分的结果.
7.2部件排列方法
部件按笔划数从少到多顺序排列.
如笔划数相同的部件,则按起笔"横竖撇点折"顺序排列.
7.3栏目说明
7.3.1序号:部件的排列顺序号.
7.3.2部件:列出汉字或部件的基本形状和出处.
7.3.2.1形状仅表明笔画结构,并不对该汉字或其部件的大小和比例构成限制
7.3.2.2出处表示该部件是否出现在如下四个参考文献中的文字.出处出现以数字表示,"0"为出现,"1"为未出现.参考文献由四位数目-"ABCD"分别代表:
A:《康熙字典》
B:《汉语大字典》
C:"大五码"
D:《香港增补字符集》7.3.3笔划数:列出部件的基本笔划数目.
7.3.4例字:列出包含该部件的汉字楷体字形作为示例.
若例字後面有"等"者,表示没有穷举,还有其他例字.
若例字後面没有"等"者,表示已经穷举.
每个例字之下方均列出所代表的Unicode码.有"*"者表示该字为4.2《常用字字形表(二零零零年修订本)》出处中出现的汉字.
7.3.5附注:与部件相关的补充说明.
7.3.6GB组号和GB序号:如部件同时载列於《信息处理用GB13000.1字符集汉字部件规范》,该规范编予该部件的组号和序号也一并列出,以便检索.由於《信息处理用GB13000.1字符集汉字部件规范》不是字形规范,其所列部件字形可能与本指引内所列部件之字形有异.
本指引建议厂商参照ISO/IEC10646标准中G列字形制造此类汉字
认同规则原文见ISO/IEC10646AnnexS(Informative)ProcedurefortheUnificationandArrangementofCJKIdeographs
拆分原则只适用於本指引适用范围内的汉字.因本指引不包括ISO/IEC10646标准中的内地已规范之简化字及仅在日本,韩国,越南,新加坡等一地使用的汉字.拆分部件也不包括该批汉字独有的部件,如简化字部件.
April22,2001DocumentNo.:DN37R
1