语文现代化应着眼于高度信息化

中学语文教学资源网教学文摘教学论文 手机版




四川省科学技术协会 钱玉趾 

文字记录语言,是传输信息的重要工具。世界已经跨入电脑为特征的信息时代,语文应该跟上这个时代,也就是说,语文的现代化,必须适应高度信息化的要求。文字与书写工具之间有一定的联系和相互制约的关系,古代的苏美尔人用芦苇或骨棒在泥板上"压写"楔形文字,而印欧文字、汉字等是用笔"划写"出来的。在电脑时代,文字主要通过键盘"触写"出来。键盘上有26个字母键,10个数字键和其他符号键。人们敲击这些键符,就能书写、传输和存贮文字符号。英文是由26个拉丁字母按线型排列书写的文字,用电脑键盘"触写",可以说是珠联璧合,得心应手。我国的汉字,是由笔画按平面组合的一种二维图形。其特点是汉字的平均笔画多、结构复杂,总字数多,而且一字一音,全靠死记硬背,不能直接用电脑进行信息处理,必须先将汉字进行编码才行。现有的汉字编码(包括形码、音码、音形码),可以将汉字输入电脑,在一定的范围传输、存贮和输出,在排序和情报检索方面还无能为力。所以,实际上汉字编码只使电脑变为一种汉字打字机,并且是效率不太高的打字机。 

文字信息处理技术可分为三种方式:一、键盘处理;二、字符识别;三、语音识别。汉字编码只能用于键盘处理的某些部分(不是全部),不能用于更高级的字符识别和语音识别方面。所以,汉字编码只是使文字信息处理技术处于低级阶段。在这种情况下,有人设计了一种汉字编码,可应用于电脑打字,就宣布说使古老的汉字"赶上了电脑时代","在信息时代重光了",这相当于在社会主义初级阶段宣布进入了共产主义一样幼稚可笑。 

在字符识别方面,光学字符识别机对于拉丁字母和阿拉伯数字的印刷体,采用16×16或18×20点阵就行,而方块汉字的印刷体,用60×60点阵还不够。识别英文只需识别26个字母。在日本,识别50个假名和2000个汉字,识别字符的数量约是英文字符的80倍,加之汉字结构的复杂性,日本专家估计:日本汉字识别的难度是拉丁字母的500倍。我国专家估计,识别中国一、二级汉字的难度将是拉丁字母的2000倍[1]. 

汉字不是拼音文字,在语音识别方面更为困难,现有的编码也不能用于语音识别。在机器翻译方面,我国1957年开始研究,至今近40年,成绩不小。但是翻译质量还不十分令人满意,一些稍长的句子或结构复杂的句子,译文质量就较差,有时简直不能卒读[2]。曾有人指出:"采用方块汉字中文-外文翻译系统,即使勉强实现,也将是世界上造价最高、效率最低的机器翻译系统。[3]"要解决机器翻译的质量问题,提高机器的智能化是一个方面,更重要的是要有一种精密而单义的汉语拼音文字所表达的形式语文,可惜现在没有。 

世界进入了信息时代,真正有用的信息将是具有跨文化传通功能的信息,并且是高度精密、高度可靠的信息。作为这种信息载体的语言文字,也必须具有跨文化传通的功能,高度精密、高度可靠,能满足信息处理技术三种方式的要求,能满足机器翻译的高质量的要求。 

符合高度信息化要求的汉语拼音文字,具体地说,我们认为,应该满足以下条件: 

一、采用26个国际通用的拉丁字母,从左至右,线型排列; 

二、汉语是有声调的语文,其音节应该使用字母妥善地标明声调; 

三、妥善分化同音词,拼音词与方块汉字词应基本上一一对应,没有同形词; 

四、为了便于识读和理解(包括人和机器的识读理解),词汇应有标明词性词义之类的词缀,并按词分写。 

五、有科学合理的正词法及语法规则。 

当然,上述条件不是一成不变的,在其些场合为了简便快捷,音节可有简化形式,词语可有缩略式等等。 

汉语拼音文字既然是一种拼音形式的文字,就应该具备拼音文字必须具备的特点。我们不妨分析一下世界上主要语种的文字。 

印欧语系的绝大多数文字都具有表示词性的词尾或冠词。西班牙语的名词的性可根据词尾辨认,以?结尾的名词,一般都是阳性,以?结尾的名词,一般都是阴性,冠词放在名词之前,表示名词的性、数等等。形容词的性和它所修饰的名词的性、数相一致,修饰阳性名词时以?结尾,修饰阴性名词时以?结尾。动词的原形动词都以-ar、-er、-ir结尾(分别称为第一、第二、第三变位动词)。 

德语的名词是用冠词来表示的,而且,名词的第一个字母必须大写,这些名词的特征更强,如阳性名词:der Mann(男人、夫);阴性名词:die Frau(妇女)。德语的形容词与西班牙语类似,也必须与名词的性、数和格一致。德语的动词的不定式,是由动词的词根加后缀-en或n构成。 

世界语的单数名词以-o结尾,阴性名词以-ino结尾;形容词以-a结尾;动词不定式的词尾都是-i,其现在式、过去式等等都有明确规定。 

英语的名词也有自己的特点,约有50个习用词(称为名词限定词),主要作用是标明其后的词是名词。表示人的名词有相应的后缀,还有专门表示女性名词的后缀。英语的形容词也有专门的构词后缀。英语中的名词、动词、形容词相互转类都有一定的规则。 

日本在古代借用中国的汉字作为书写文字,初期全用汉字,在平安时代产生了假名。现代日文是汉字假名混用的文字。日本借用汉字并没有照搬,而让有些汉字词长了尾巴。日语的动词以う段音结尾,如:会ぅ(会见)、行く(去)、踊る (跳)、打つ(打)、踏む(踩);日语的形容词都以假名字母い结尾,如:赤い(红的)、甘い(甜的)、高い(高的)、美しい(美的)。此外,还有一些助词,在句子中起到确定主语、宾语、谓语等等的语法作用。 

汉语拼音文字加上词性词义的词缀,主要的作用是使文字变得精密,能准确表达,便于识读和机器翻译,同时还可以与区分同音词结合起来考虑。可谓一举两得。例如:"父女两个谈枇杷"、"妇女两个弹琵琶"两句,其中词性相同的"父女"与"妇女","谈"与"弹","枇杷"与"琵琶"必须有不同的音节拼写形式,才不致弄混。有人认为,词性不同的同音词不全混淆,其实不然。例如:"(撞见/壮健)的是个大傻瓜",就容易混淆。如用动词性词尾?、形容词词尾?加以区分,即:撞见zhuàngjiànd、壮健zhuàngjiànx(标调字母暂不讨论),就比较理想了。 

三十年代制订推行拉丁化新文字的年代,中国还是半封建半殖民地的国家,十分贫穷落后,为了扫除众多的文盲,文字的简易是历史的需要。赵元任的《通字方案》也是在中国比较贫穷的历史背景下产生的,"儿童不识"简化为"而同不式",已经不适应今天的需要。科学技术飞速发展的今天,每秒运算4000亿次的超级计算机已经造成,宇宙飞船可以在太空对接。这一切都与高速度、高精密、高可靠分不开。我国未来的文字,必须能满足超级计算机信息处理的要求。有些人喜欢沉缅于"一东二冬"的音韵和"篆隶行草"的书法,故步自封。从秦代兵马俑深坑里挖出的车辆,就算转动灵活,再加注高级润滑油,在高速公路上只能起堵车作用。在信息高速公路上,古老的汉字也只能起堵车作用。为了国家的现代化,必须实现语文现代化。而语文现代化,必须着眼于高度信息化,设计出相应的汉语拼音文字。 

注释: 

[1] 陈明远:《语言文字的信息处理》,知识出版社1985年版 

[2] 冯志伟:《迈向实用化和商品化的机器翻译研究》,《语文建设》1994年8月 

[3] Chen Guan:《机器翻译和汉语拼音正词法》、《语文现代化》1980.3 

相关链接:教学论文

·语文课件下载
·语文视频下载
·语文试题下载

·语文备课中心






点此察看与本文相关的其它文章』『相关课件』『相关教学视频|音像素材


上一篇】【下一篇教师投稿
本站管理员:尹瑞文 微信:13958889955