目前人们讨论语言时,有三个一再被提出的问题,回答一次,不久就又会出来。所以,我希望说话的人能够稍微了解一下它们。
第一个问题是关于繁体字简化的问题,港澳台的学者坚持说简化字是胡闹,是歪曲了中华文化。举出最多的例子就是简化后的‘爱’没有心字,没有心怎么‘愛’?这其实就是双重标准。英语中的love就没有心heart。怎么从来没听谁说过英国人不懂得爱呢?此外,所谓用‘心’来爱那是古代的说法,并不科学,现代科学发现,所有的思维都来源于大脑。这就是中国人为什么科学上总是落后的根本原因;不是抱着西方人的大腿不放,就是抱着古人的大腿不放,什么时候才能学者自己走路呢?
第二个问题是总有人喜欢说,英语中的某某词,在汉语中没有,因此汉语翻译不过来,翻译过来也不准确。这些人实际上是没弄清楚什么是语言的作用。语言的作用是运用你头脑中已知的符号去模拟一个事物,由于是你头脑中固有的东西,因此,根据你自己的认识你理解了这个事物。每次通过这个过程都增加了你对原有词汇的新认识,同时也可能增加了你头脑中新的词汇。因此,一种语言其实就是一组符号的整体。汉字代表的意思一般小于英语单词所代表的意思,因此变化起来十分灵巧。好比是用微积分计算面积时,先要将一个体积切成无数的小块,然后将它们总数相加,得到这个面积的总和。当然是在开始的时候,切得越细小越能够接近那个体积如图:
比如bull=公牛,‘公’和‘牛’是可以分开的,而bull 就分不开。也就是说,汉语模拟任何事物的时候都比英语清楚。这就等于说,汉语模拟(翻译)英语,要比英语模拟汉语来的清楚。比如,汉语中的‘九阴白骨爪’就没有办法翻译成英语。所以说,一种语言中有没有某个单词,并不重要,重要的是这种语言的系统是否先进,先进的语言做什么事情都游刃有余。
第三个问题是信息量的问题。这是计算机上面的单位,语言学家基本上不用它来衡量信息。可是,不少人为了抬高自己的身价,附庸风雅总喜欢使用它。所谓的拉大旗作虎皮。你真的问他这个单位是怎样计算出来的,99%以上的人是说不出来的。
冯志伟的文章中就谈到关于语言中怎样计算熵:
http://blog.sina.com.cn/s/blog_72d083c70100pekd.html
“实际的试验是这样来设计的:我们给受试人看一个英语文本,然后要求受试人猜测下一个字母。受试人利用他们的语言知识来猜测最可能出现的字母,然后猜测下一个最可能的字母,如此等等。我们把受试人猜对的次数记录下来。Shannon指出,猜测数序列的熵与英语字母的极限熵是相同的。Shannon这种观点的直觉解释是:如果受试人做n个猜测,那么,给定猜测数序列,我们能够通过选择第n个最可能的字母的方法,重建原来的文本。这样的方法要求猜字母而不是猜单词,受试人有时必须对所有的字母进行穷尽的搜索!所以,Shannon计算的是英语中每个字母的极限熵,而不是英语中每个单词的极限熵。”
最关键的就是最后这一句,‘Shannon计算的是英语中每个字母的极限熵,而不是英语中每个单词的极限熵。’看懂了它就明白为什么信息论在语言学上根本派不上用场。按照信息论方法计算出来的东西只不过是某个人对于某种语言的熟练程度而已。和那种语言的字母,单词,字符等的信息量没有关系。举一个简单的例子:英语目前有一百万种单词,如果用这一百万种单词写成文章让任何一个英国人猜,他的结果都会是千奇百怪,毫无规律可言。因为,一个英国人能记住三万单词就算是大师级的人物了。莎士比亚不过如此,其余那九十七万单词,对个人而言,风马牛不相及,就是摆设,你让他猜什么?
而为什么‘熵’这玩艺这么流行呢?根本的原因和英语语法一样,在一个小范围内进行试验它总能给人带来不同的解释,越讨论就越没边,越没边就越热闹。根本就是无中生有的东西。人人好像都能插上嘴,而人人又都说不清楚。只有将问题放大才能看清语言的本质。怎样放大?很简单,把整个语言系统通盘考虑,比如,这样的问题‘人的大脑如何处理某种语言的总词汇量?’‘为什么所有的语言都能表达任何意思?’等。只有考虑大问题才能看清问题的实质。总龟缩在一词,一句的分析上面,磨磨牙还可以,可什么问题也解决不了。
没有评论:
发表评论