2016年3月25日星期五

被掩盖的数学真相6

6、各种信号的利用率
以上,我们讨论了书写与发音信号的数量所引起的变化。或者说,一种语言中,各种信号(符号)的单体越多越好。但是,如果当你已经得到大量的信号,而其中很大一部分未被使用,那么,你依然得不到最好的语言。
比如,汉语普通话有21个声母,35个韵母和4声。按照计算应该有21×35×4=2,940种不同的声音信号,即使考虑到某些声音无法区别,那么,我们依然能够得到大约2,500种不同的声音。但是,实际被利用的声音仅有1,300 种,利用率仅1,300/2,500=0.52=52%.
现在,我们再看看英语书写字母的利用情况。目前,英语单词的数量已经突破一百万。而这一百万单词都是由26个字母组成。用26个字母组词,每个单词平均需要多少个字母呢?
26×26=676
26×26×26=17,576
26×26×26×26=456,976
26×26×26×26×26=11,881,376
这就是说,每个单词只需要四个字母就能组成这一百万个单词所需要的符号。但是,实际上有很多的概率没有被利用。从:
上看到,由两个字母组成的单词仅有105个,105/26×26=105/676=0.15532, 利用率仅仅 15%
由三个字母组成的单词1015个, 1015/26×26×26=1015/17,576=0.05775, 利用率仅 5.7%
由四个字母组成的单词4030个,4030/26×26×26×26=4030/456,976=0.00881884, 利用率仅 0.8%

为什么会是这样?因为,第一,当人们用26个字母创造一个单词的时候,一定要注意发音的需要,也就是不能出现过多的连续辅音或连续元音。否则会造成发音困难。第二,任何用意思组词的企图(比如复合词,派生词等)都是以多于一个字母的字母组合为代价完成的(因为26个字母数量太少,无法与固定的意思联系)。例如,在单词return中,re是前缀,它含有再次回转的意思。只要这个组合re与一个实际的意思相连接,它就成为固定的符号而不能被看作两个字母。这就是说,当我们以turn这个单词为词根,创造一个新单词的时候,按照数学排列的逻辑,增加一个字母就够了,比如xturn,它只需要区别于其他单词就可以了。但是,当我们用两个意思拼凑在一起组合成派生词的时候,就必须增加两个字母如return。因此,拼音文字单词的实际尺寸要比数学计算值长。在讨论AB语言的时候,我们也许发现了,发音速度跟不上表达和思维速度是一件非常难受的事情。因而过长的单词迫使人们希望将发音变短。

没有评论:

发表评论