2016年3月25日星期五

被掩盖的数学真相

摘要
从古希腊开始,人类一直希望用数学表达、研究语言。但是,一直找不到合理的语言单位,因此,这个方法只能停留在想象阶段。而从感觉上说,语言中的确应该有某种规律存在,它吸引着无数的学者如醉如痴地追求。既然找不到共性,只能一头扎进了专注于诸如单词意思、语法、句法、发音方法等微观结构的特性。本文正是找到了新的语言学单位(共性)才有条件用数学来解释诸多语言现象。

                  The Hidden Mathematic Truth
                           Abstract
From ancient Greekpeople were looking for mathematic expression of linguistics. But they could not overcome a bottle neck of finding an effective unit, so this idea kept to be a good expectation. This mystery attracted millions scholar’s interest but nearly all of them were trapped by the superficies such as meaning, syntax, morphology or phonology. As this paper find a new unit of language it could have the chance to explain linguistics by mathematics.
        
                       
                          1、寻找单位

从公元前三世纪开始,人类就一直希望用数学来解释语言现象。在R.H.Robins所著的A Short History of Linguistics ‘语言学简史’1997年第四版,第29页上有这样一段话,古希腊的语音学和音位学是严格区分开来的。它们是建立在说与写的基本单位composite unit之上的。我们可以把它理解为带有语音学意义的字母。
尝试对于发音的规范,产生了音节这个单位。”
这里最重要的就是composite unit它是将具有差异的事物放在一起考虑的单位,举例来说,一个苹果和一个梨是无法计算的,除非统一它们的单位,比如水果。音节的定义多少与希腊人想炫耀自己是元音的发现者有关。自从毕达哥拉斯(约前572——约前500提出万物皆数的概念后,古希腊人就对数学崇拜到了迷信的程度。
从此可以推断,古希腊人建立的语言学单位,实际上是要为了进行计算做准备的。而发音是音、义、形三者当中,最可能的突破口。但是,后世以发音的各种特殊性为借口,逐步地蚕食了古希腊人的最初想法,成为今天这种根本无法计算的语音学和音位学。
到了十七世纪,人们从发音上找到标准单位的希望越来越渺茫。于是,就有人(笛卡尔)提出从意思上找到基本单位。在Historical Dictionary of Descartes and Cartesian Philosophy 第二版第204页上这样写道
如能把意思语法看作是类似于数字运算我们就能创造一种宇宙语言。(此前,亚里士多德曾经设想过一种组义语言’semantics或者ontology

紧接着,莱布尼兹也探讨用数学计算意思:https://en.wikipedia.org/wiki/Characteristica_universalis
上这样写到:1676年五月,他(莱布尼兹)再次梦想到一种宇宙语言,那是一种运算,一种思维的代数。
这里要补充的是,他的想法是受到汉字的启发。笛卡尔和莱布尼兹都希望先把意思的变化规律搞清楚,然后再用这个变化规律反过来寻找基本单位。在数学计算中经常采用这种方法。比如,测量的时候,就是根据标枪落地的距离,所用的时间,以及标枪的重量测算出它离开手的时候所受到的力。
此后就是二十世纪,香农Claude Elwood Shannon (1916–2001)的信息论。他设想的基本单位是字母。他希望通过一些计算来反证每一个字母所包含的信息量。这个理论本来是为电脑服务的。后来希望移植到语言学,但最终证明,它在语言学上没有任何意义。
至此,语言中的三个元素,音、义、形都尝试过了。从上面的讨论可以看出,无法用数学来研究语言的根本原因就是找不到可以计算的基本单位。古今所有的科学都一样,只要找到了可以计算的单位,那么,其他问题都会迎刃而解。但是,上面所说的种种尝试都是拼音文字的尝试,汉语普通话不包括在其内。普通话是世界语言大家庭中的一个特例。它的特殊性就在于它的发音中没有塞音和单独的辅音。这就意味着每一个字的发音时间基本一致。比如,在英语中,a, be, bedleft, sprint等都被称作是一个音节。它们的共同点就是每个音节中都含有一个元音。如果使用音节来计算,那无异于计算一段文字中的元音个数。反过来说,由于汉语普通话的每个字在理论上讲,发音时间是相同的(等于计算韵母的个数),那么计算汉字的个数就等于计算了一篇文章口述的时间。而时间是一切生命的度量,是各种效率的比较,也是理解表达及思维速度的必要条件。
根据以上种种,语言学的基本单位只能是汉语普通话中的字。我们可以说,读一篇英语文章相当于用普通话读多少汉字的时间。而不能说,读一篇汉字,相当于读多少英语音节的时间。
为什么人人都想用数学来研究语言?因为数学也是一种表达方法,一种简单、明瞭的语言。某些事物的特性必须由数学来反映。比如,描写物体在空中飞行时的轨迹、速度、加速度、受力方向等,只有数学才能完美的表达。                          

没有评论:

发表评论