2016年7月30日星期六

萧伯纳有所不知

萧伯纳一辈子喜欢讽刺别人,可是自己也有现眼的时候。他在Pygmalion中塑造了一位传奇的语音学家Higgins。别的语音学家最多只能分辨出24个元音,而他却能够从英语中分辨出130个元音来。凭着这个本事,他训练一位漂亮,但是地位低下的卖花女成为上流社会的明星。这部作品顺应了当年英语希望扩张的心理,因此轰动一时。1964年奥黛丽·赫本在银幕上成功地塑造了买花姑娘这个角色,一举赢得8项奥斯卡奖以及多项金球奖。


萧伯纳对语言学很感兴趣,他非常希望将英语推向世界。他在遗嘱中设立了一个奖金,奖给能够将英语字母和发音一一对应的发明家。(从国际音标的观点看,英语大约需要40个字母而不是现在的26个字母)《卖花姑娘》虽然有些夸张,但是,我们还是从中得到启发,如果这130个元音不是用来包装明星,而是使全人类享受到更多的信息难道不是更有意义吗?130个元音与21个辅音结合,能产生2730种不同的声音,那将大幅增加英语的记忆能力和提高思维速度。可惜,萧伯纳不知道声调的作用,因为在拼音文字的语音学中,研究的都是辅音和元音的结合体来区分语音信号。因此,在他的眼中,不同声调的同一元音,就是不同的元音;á和ǎ是两个不同的元音。换句话说, 普通话的使用者,各个都能发出并识别140个元音 (普通话有35个韵母乘以4140) ,正好比那位杰出的语音学家Higgins多了10个。人类的发音和听觉系统所能区分的元音是有限度,超过一定的限度就要采用声调来区分;就好象古代菲尼基人,发明辅音后,超过一定的限度就要用元音来区别。因为采用新方法比一味在固有的方式中追求数量要容易、经济和实用得多。我相信,如果萧伯纳明白这个道理,他虚拟的语音学家一定能分辨150种而非130种元音。

2016年7月23日星期六

人类语音中的‘维’

人类的发音是从贫乏到丰富逐渐发展起来的。ELLP4225 上说,“人类漫长的听觉进化史可以追溯到六千五百万年前的白垩纪。”对于中国人来说,这个问题非常容易理解。因为,汉语的发音与字形脱钩的,谁也不会妨碍谁。可是,拼音文字就不同了。拼音文字的优点就是由几个‘标准’发音来组合成成千上万的声音。在古希腊时代,学者们绞尽脑汁寻找‘标准’的发音,认为只有找到最最准确的基本标准发音,才能在形成各种组合的时候,清晰无误。

到了十九世纪的时候,出现了新语法主义,Neogrammarian认为,一切语言中的声音都是根据某种规律向着某个方向变化的。如果是这样,那么就等于说声音种类的数量会越来越少。因此,出现了很大的争论。 (ELLP4059) August Schleicher (1821-68; see Schleicher, August) had taught emphatically that language history consist of two distinctly separate periods: 1. History of language formation; prehistorical period; 2. History of language decay; historical period’ August Schleicher高调地将语言学历史分为两个不同的时期。1、语言形成的历史;史前时期;2、语言的衰败阶段;文明史时期。与他同时代的Scherer 则坚决反对这种观点,认为根本不存在这样两个时期,而自己研究的是不断发展的语言。

从此可以看出,第一派认为,在没有文字的史前时代,人类发音可以自由发展,因此是语言的发展阶段,是一部语言的形成历史。新语法主义认为,任何一个单个声音的出现,不会是集体行为,而是某个人,某一天发出一个怪声,后来逐渐被越来越多的人所接受。而当文字(字母)形成以后,追求完美发音的书写符号限制了人类发音的自由发展,因此,语言开始退化,这就是所谓的第二个时期。而Scherer的反驳也没有任何有力的依据。

西方语言学虽然看到字母限制了声音的发展,同时,也感觉到,声音不发展使得表达效率降低,但是,依然无法看清楚语言发展的发展与社会进步之间的联系。ELLP4053表达了这种彷徨的心理“没有人提出语音变化的最终目的是什么。只有Lindblom受到进化论的影响提出,有一种普遍存在的动力在改变着发音;LindblomMaddieson找到几个证明,比如语言喜欢采用简单音而非复杂音。 ”其实,他感觉到的动力,就是语言的效率。

于此相反,汉语由于没有采用拼音化改造,五千年的发展绵延不断。因此,汉语声音种类是不断发展的,目的明确,不但增加了元音(韵母)的使用数量,还发展了对声调的应用。商周时期的汉语只有长、短两种声调。后来,逐步变成了五声,甚至有些地区出现了六声、七声等。直到成吉思汗率领蒙古大军占领了中国,由于蒙古人当时使用的是没有声调的语言,一时无法区分那么多的声调,因此,普通话最终以四声确定下来。换句话说,普通话的四声是无论拼音文字还是象形文字使用者都能够准确区分的声调。而中国南方地区,虽然有些语言中的声调比普通话多,但是,就连当地很多人中都无法准确的分辨出这些声调来,更何况其他地区的人群?除此以外,南方各省的发音中缺少了zhchshxr等也说明没有与其他语种碰撞过的语言,其发音含有一定的缺陷。还有就是,各种音素的重复使用率也是选择通用语言的一个非常重要的标准。什么是重复使用率?在我们的语言中,各种基本元素都可以不断的被利用(表达不同的意思)。正是由于各种元素的不断被使用才使得语言有了简化的可能。比如说,各种语言中辅音(声母)与元音结合形成各种辅-元节CV syllable。它们的形成可以用数学的乘法进行计算。也就是说,从理论上讲,某种语言中的n个辅音和m个元音相乘,积就是该语言承认的发音个数。但是,在实际利用上面,并不是按照计算结果来完成的。比如,普通话中有21个声母(辅音)、35个韵母(元音)、4声。联乘的结果应该是21x35x4=2940种不同的声音,即使去掉相重的声音(如xongxiong)也该有2500种不同的声音。但是,实际利用的声音只有1200种,不到50%

再看英语,由于还没有人将英语用国际音标的声音进行过统计。另一方面,原则上,英语26个字母都能发音,所以我们只要查看一下26个字母组合的情况就可见英语发音的使用率的一斑:

目前,英语单词的数量已经突破一百万。而这一百万单词都是由26个字母组成。用26个字母组词,每个单词平均需要多少个字母呢?

26×26=676

26×26×26=17,576

26×26×26×26=456,976

26×26×26×26×26=11,881,376

这就是说,每个单词只需要四个字母就能组成四十五万个单词所需要的符号,五个字母就能组成一千一百万个符号。但是,实际上有很多的概率没有被利用。从:

http://www.trussel.com/scrabble/2words.htm

上看到,由两个字母组成的单词仅有105个,105/26×26=105/676=0.15532, 利用率仅仅 15%

http://www.wordfind.com/3-letter-words/

由三个字母组成的单词1015个, 1015/26×26×26=1015/17,576=0.05775, 利用率仅 5.7%

http://www.wordfind.com/4-letter-words/

由四个字母组成的单词4030个,4030/26×26×26×26=4030/456,976=0.00881884, 利用率仅 0.8%

利用率低,就等于每个单词使用的字母多于计算值,利用率越低,每个单词使用字母的数量就越多。

中国南方各省的语言中,如果按照数学计算的话,其声音种类要比普通话多,但是,实际的使用率却与普通话的1200种相差无几,这就是说,南方各种语言的声音使用率低于普通话。由此证明,普通话比南方语言容易学习(可以反复利用的基本元素多就等于需要学习的内容少。最佳的人类语言应该是不学而知的语言,由于这个目标无法实现,于是,我们转而求其次,寻找一种少学多知的语言作为通用语言)。

为了表达清楚以及与数学相结合,人类的发音种类有必要和解析几何的坐标相联系。辅音的个数用x轴表示、元音的个数由y轴表示、声调的个数由z轴表示。

菲尼基人发明的辅音字母只有22个,因此,他们的语言中,只承认22个声音。也就是说,x轴上有22个数值。Y轴上的数值是1(因为任何声音都必须有元音的伴随)。而z轴上的数值也是1(任何声音中必须有声调)。

关于声调的研究,在西方语言学中是与重音联系在一起的,为了这个探讨,加之西方国家不熟悉这方面的内容,他们真是煞费苦心。但他们似乎一直没有发现,或者他们不愿意承认,重音也是‘声’的一种。P3417“每种语言在发明和形成声音时都要考虑说与听两者在器官上的关系。还要考虑表达的准确性。将重音与声混为一谈就使很多现象无法解释。”ELLP3158:“19341937年之间,J.R.Firth发表了最初的几篇文章来描写这种语音学,有人称它为‘韵律分析’prosodic analysis”他利用辅音C和元音V最先发明了‘互融音节’syntagmatic syllabic structure和‘一个发音种类’one articulation type这两个术语。”这就是所谓的非线性音位学。它与国际音标中将辅音与元音排列在一起的做法截然不同。此后,非线性音位学得到了进一步的发展ELLP2824:“非线性音位学是代表二十世纪末一种音位学的潮流,从形式到理论的术语。它的方法是将语音看做是包含许多同时出现的性能或特征,这些性能或特征是分别排列在不同层面,或者信息通道上的。‘非线性’这个术语代表在不同层面上的各种特征之间的相互关系并不是按照时间顺序一个个地表现出来。它们可能是互相交融,混合地出现,某一层面上的一个单体可能与其他层面(这里所说的层面就是本文中所说的‘维’,只不过‘层面’这个词不容易与数学结合而已)上的单体同时表现出来。非线性音位学强调用详述表达系统能力的方法提供对于音位学中周期出现的某些特性的简洁,非任意性的解释。 --非线性音位学可以被看做是对于长久以来,西方学术对于音位学看法的反叛。这种传统看法认为音素是按照时间轴从口中一个一个地被发出来。这种看法从古菲尼基和希腊时代就已经开始了。直到后来,Saussure把它具体化成为线性信号的原则。--这种传统看法的后果是没有考虑到在拼音文字中没有表现出来的一些极端现象,比如‘声’,重音,韵律和其他的‘超节片’suprasegmental等与拼音文字不相适用的现象。”

为了说明声调、与辅音、元音的相对位置,西方语言学家甚至使用乐器的合声来解释这一现象。

上面说过,商周时期,汉语里面只有长、短两声,有点类似于现代的日语。而英语的声调则是在最近几百年刚刚出现。大约是14世纪到15世纪左右,英语开始出现了一次所谓的元音大挪移Great Vowel Shift经过这次变化后,英语才有了今天的长、短元音。长短元音的出现就表明向着声调发展的开始。P2607 在讨论人们称之为Great Vowel Shift 的时候,举例说明这个变化使得某些音节可以被省略。它的目的无非是希望缩短发音时间而已。该文没有给出具体缩短的公式,并认为这个缩短不重要。但是我根据前面提到的,英语与AB语言对比的公式认为,长短元音的出现,缩短了整体的表达时间。该文没有说出变化的动力以及经过。我给出的动力是这样的,开始,人们希望用ma这样一个声音表达两个不同的意思。怎么办?唯一的办法就是将一个声音拉长,另一个保持原状。经过一段时间的使用以后,人们发现,即使不拉长,两个声音也能区分(区别就是声调)。也就是说,通过实践,人们发现了声调的作用。直到今天,英语中的长短元音已经完全失去长、短的特征,取而代之的是声调的变化。短元音类似于汉语的一声,而长元音类似汉语的四声。

辅音、元音和声调是人类发音的三个不同的阶段。人类的发音是从少到多,从贫乏到丰富发展起来的。在古菲尼基人以前的时代,辅音是一个一个发展起来的,当发展到22个以后便基本上到达极限。于是,由古希腊人继续发展元音。它与辅音的不同在于,声音不是一个一个的增加,而是一倍一倍的增加。比如,在菲尼基人那里,bedeme是三个不同的声音。但是,与元音aiaio结合以后,就出现了十五种不同的声音。菲尼基人的22个辅音字母如果与五个元音结合就会出现110种不同的声音。根据公式,这种新的语言能够帮助人们记忆更多的事物(词汇)而且大大的加快了思维的速度。


声调的作用则是在这个基础之上更进一步地加大了记忆能力以及思维速度。举例来说,拼音文字中的ma在承认声调的语言中则变成四个mā、má、mǎ、mà。

2016年7月16日星期六

国际音标的谬误

我们这里提到的‘语言学百科全书’是The Encyclopaedia of Language and Linguistics (简称ELL)该书的主编R.E.Asher在内容介绍中这样写到:“在各个学科出版百科全书似乎是二十世纪最后二十年中,各学术及科技出版机构的特点。值得注意的是,在众多的学科中,语言学也占有一席之地。从八十年代到九十年代,已经有几部从一卷到四卷的类似著作出现。这说明了语言研究的重要性以及它在一系列交叉学科研究上的地位。在撰写‘语言学百科全书’The Encyclopaedia of Language and Linguistics时,我们承诺要比以往的著作具有更宽阔的视角,更雄心勃勃的计划,更加可靠,明晰,现代化和国际化--本书的执行编辑有34人,撰稿人超过一千位。他们来自75个国家。一共是2,400篇文章。”的确,这位主编没有吹牛,它甚至比后来的百科全书更有价值。

书归正传,国际音标的谬误在于它把辅音与元音看作是分别占用不同时段的声音,即所谓的线性linear发音。而其实,两者是同时、叠在一起被发出的。‘语言学简史’A Short History of Linguistics P23:“伯拉图最先分离出与辅音相对应的元音,他认为两者的区别在于元音是连续音continuants,而辅音是停顿音stops目前我们所说的‘塞音’即源于此。他发现如果辅音的一侧没有元音的话就不能发出声音。伯拉图曾经将声音的元素分成三种1、元音,2、即非元音,也非杂音的称为‘塞音’或‘闭止音’stop consonants3、界音intermediate一种含杂音而非辅音的音如lmns, dzksps。戴奥尼修斯Dionysius Thrax是拼音世界语法的奠基人。他的Tekhne Grammatiké 据说是当今一切语法书籍的始祖,书中将伯拉图分类中的23合并成为‘辅音’。”

  古希腊人的种族偏见很深,认为希腊语的发音是‘神’的传授,一切非希腊语的语种均为野蛮语言。在这种影响下,谁都希望自己研究的发音尽量‘纯正’,尽量符合‘文明’的标准,也即尽量贴近那几种被公认了的声音符号。谁也不愿意被人说自己的发音属于杂音及野蛮音。另一方面,当时的学者们普遍认为用‘杂音’,‘野蛮音’难以准确的表达意思。希腊人对于洪亮的声音十分重视,有人把话剧演员在戏台上发出的,能被最后一排听众听到的声音作为标准发音。而所有的被公认的发音都经过许多人描述过如何开口,如何运动舌头,如何摆正喉咙及鼻腔,如何呼吸。其实他们的目的是要求使用者迁就某些人为的标准。

既然从柏拉图开始,古希腊人就知道,没有元音的存在,任何声音都不能够被听到;也就是说,辅音是不能独立的被听到的。但是,国际音标却违背了这个常识;它将辅音看作是一个可以单独被听得到的音素。这个看法使得西方国家对于发音的看法完全违背了事实。因为,将辅音看作可以独立的声音以后,一行既有辅音,又有元音的字母就成了可以个个被听到的声音排列体,换句话说,不应该称作拼音文字,而是排音文字。事实上,da是与d-a完全不同的声音。用实验方法也可以对国际音标的认识做出否定。我们知道,每个声音的长度基本上是200240毫秒之间。我们将一个声音录音,然后把它分割成一个个40毫秒的片段,再将每个片段反复复制并连接成240毫秒后,我们就会听到,不论多么短短da中的a是一定存在的。换句话说,在da中,da是同时从口中发出来的。

正是由于国际音标的错误认识,导致此后的西方语言学误入歧途。那么,为什么国际音标要这样解释声音呢?根本的原因还是因为找不到语言的标准单位。国际音标起源于十九世纪末。那个时代,数、理、化的长足进展使人们感觉到,任何事物都是可分的,而且分解后更容易找到具有共性的单位。既然几千年来人们寻找声音组合的单位没有成功,那么,就有人想,是不是将声音分解后,在更短,更小的基础上,就能够找到统一的声音单位呢?于是,语言学家否定了希腊人的说法,硬生生的给辅音一个独立存在的时间段。

直到二十世纪初,西方国家中才有人提出应该将发音看作一个个不连贯的单体。这一派的音位学称为非线性音位学nonlinear phonology ELLP2824,索绪尔Saussures“认为从菲尼基时代,印-欧对于发音的认识便是音位学phonology。它主要研究几个音连在一起时的作用。但是,到了二十世纪后期,人们对英语的重音及汉语的声调等被称为超节片suprasegment(赵元任将它译成‘上加成素’)的元素进行研究后,提出了对线性理论的反驳意见。一些人认为,人类说话时发出的声音是一组具有相同的性质或特征的单体,它们同时排列在不同的层面或通道上而不是依次按时间先后排列,由于没有先后之分,它们相互之间不会由于前面的音影响后面的音或者后面的音影响前面的音。”(有些类似汉语发音)但是,由于印-欧语言中的大部份单词发音无法将一个个的音分得很清楚,所以,这一派学者又加上新的条件,就是,所有的字母之间可能有一种复杂的相互交搭的现象。这一派学者的主要出发点是希望可以更加详尽地简单地描述语音,用一种更加有规律而非任意的方法重新解释语言。这一派的学者有EllisBellSweetSieversJespersen。线性派与非线派的根本分歧在于前者认为音素必须联在一起才能被发出来,而其组合是条件组合。后者认为发音是分离的,其组合是无条件组合。

  二十世纪三十年代,非线性音位学受到另一派的挑战。该派认为:发音依然是线性的但是其目的仅仅是为了找到一个单词与另一个单词之间的区别而已。一个单词与另一个单词的真正区别,往往就是一个简单的音素如badbed。这种能够使两个单词区分开来的音素称为特征原子。如Bloomfeild所说:“我们可以将一堆或者一束发音中真正起到区别作用的因素称为音素。”由于印-欧学者将辅音及元音称为节段segmental而将声、语调和重音称为超节段suprasegmental这种分类方法使得非线性派无法解释超节段在发音中的作用,因为既然发音是一个个蹦出来的,那么如何将语调切成一段一段的与它们相适应?但是特征派就可以将超节段也解释成为一种类似音素的发音成份(中国人当然不会想到西方人在理解声调时的困难)。美国麻省理工学院的乔姆斯基Chomsky对二十世纪下半叶的语言学曾经起过重要影响,他与Halles合著的<英语发音类型>Sound Pattern of English则希望将两派作一个折衷,认为应该将发音分成XY两个轴来考虑,横轴X代表发音的特征,纵轴Y代表音素。不过很少有人能明白它们的具体含义。

我们已经说过,辅音实际上是一种听不到的口型。但与元音结合后的辅音,其特征性特别强。或者说,在辅-元结合体中,人们最先识别的是辅音。而元音延续的时间长,或者说,辅音本身没有时间,所以听不到,元音给了它时间,所以能够使人共同被听到。此外,当我们将一个辅-元节拉长到数秒钟以后,辅音会完全消失,仅仅剩下元音的存在。比如,在da这个声音中,坚持两秒钟后,只能听到a的声音。因此,我们可以说,辅音的爆发力强所以特征性好,而元音的爆发力弱,但是耐久力好而坚持到了最后。这个特性给国际音标的制定者造成了一个错觉,认为,辅音在前,元音在后,消耗的是两个独立的时间段。拼音文字的书写方法也加深了这种印象;也就是辅音在前,元音在后使人误以为两者是相互独立的。

古代的中国早就发现了这个问题;也就是:辅音实际上是一种无法被听到的口型,而不是声音。因此,古代中国的注音方法是切音也就是用一个元音(韵母)来切换出另一个字(辅元结)的元音。直到今天的汉语拼音,依然是用一个元音(韵母)来切换声母中的元音。比如b这个音,实际上是bo的声音,辅元两个字母同时发出,不可分割。与a的拼音实际上是用a切换出o成为ba。根据这个结果可以推测出来拼音文字的字母与发音之间在几千年的时间里发生了怎样的变化。首先,要说明的是,西方国家的拼音文字系统起源于古代地中海东岸的菲尼基。在菲尼基人以前的古代文明古埃及和古巴比伦使用的都是象形文字。菲尼基人发明了用22个辅音字母来组合所有的单词。这些所谓的辅音字母,实际上是带有元音的辅-元结;也就是类似汉语目前的声母。后来,古希腊人引进了菲尼基的拼音字母,作为书写符号。在这个过程中,古希腊人发现(察觉到)了自己的发音系统中,有一些无法用辅音来表达的成分,这就是元音的变化,希腊人在菲尼基字母的基础上创造了几个新的字母,并将它们称作元音字母。希腊人一直为自己的这种突破感到骄傲,所以后来,他们最先发现,没有元音的帮助,辅音其实是无法单独存在的。但是,元音的发现,又给希腊人出了一个难题;如何将原有的辅音字母与新发现的元音字母排列在一起?最能被接受的假设就是将元音字母插进原有的辅音字母之间。为了区别跟有元音字母的辅音与不跟有元音字母的辅音,就将后者读得轻一些。由此可知,这些读得轻的辅音最初应该有与现代的一个辅、元音结(声母)一样的时间。而如今,它们只不过是退化的声母而已。但是,由于在发音的时候,它们依然占用了一定的时间,这就使得拼音文字中每个音节的发音无法在时间上统一。

对于中国人来说,很容易理解辅音-元音是同时发生的,但习惯于用音节’syllable来描述声音的西方人,由于缺少一个(后文介绍)所以在理解辅音与元音同时发出时,有困难,他们只能寻找较为形象的比喻,某些学者用乐器的合声来比喻辅音-元音的结合体P3417。他们还为这种声音创造了一个单词syllbary

西方国家自从被国际音标裹挟着承认了辅音的独立地位以后,再去理解古代菲尼基拼音字母,以及汉字的时候,就没有办法理解了。如果古代菲尼基人如果使用的是一个个读得很轻的声音,那么,有好多事情就没法解释。比如,为什么古菲尼基人先将语言中特征性最强的一类声音分离出来,却有轻读?根据历史记载,菲尼基人是优秀的水手和建筑师。试想,当他们与大风大浪搏斗的时候,集体吃力的拉起沉重的石柱时,怎么会用读得很轻的辅音交流?


国际音标的出现也是寻找单位。他们违反了希腊人提出的常识没有元音的声音是发不出来的。以上的种种混乱,从反面说明,语言学的基本标准和单位,不能由拼音语言来制定,只能是汉语普通话每个字的时间长度。只有这样,语言学才能与时间单位联系在一起。

2016年7月8日星期五

欧洲建立语言标准的努力

语文和数学是小学必学的课程,也是一个人认识世界的第一步。没有这一步,其他的一切免谈。数学是一种比文字更加奇妙的表达方法。凡是由数学表达的世界,无论是‘其大无外’还是‘其小无内’都可是用一个公式使人一目了然。此外,由数学表达的世界虽然是一个变化的世界却又准确无误,不会出现任何歧义。但是,在数千年的时间里,中国的儒家教育中几乎没有数学的影子。也就是说,中国人理解语言现象的时候,缺少了一个关键的工具。中国人用几何来理解语言,最多只认识到了不以规矩,不能成方。但是,早在公元前500年,古希腊的毕达哥拉斯就提出了万物皆数的概念。正是这个概念推动力现代科技的发展。可想而知,西方人是多么希望用数学来描绘语言现象。
从公元前三世纪开始,这个想法就已经出现。在R.H.Robins所著的A Short History of Linguistics ‘语言学简史’1997年第四版,第29页上有这样一段话,古希腊的语音学和音位学虽是严格区分开来的。它们却都建立在说与写混同的基本单位composite unit之上的。我们可以把它理解为带有语音学意义的字母。
尝试对于发音的规范,产生了音节这个单位。”
这里最重要的就是composite unit它是将具有差异的事物放在一起考虑的单位,举例来说,一个苹果和一个梨是无法计算的,除非统一它们的单位,比如水果。从此可以推断,古希腊人建立的语言学单位,实际上是要为了进行计算做准备的。遗憾的是,直到今天,这个准备也没有完成。百科全书在总结当代语言学的时候悲惨地写到(P3189):“由于(形、音、义中)没有一个因素是确定的,当然也没有一个因素能够被这些不确定的因素所确定。”而发音是音、义、形三者当中,最可能的突破口。发音是一切语言的最原始的形式。它的重要性至少从语音学、音位学一直延伸到了词法学的研究。在语言学百科全书第2573页上的‘词法历史’Morphology History中认为:“从古希腊的哲学家直到现代的自生语法学派,词法的含义已经从注重词法的逻辑结构转变到注重其音位学上的形式了。”新语法主义则进一步认为,语法实际上是以词法及句法上的各种变化来适应发音上的变化需要。P4301这样写到:“在人类发展史中,说话先于书写的事实被许多现象所证明。比如,没有任何一种语言只有书写文字而不能被发音表达,但是有很多语言能够被说出却没有文字。从婴儿先学说话,后学写字的现象我们也能发现这一点。” P43081970年,ChappaniesJohn Hopkins大学(baltimore USA)对人际交流的各种方法如:声音,手写及录象等对比发现,声音是所有交流中最快的手段。” “不论古代那些高不可攀的学者将语言看成怎样的哲学对象,说到底,它研究的不过是一个个单独的字母--并通过它表现的一个个的声音单位--语言学家应该从这些最基本的材料入手才能够得到最可靠的结果。这是经过人类无数次经验,尝试,错误和挫折后才得到的认识。”P3479“将各种语言进行进一步的比较,使我们更加体会到发音规律及其类推原则,是在同一基点上理清各种语言,方言发展头绪的钥匙。”P4058OsthoffBrugmann提出:“只有以声音为基础的研究才是最踏实的科学研究。”虽然我们知道了发音的重要性,但是,问题依然没有解决,有人比喻这种现象就好象是盖房一样;当基础还是摇摇欲坠的时候,没有理由再在上面添砖加瓦。虽然如此,到目前为止,无论是东方还是西方,大多数语言学理论都是将古代的理论从新整理,或者用新的方法叙述。因此,了解一下古代的语言学理论是有必要的。在柏拉图的对话Cratylus中苏格拉底与一个希腊青年讨论了语言的起源,重点是单词的词形与词义之间的联系。讨论的焦点在于,词形的产生是与大自然紧密地联系在一起呢,还是约定俗成,由大家公认的符号?对话的双方都有各自的道理。但是最终没有得到任何结论。      此后,自然主义的斯脱爱克斯Stoics(这个词本身就有“道”或“理由”的意思,而且,它的教义也很像中国的道教)学派认为“词汇是自然形成的,词汇的第一个声音就是模仿它们所代表的事物。”有人称这样形成的文字是象声文字Onomatopoeia。斯脱爱克斯学派认为‘模仿声音’是所有基本词汇的来源。这个观点很可能是受了古埃及象形文字的启发而得到的。一个来自客观的自然界的词汇的产生是任何成年人都能凭自己的认识而得到的,只要遵守客观的规律,不必要和谁商量就可以决定。它也表现了古希腊人对自然美的追求。如果它能成立,那么语言的异化问题就有可能解决,因为,大家都以同样的客观的标准来改进自己的语言,迟早是要归为一统的。斯脱爱克斯学派侧重自然主义立场与他们侧重于自然是指导真正的人生的唯一依据的立场一致的(道法自然)。但是当古希腊人将眼界伸展到其他语种的时候,他们发现,象声主义的声音符号所扮演的角色实在是太有限了。更多的词汇是任意或者人为地产生的。因此,亚里士多德则否认这个观点。他提出,如果拼音文字是一种象声文字Onomatopoeia,那么为什么各国语言中,代表同一事物的词汇发不同的声音?亚氏认为,词汇是人们互相之间的一种约定、公认或习惯。同一组声音,人们给它赋予什么意思,它就代表什么意思。对于亚里士多德学派来讲,语言是一套由习惯而产生的交流工具。它与其所代表的世界是截然分开的。亚里士多德坚定地捍卫了惯例主义的观点:“语言就是惯例,因为没有任何名字是自然产生的。”象声主义无法否认这一事实,因为象声文字在每种语言中都不一样,而且每种语言中声音的排列也不一样。还有一个事实就是,新词汇怎样从旧词汇创造出来的问题。这方面的研究被称为词源学Etymology。亚氏认为,既然词汇是约定、公认的,那么它们就可以进行人为的更改,一旦这种变更被人们接受,语言的效力依然没有改变。而斯脱克斯学派的词源学理论则更注重研究词汇的原始形式,这种研究认为,象声文字是词汇的最初形式,但后来这些最初的词汇经历了各种各样的变异。斯脱克斯学派的词源学是希望将语言追溯到一个无需证明的“自然”之源,因为在自然主义的眼里,仅仅是时代改变了词汇的最初的形态。可是,说来说去,欧洲语言的语音单位是音节。每个音节的关系就好比苹果和梨的关系,无法用一种类似水果的单位统一起来。比如,a是一个音节,be是一个音节,left是一个音节,sprint也是一个音节。它们的共同点就是,每个音节中含有一个元音。除此以外就没有其他的共同点了。音节的定义多少与希腊人想炫耀自己是元音的发现者有关。但是,单词中的元音无法成为语言学的基本计算单位,因为,它们与时间或者空间没有确定的关系(不像普通话中的字,与时间严格的对应)。为了能够找到可以计算的,统一的单位,西方国家发明过不少单词来描绘声音。比如segment‘音段’ variphonefacultative variantcombinatory variantfree variant archiophonememorphophophonemicmicrophonemetonemechronemejuncture phoneme等等词会。这些词汇在普通的词典上都不收录,可见当时人们讨论语言的时候是多么的投入。从此也能看出,为什么整个西方世界研究语言的作品总字数远远超过二十四史的字数。

各个时代都有人希望从象声文字的角度来解决问题。百科全书P4067列举了这种想法不可能的一面:英语中的杜鹃是cuckoo,显然是根据它的叫声来创造的,但是法语中的杜鹃却是coucou,西班牙语cuclillo,意大利语cuculo,罗马尼亚cucu,德语Kuckuck,希腊语kόkkyx,俄语kukushka;非印欧语种中有:凶亚利语kakuk,芬兰语käki。而鸡叫声的单词也不一样,英国鸡的叫声是cockadoodledoo,瑞典鸡kuckeliku,丹麦鸡kykeliky,法国鸡cocorico,西班牙鸡coquelico。打鼾的声音在英语中是 snore德语中是schnarchen,荷兰语中是snorken,拉丁语中stertere,法语ronfler,西班牙语roncar,俄语šeptat’,凶亚利语horkolni,土耳其horlamak

2016年7月2日星期六

责无旁贷的中国标准

多年来,人们总提一个问题:为什么世界上所有的科技标准都是西方国家制定的?中国人难道不能提出一些标准吗?我的答案是:当然能,今天我们就讨论一个必须由中国人来制定的科技标准;责无旁贷的标准。
先谈谈什么是科技标准。为了叙述一个标准,必须有可以比较的单位。没有单位的标准是无法进行数学比较的。我们熟悉的单位比如米,秒,达因,牛顿,吨等等,无不伴随相应的标准而产生。由于这种用数学计算单位的做法实在太精确了,以至于从古希腊开始,人们就希望用相同的办法来计算语言。这就是语法产生的初衷,但今天的人早就偏离了这个思路。
根据时代的发展,单位的标准还经常变化,比如,过去的长度单位,在中国是尺,在英美用英尺。1793年,法国制定了以通过巴黎的子午线上从赤道到北极点距离的千万分之一作为标准单一米。当时是保存在巴黎天文台的一根以铂制成的金属作为单位,而1983年至今,米的长度已经被定义为光在真空中于1/299792458秒内行进的距离
没有标准,什么事情也说不明白。大家只能鸡同鸭讲,谁也别想说服别人。不要说别的,就是螺栓与螺母之间的配合也要出问题。
回到我们的话题,到底什么标准必须由中国人来制定?答案是语言学的标准和单位必须由中国人制定。因为普通话有一个特性:每一个汉字都发一个完整的声音,所用的时间基本一样。其他任何语言都没有这个特性,因此,其他语言都不能计算,也不能作为单位。信息时代什么最重要?很多人第一反应就是电脑和互联网最重要。但那是已经解决的问题,没有解决的问题就是语言问题,没有解决的问题当然是更重要的问题。并不是西方国家不想解决,是他们解决不了。新千年开始的时候,联合国曾经展望世界未来的八大挑战,其中第四条谈到了文化和语言的平等问题。文化的平等,多元文化主义可以理解。但是,什么是语言平等就没人说得清楚。原因是,没人知道怎样做才算是语言平等?是指使用时间上的平等还是指实际传递的信息量上面的平等?下面的这个例子,我们曾经讨论过,但为了初次见到本帖的人考虑,我还是把它放在这里:
假如有一种语言,它只有两种声音AB,我们称它为AB语言。它工作起来就像是摩斯码一样。它的特点就是在效率上远远低于所有的自然语言。英语承认400种不同的声音(国际音标中,英语大约有20个辅音和20个元音,两者相乘,大约400)。假设世界上仅有400种不同的事物需要命名,那么,英语就可以用任何一个声音来命名400种事物之一。而AB语言的使用者却不得不用9个声音来命名400种事物之一。因为2×2×2×2×2×2×2×2×2>400。相应的AB语言用类似ABBAAABAB来表达一种事物。由于每一个声音都消耗相同的时间,那也就是说,一辈子活下来,AB语言所能享受到的信息,仅仅是英语使用者的九分之一。或者说AB语言的使用者需要有九条命才能享受到英语使用者一生享受到的信息量。如果说是语言占用时间的平等,那么,AB语言享受到的信息量就只有英语的九分之一,这种语言的使用者在未来受到英语压迫的可能性大大增加。但如果是信息量的平等,那就只能将AB语言变成和英语一样的语言。

由于上面这个问题说不清楚,所以,联合国提出的问题根本就是一个不实际的问题。说得更确切一点;如果理论问题不解决,在没有标准的情况下,任何人的发言,不过是一些外交辞令而已。所以,要想把问题说清楚,还是回到我们的主题,为什么要建立语言学标准。