我們每天都在說漢語,大量的詞匯在各種各樣的環(huán)境中頻繁使用,到底什么詞使用頻率高?無論是語言學(xué)家還是普通大眾往往全憑感覺。近日,商務(wù)印書館出版的《現(xiàn)代漢語常用詞表》(草案)面世,頭一回全面披露常用詞語家底:當(dāng)今社會(huì),經(jīng)常使用的詞共有56008個(gè)。
這56008個(gè)常用詞中,包括單音節(jié)詞3181個(gè),雙音節(jié)詞40351個(gè),三音節(jié)詞語6459個(gè),四音節(jié)詞語5855個(gè),五音節(jié)和五音節(jié)以上詞語162個(gè)。
常用詞表誕生歷時(shí)10年
早在1998年7月,《現(xiàn)代漢語常用詞表》研制項(xiàng)目啟動(dòng),這是一個(gè)龐雜而艱難的項(xiàng)目,由國家語言文字工作委員會(huì)組織實(shí)施。該詞表是作為國家已經(jīng)公布的《現(xiàn)代漢語常用字表》等的配套規(guī)范,是我國語言文字規(guī)范化、語文教育和研究方面的基本建設(shè)項(xiàng)目。
課題組負(fù)責(zé)人李行健說:“大家知道現(xiàn)代漢語有常用字表,共收入常用字3500個(gè);有通用字表,收入通用字7000個(gè)。但長期以來,一直沒有常用詞表,常用詞有多少?是哪些?一直是個(gè)謎。”而推廣常用詞,對于中小學(xué)語文教學(xué)、掃盲教育、漢語教育、中文信息處理和辭書編纂等都是急需的。
研制工作中大多是白發(fā)退休專家,他們不需要國家經(jīng)費(fèi),迎難而上。他們中有語言學(xué)家、有大學(xué)教授,今年74歲的李行健說:“完全是出于對語言的興趣和社會(huì)責(zé)任感,我們這些老頭兒才樂此不疲。”可是誰也沒想到,這一路走來,竟然走過了10年。增補(bǔ)、修訂,再增補(bǔ)、再修訂,最后才有了放在人們面前的《現(xiàn)代漢語常用詞表》。李行健介紹,常用詞檢測詞頻的語料庫有三種:一是國家語委研制的“現(xiàn)代漢語通用語料庫”核心語料庫,這個(gè)通用語料庫收有4500萬字語料,缺點(diǎn)是有的詞年代久遠(yuǎn),如今已不經(jīng)常使用。二是《人民日報(bào)》2001年至2005年約1.35億字的分詞標(biāo)注語料;第三種是廈門大學(xué)研制的現(xiàn)當(dāng)代文學(xué)作品語料庫,約7000萬字語料,總共2.5億字。
目前我們看到,在《現(xiàn)代漢語常用詞表》中使用頻率越高的詞排序越靠前,使用頻率越低的詞排序越靠后,這種降序排列讓人一目了然。李行健說,研制過程中采取了課題組獨(dú)創(chuàng)的“詞頻頻級(jí)排序法”。由于詞語的來源比較廣泛、各自不同,各種語料都有自己的覆蓋面和構(gòu)成特點(diǎn),詞表中的詞語不能在每種語料中都得到全面顯現(xiàn)。比如,同一個(gè)詞,在三種語料庫中的詞頻就會(huì)不同,有的還差別很大。為了科學(xué)反映每個(gè)詞較真實(shí)的詞頻,采用了頻級(jí)的統(tǒng)計(jì)方法,即將每個(gè)詞語的三種語料的頻級(jí)之和除以三的辦法。這樣就能較好反映出一個(gè)詞現(xiàn)實(shí)生活中的綜合的常用度,在此基礎(chǔ)上,再由專家進(jìn)行人工審核篩選,“也就是說,這些常用詞的出籠是客觀和有科學(xué)依據(jù)的。”
一個(gè)時(shí)代有一個(gè)時(shí)代的關(guān)鍵詞
從56008個(gè)常用詞中,我們很容易觸摸到我們所處這個(gè)時(shí)代的關(guān)鍵詞、熱點(diǎn)詞。
李行健舉例說,在熱點(diǎn)詞中,新中國成立前,“看相、抽簽、算命”,可能是相當(dāng)活躍的詞語,現(xiàn)在已不是常用詞了。解放初期,“土改、統(tǒng)購統(tǒng)銷、合作社、互助組”詞頻相當(dāng)高,如今在常用詞中已不見蹤影了。曾經(jīng)在“文革”中紅紅火火的詞,如“斗爭、階級(jí)、樣板戲、走資派、臭老九”等等很常用、很熱鬧的詞語,現(xiàn)在已經(jīng)退出了常用詞的舞臺(tái),其生命力也隨之走向衰落了。
而如今,“法律、汽車、市場、資金、責(zé)任、成功、精神、文化、價(jià)值觀”等等則變成了出現(xiàn)頻率相當(dāng)高的常用詞。民間詞語收藏家黃集偉認(rèn)為,這些詞與老百姓的生活密切相關(guān),它所涉及的領(lǐng)域一定是社會(huì)的熱點(diǎn),也一定是我們社會(huì)生活變化最快的那部分。比如“價(jià)值觀”,黃集偉就認(rèn)為,這個(gè)詞是常用的中性詞。改革開放后,我們現(xiàn)實(shí)生活中發(fā)生了很多價(jià)值觀的大討論,這個(gè)時(shí)代發(fā)生的許多爭論、爭吵,比如對與錯(cuò)、道德與情感,種種社會(huì)矛盾等,總的來說都隱含著價(jià)值觀的不同。
詞匯是隨社會(huì)發(fā)展變化的,它是社會(huì)變化的一面鏡子。社會(huì)中出現(xiàn)新的事物,如“宇宙飛船、電視、手機(jī)、股票、證券”等等,人們就會(huì)創(chuàng)造出新詞來記錄反映它們。詞語使用的頻度決定于它同人們社會(huì)關(guān)系的程度,所以一個(gè)時(shí)代有不同的常用詞表。
新詞折射社會(huì)生活巨大變化
“真正的語言是活的,它潛伏或奔突于我們生活的方方面面,它不會(huì)像新聞那樣被正式發(fā)布,卻像血液一樣彌散在我們生活的每根血管中。”黃集偉說。正如此言,在《現(xiàn)代漢語常用詞表》中,大量與社會(huì)生活變遷同步的新詞,反映了社會(huì)點(diǎn)點(diǎn)滴滴的變化。
《現(xiàn)代漢語常用詞表》責(zé)任編輯余桂林和記者一起總結(jié)了涉及社會(huì)生活的方方面面變化的一些新詞。
反映政治生活變遷的有“三個(gè)代表、鄧小平理論、三農(nóng)”等。
1978年高考恢復(fù)后,與考試有關(guān)的詞匯多了起來,“自考、電大、函授、博士點(diǎn)、會(huì)考、考級(jí)”等等天天與大家見面。
隨著市場經(jīng)濟(jì)的發(fā)展,房地產(chǎn)業(yè)帶動(dòng)起詞匯的飛速發(fā)展,“房市、商品房、期房、現(xiàn)房、房改、房貼、租房、房源、業(yè)主、二手房”等等,都是許多年前從未見過的新詞。
跟網(wǎng)絡(luò)有關(guān)的詞匯表現(xiàn)最為活躍,新詞呈逐年上升的趨勢。“網(wǎng)吧、上網(wǎng)、互聯(lián)網(wǎng)、局域網(wǎng)、計(jì)算機(jī)網(wǎng)絡(luò)、網(wǎng)管、網(wǎng)卡、網(wǎng)絡(luò)化、網(wǎng)警、網(wǎng)絡(luò)游戲、網(wǎng)民、網(wǎng)頁、網(wǎng)站、網(wǎng)址、發(fā)帖”等,在過去簡直是聞所未聞。
跟金融有關(guān)的詞匯也很多,比如“銀行卡、信用卡、刷卡、按揭、理財(cái)、基金”等。
有關(guān)職業(yè)、身份的新詞非常多,如“白領(lǐng)、藍(lán)領(lǐng)、單身貴族、工薪族、上班族”,不過,這幾年時(shí)興的“金領(lǐng)、粉領(lǐng)”等還未收入,專家分析,可能是因?yàn)樗鼈冞不穩(wěn)定的原因。
和股票有關(guān)的詞語,比如“飄紅、飄綠、熊市、牛市、參股、股市、股利、股民、股息”等足有一大串。
隨著明星對社會(huì)生活的影響力加大,由明星生發(fā)出了諸多詞匯,如“丑星、歌星、球星、童星、舞星、笑星、新星、影星”等。
這些年,在新聞中出現(xiàn)頻率很高的詞匯,如“艾滋病、非典、禽流感”也是常用詞。
而一些大家熟悉的俗語,如“暴發(fā)戶、二百五、三陪”等也被收入其中。
“的”使用頻率最高
56008個(gè)常用詞中,“的”使用頻率最高。
民間詞語收藏家黃集偉集詞歷史足有10年,他認(rèn)為“的”這個(gè)語言文化現(xiàn)象很值得探究。“在現(xiàn)代漢語里,‘的’屬結(jié)構(gòu)助詞,我相信,經(jīng)過很多年,這個(gè)詞依然會(huì)是詞頻很高的詞。”他接著解讀道,“的”字詞組也相當(dāng)常見,比如,打醬油的、撐船的、唱歌的,這時(shí)“的”代指人。
黃集偉曾注意到一個(gè)有趣的現(xiàn)象,江蘇作家程庸寫《官窯美人》,這部25萬字的長篇小說拒絕用“的”,一度為人關(guān)注。黃集偉認(rèn)為,生活中去掉“的”可以,但是會(huì)很不習(xí)慣,一定要換一種表達(dá)方式才行。比如,“這是一個(gè)漂亮的杯子”,去掉“的”就變成了“這個(gè)杯子很漂亮”。 而實(shí)際上表達(dá)的意思已經(jīng)走了樣。
過去許多語言學(xué)家如呂叔湘、王力等,也曾多次創(chuàng)導(dǎo)漢語言要簡潔生動(dòng),臺(tái)灣作家余光中曾作過測試,要看語言簡潔與否,只要看為文,通常20個(gè)字里只能出現(xiàn)一個(gè)“的”,超過兩個(gè)則是啰嗦。
但語言學(xué)家也認(rèn)為,可有可無的“的”完全可以不要,但“的”畢竟是一個(gè)很有用的助詞。《現(xiàn)代漢語常用詞表》同其他詞表一樣,漢語中第一高頻詞就是“的”。助詞在漢語中表示的語法意義非常重要,如果不用“的”是不可能的,不是表達(dá)不清,就是表意混亂或產(chǎn)生歧義。
常用詞表將每5至10年修訂一次
李行健說,現(xiàn)代漢語常用詞將每5年至10年修訂一次,應(yīng)與時(shí)俱進(jìn)。否則,常用詞表很容易邊緣化。
語言是不斷變化的,幾年之后,很多詞會(huì)從常用詞里隱退出來,又有許多表現(xiàn)穩(wěn)定的新詞會(huì)出現(xiàn),因此要密切跟蹤語言的發(fā)展。“我們此次發(fā)布的《現(xiàn)代漢語常用詞表》,雖然詞語統(tǒng)計(jì)用了三種語料庫,但畢竟還有局限,收入的詞語也可能有缺漏,不可能一下做到盡善盡美。所以必須5至10年修訂一次。”
語言專家認(rèn)為,當(dāng)今社會(huì)語言處于飛速發(fā)展期,這與經(jīng)濟(jì)社會(huì)環(huán)境、新觀念、新思想、新事物不斷出現(xiàn)有關(guān)。與過去相比,因?yàn)橛芯W(wǎng)絡(luò)的出現(xiàn),新詞的產(chǎn)生和傳播也更加迅猛,新詞往往開始在小圈子傳,但有不少詞很快在大眾范圍內(nèi)傳播。“不過,大多數(shù)新詞僅是曇花一現(xiàn)。真正有生命力的新詞,需要時(shí)間的檢驗(yàn)。”李行健說。
有人很關(guān)注《現(xiàn)代漢語常用詞表》中收了多少網(wǎng)絡(luò)詞。李行健說:“網(wǎng)絡(luò)詞語能否進(jìn)入常用詞表,有兩道門檻必須逾越。首先它必須進(jìn)入社會(huì)大眾的語言中,其次還要為人們廣泛使用具有很高的使用度,達(dá)到常用詞的標(biāo)準(zhǔn)后才可能進(jìn)入詞表。如”網(wǎng)民、網(wǎng)吧、網(wǎng)址“等就經(jīng)過了上述過程才得以進(jìn)入常用詞表的。
本報(bào)記者 路艷霞
銆?a href="/common/footer/intro.shtml" target="_blank">鍏充簬鎴戜滑銆?銆? About us 銆? 銆?a href="/common/footer/contact.shtml" target="_blank">鑱旂郴鎴戜滑銆?銆?a target="_blank">騫垮憡鏈嶅姟銆?銆?a href="/common/footer/news-service.shtml" target="_blank">渚涚ǹ鏈嶅姟銆?/span>-銆?a href="/common/footer/law.shtml" target="_blank">娉曞緥澹版槑銆?銆?a target="_blank">鎷涜仒淇℃伅銆?銆?a href="/common/footer/sitemap.shtml" target="_blank">緗戠珯鍦板浘銆?銆?a target="_blank">鐣欒█鍙嶉銆?/td> |
鏈綉绔欐墍鍒婅澆淇℃伅錛屼笉浠h〃涓柊紺懼拰涓柊緗戣鐐廣?鍒婄敤鏈綉绔欑ǹ浠訛紝鍔$粡涔﹂潰鎺堟潈銆?/font> |