東西問 | 王兆鵬:唐詩宋詞能否用大數據解讀?
中新社成都7月11日電 題:唐詩宋詞能否用大數據解讀?
——專訪四川大學文科講席教授、中國詞學研究會會長王兆鵬
中新社記者 賀劭清
白居易詩作量位居唐代詩人之首,影響力卻沒進入前十;宋詞名篇最多的不是蘇軾、辛棄疾而是周邦彥;綜合影響指數表明,杜甫高于李白、辛棄疾強于蘇軾;張若虛《春江花月夜》、陸游《卜算子·詠梅》在近現代才開始受矚目……用大數據來顯示和驗證唐詩宋詞,結論超出很多人的想象。
唐詩宋詞是中國文學史上的兩座高峰,但屬于美學范疇的唐詩宋詞能否用大數據解讀?大數據研究唐詩宋詞取得了哪些新發現,又有什么局限?四川大學文科講席教授、中國詞學研究會會長王兆鵬近日接受中新社“東西問”獨家專訪,作出深度解讀。
現將訪談實錄摘要如下:
中新社記者:唐詩宋詞是中國文學史上的兩座高峰。從大數據看,唐詩宋詞是否達到空前的高度?分別有什么特色?
王兆鵬:數據顯示,唐詩宋詞作家、作品量均達到了空前的高峰。目前流傳下來的唐詩超過5萬首,而東漢到隋末近600年的詩歌一共才5000余首。唐詩比之前的八代詩增加了7倍多,詩人由600余位增加到3000多家,詩人和詩作都達到了前所未有的量級。
宋詞是中國詞史上第一座高峰,有詞人1497家、詞作21085首。相較唐五代,詞人詞作都增加了10多倍。宋詞用調近900種,在唐五代詞的基礎上增加了700余種。詞調多,意味著詞體的豐富。唐五代詞人中唯溫庭筠、馮延巳、李璟、李煜有詞集傳世,而宋代則有300多位詞人有詞集流傳。詞人有詞集傳世,意味著作品多、知名度高,社會需求量大。宋詞之所以流傳數量不如唐詩,其中一個重要原因在于宋詞是通過口頭傳唱,相當于現在的流行歌曲。口頭傳唱的作品,好多已失傳。
衡量文學發展,作品數量是一個重要方面,但最關鍵還是要有精品。要說中國歷史上產生偉大詩人、詞人最多的朝代,無疑是唐宋。雖然現有技術還難以準確衡量作品藝術價值的高低,但可以用大數據來衡量作品影響力的大小,分析出哪一首作品最受大眾歡迎。
中新社記者:唐詩宋詞屬于美學的范疇,為什么想到用大數據分析唐詩宋詞?
王兆鵬:給文學作品排座次、定甲乙,并不是今天才有的時尚,而是古已有之。最早給詩人區分品第等級的,是南朝梁代的鐘嶸。他在《詩品》中將漢魏以來詩人分為上中下三品,以評量其優劣。唐代張為的《詩人主客圖》,把中晚唐的部分詩人分為主、入室、升堂、及門等級別,也是一種品第批評。
在中國古代文學批評中,還常常見到稱譽某人為第一、某詩為第一的。如《宋書·謝靈運傳》說謝靈運“文章之美,與顏延之為江左第一”。宋人許顗《彥周詩話》說“孟浩然、王摩詰詩,自李杜而下,當為第一”。
不過,古人的詩學批評,無論是分品第,還是排座次,都是基于個人的主觀好惡。由于每個人的審美趣尚不同,所以對同一個人、同一首作品,品評往往不一樣。比如,金人元好問、趙秉文和王若虛都推許東坡詞“起衰振靡,當為古今第一”,清代潘德輿卻叫板不認同,認為“推奉太過”。
現代計量歷史學可以用數據衡量歷史,古代文學也屬于大歷史的范疇。既然歷史可以計量,為什么文學不能計量?通過大數據,可以找到一個最大公約數,用模型來分析和衡定,得出相對客觀的答案。
中新社記者:您的十大唐詩、宋詞、詩人、詞人排行榜如何得出?從大數據看,唐詩宋詞里誰的作品最多?作品量多的詩人詞人,是否影響力大、知名度高?
王兆鵬:我們依據詩歌在歷代選本中的入選頻次、被歷代詩論家品評的頻次、被后人追和的頻次和當代學者研究的頻次、被網頁著錄及評論的頻次等數據加權計算,確定一首詩的影響力,并將影響力位居前列的視為名篇。
現在已無法直接考察出在古代李白、杜甫的詩集有多少種、印數有多大,但可以計算杜甫和李白的詩集分別被刊刻了多少種。據此推算,在宋代,杜甫的影響力比李白大得多,有一種說法叫千家注杜,杜詩韓文是所有讀書人的典范。
數據顯示,唐代詩人綜合影響力排名第一的是杜甫,其次為李白、王維。作品量第一的白居易,影響力排在十名之外。而宋詞影響力位居第一的是辛棄疾,蘇軾、周邦彥分別居第二、第三。
影響力大的詩人,擁有名篇也多。一百首唐詩名篇,杜甫獨占16首,李白13首,王維和白居易均享12首。在三百首唐詩名篇中,杜甫豪取52首,占六分之一,李白有38首,王維和白居易共29首。在宋詞百首名篇中,周邦彥奪得15首,辛棄疾獲12首,蘇軾10首,姜夔7首。擴大到三百首宋詞名篇,周邦彥斬獲40首,辛棄疾和蘇軾各占23首,姜夔11首。宋詩百首名篇,蘇軾一人占四分之一,比杜甫在唐詩中的名篇擁有率還高。
中新社記者:詩人張若虛以一首《春江花月夜》“孤篇蓋全唐”,但他只有兩首詩流傳下來。對于這樣的詩人,能用大數據分析嗎?未來會可否用大數據分析外國詩歌?
王兆鵬:現在大家熟悉的陳子昂的《登幽州臺歌》,以及張若虛的《春江花月夜》,其影響力是到20世紀之后才逐漸變大。《春江花月夜》在明清并無影響力,直到王闿運贊其“孤篇橫絕,竟為大家”,聞一多又稱其為“詩中的詩,頂峰中的頂峰”,才將這首詩抬到至高無上的地位。
同樣情況還有陸游的《卜算子·詠梅》(驛外斷橋邊)。毛澤東曾用“風雨送春歸,飛雪迎春到”來和陸游這首詞,一代偉人和領袖以自身政治影響力和詩詞地位,提高了這首詞的影響力。柳永《蝶戀花》(佇倚危樓風細細),在明清之前也幾乎沒有什么影響力,但自從王國維將“衣帶漸寬終不悔,為伊消得人憔悴”列為人生三種境界后,這首詞開始被讀者熟知。
杜甫在盛唐時代幾乎是一個無名小卒。李白出名時,杜甫只是一個普通的文藝青年。他和李白的年齡相差11歲,是李白的“迷弟”,所以可以看到很多杜甫懷念李白的詩,但很少看到李白給杜甫的詩。杜甫去世很多年后,元稹為其寫墓志銘時發現了他的光芒。后來韓愈在《調張籍》中說“李杜文章在,光焰萬丈長”,文壇領袖的推薦又進一步擴大了杜甫的影響力。
有些詩人、詞人,在外國的影響力可能比在中國高。寒山的詩曾經在美國風行一時,在國內反倒沒多少人了解他。在西方,作品被翻譯最多的中國詩人不是李白、杜甫,而是王維;作品被翻譯最多的詞人不是辛棄疾、蘇軾,而是李清照。
文學的發展有一定的偶然因素,比如李清照的作品在宋代有很多種版本,用今天的話來說,宋代很多出版社出版了她的詞集,但到了明代全部失傳。她的作品只能去選本中找,最終只找到40多首。另外,與李清照同時期的女詞人朱淑真,在當時的影響力并不大,但她的幾百首作品反而全部流傳了下來。
也有很多古代紅極一時的詩詞,今天卻無人問津。如歐陽修《蝶戀花》(海燕雙來歸畫棟)、聶冠卿《多麗》(想人生)、周邦彥《側犯》(暮霞霽雨)、王觀《雨中花令》(百尺清泉聲陸續),它們分別在明代22種詞選中被入選17、18、19、20詞,差不多是明人詞選必選的名篇。可到了20世紀,其影響力和知名度降到了最低。個中原因,值得思考與探討。
古詩詞的影響力始終處于不斷變化之中,很難通過一兩條材料得出全面、客觀、準確的判斷,而大數據可以完整展現出一首詩詞影響力的變化。
我從1992年第一次用數據分析古代詩詞,現在數據不斷豐富,模型不斷完善。2000年以后,大數據庫中除了中國不同歷史時期的古詩詞選本,還納入了歐美日韓等海外的中國古代詩詞數據。
目前,我們正建設古今中外詩歌的融合大數據平臺。該平臺已經收集了上百萬首中國古典詩歌,正在收集20世紀以來有中文翻譯的外國詩歌,以及五四運動以來的十余萬首新詩。
沒有一個大數據可以窮盡樣本,但我們希望借助人工智能得出誤差最小的結論。五四運動后的詩人郭沫若、胡適、聞一多,誰的影響力更大?在中國影響力最大的外國詩人是普希金、泰戈爾還是歌德?我們將用大數據說話。(完)
受訪者簡介:
王兆鵬,四川大學文學與新聞學院文科講席教授、博士生導師。現為中國詞學研究會會長、中國李清照辛棄疾學會會長、中國宋代文學學會常務副會長,《宋代文學研究年鑒》主編。主要研究唐宋文學和數字人文,主持國家社會科學基金重大項目2項。已出版《全唐五代詞》《唐宋詞史論》《詞學史料學》等專著十余部,發表學術論文三百余篇。
國內新聞精選:
- 2025年01月10日 18:39:24
- 2025年01月10日 15:01:14
- 2025年01月10日 14:56:16
- 2025年01月10日 10:12:26
- 2025年01月10日 08:50:26
- 2025年01月10日 07:21:31
- 2025年01月09日 17:01:41
- 2025年01月09日 16:55:10
- 2025年01月09日 15:43:08
- 2025年01月09日 12:04:16