用戶登錄投稿

中國作家協(xié)會主管

為人文社科研究插上數(shù)字羽翼
來源:中國社會科學報 | 段丹潔 阮益嫘  2021年12月04日08:49
關鍵詞:數(shù)字人文

數(shù)字技術使人類生活方式發(fā)生了翻天覆地的變化,而數(shù)字化應用也給人文社科研究帶來了巨大的驅動力。記錄與保存、創(chuàng)新與傳承、傳播與發(fā)展,人文社科研究利用數(shù)字化技術將實物載體或理論成果,以多元化的形式儲存于數(shù)字空間,在一定程度上打破了研究的時空局限。徜徉數(shù)字的汪洋大海,如何放寬學術視野,拓展研究路徑,成為很多人文社科學者關注的焦點。

數(shù)字邂逅古人浪漫詩詞

一直以來,資料離散和時空分離是古代文學研究的兩大難題,中南民族大學數(shù)字人文資源研究中心主任王兆鵬表示,數(shù)字技術將改變古代文學資料查詢檢索方式,實現(xiàn)從電子文獻的分詞定位檢索到結構化數(shù)據(jù)庫的分類提取,從點狀檢索到網(wǎng)狀關聯(lián),從逐條拷貝到分類打包。數(shù)字技術還可以自動對比識別作品間的互文關系,重建古代文學的歷史現(xiàn)場,提供古代文學閱讀欣賞的嶄新體驗。

“唐宋文學編年地圖”就是一張可以看懂唐宋詩人一生的特殊地圖。登錄該地圖平臺,我們可以跟隨蘇軾的“步伐”,看到他意氣風發(fā)時的作品,也可以感受到其被貶后,在黃州留下《赤壁賦》的心情。點擊切換洛陽,便可發(fā)現(xiàn)有57位詩人曾在此留下了603首詩歌,其中不乏《次北固山下》《芙蓉樓送辛漸》等名篇。借助地圖,我們可以更深入地感受到韓愈“一封朝奏九重天,夕貶潮陽路八千”的痛苦,還能了解韓愈南貶途中經(jīng)行之地的地形地貌。

正是數(shù)字化技術讓歷史上一群人、一代人的活動軌跡同時呈現(xiàn),一個時期的文學生態(tài)、文壇活動圖景由此得以還原性建構。王兆鵬告訴記者,過去我們可能只知道一個或幾個作家曾經(jīng)在某地的經(jīng)歷和作品,有了“唐宋文學編年地圖”,我們就可以了解某個時間點或者時間段內(nèi)所有作家的活動軌跡?!芭c全文檢索數(shù)據(jù)庫僅能提供字詞檢索最大的不同是,文學編年地圖可以提供更多考量維度,提供更多知識點。”王兆鵬說。

錢鍾書先生早在1984年就在中國社會科學院倡導把計算機技術引入中國古典文獻的搜集、疏證和整理中。記者了解到,近20多年來,我國在古籍文獻數(shù)字化和古籍數(shù)據(jù)庫建設方面成就巨大,在一定意義上推動了學術的發(fā)展。但這些數(shù)據(jù)庫的主體內(nèi)容除全文檢索外,并沒有完成更深入的工作。因此,對古籍文獻數(shù)據(jù)庫進行升級換代勢在必行。

新一代信息技術和人工智能技術等,能夠高效抓取研究所需要的數(shù)據(jù)資料,通過智能化的信息挖掘,幫助學者從數(shù)據(jù)中發(fā)現(xiàn)現(xiàn)象或事物的本質(zhì)和彼此間的邏輯關聯(lián)。中國社會科學院數(shù)量經(jīng)濟與技術經(jīng)濟研究所研究員李金華表示,數(shù)字化背景下,需要用全新的思維、全新的方法處理資料和選擇數(shù)據(jù),以此獲得有價值的信息。學者科學解讀復雜信息所蘊含的真義,準確把握經(jīng)濟、社會、文化發(fā)展的規(guī)律、特征和趨勢走向,從而提升人文社會科學的研究水平和研究質(zhì)量。

智慧數(shù)據(jù)之光照進文遺

千年莫高,藝術瑰寶。當敦煌文化搭乘數(shù)字化列車跨入新時代的發(fā)展軌道時,“數(shù)字敦煌”實現(xiàn)了跨越時空的穿梭。

記者登錄“數(shù)字敦煌”資源庫,30個經(jīng)典洞窟,4430平方米絕美壁畫,穿越10個朝代呈現(xiàn)眼前。人們不僅可以通過VR全方位細細欣賞這些石窟,甚至能比直接走進洞窟獲得更為震撼的沉浸式藝術體驗,同時還大大減少了人體、空氣流動以及濕度變化對壁畫的傷害。

敦煌文化遺產(chǎn)數(shù)字化工程積累的海量學術文獻資料與高保真數(shù)字資源,為敦煌文化遺產(chǎn)的保護、研究和傳播提供了良好的基礎保障。近年來,武漢大學與敦煌研究院通力合作,圍繞敦煌智慧數(shù)據(jù)資源建設與服務應用開展了一系列探索性工作。武漢大學大數(shù)據(jù)研究院常務副院長王曉光告訴記者,智慧數(shù)據(jù)和智能計算理念的興起,為敦煌文化遺產(chǎn)的創(chuàng)造性轉化和創(chuàng)新性發(fā)展提供了可能。敦煌智慧數(shù)據(jù)資源建設的主要內(nèi)容,包括敦煌文化遺產(chǎn)主題詞表構建與關聯(lián)數(shù)據(jù)發(fā)布、敦煌文化遺產(chǎn)本體模型設計與應用、敦煌壁畫圖像與遺書文本的深度語義標注、敦煌數(shù)字資產(chǎn)管理與數(shù)字敘事系統(tǒng)開發(fā)、敦煌文化遺產(chǎn)知識圖譜構建與應用服務、敦煌遺書數(shù)字化復原與數(shù)字記憶再造等。

“敦煌智慧數(shù)據(jù)資源建設與服務工作,繼承了‘數(shù)字敦煌’項目的建設目標,不僅能夠進一步支撐敦煌相關的歷史、文學、藝術等學術研究的數(shù)字化轉型,也有利于促進敦煌文化遺產(chǎn)的保護、傳承和傳播工作,提升大眾對敦煌文化遺產(chǎn)相關知識的理解和認知水平,也為在國際上講好中國故事和利用先進技術實現(xiàn)文化遺產(chǎn)保護的中國方案提供了支撐。”王曉光說。

數(shù)字圖書館和數(shù)字出版的發(fā)展,使得數(shù)字形態(tài)的學術文獻資源成為學術研究的主流。如今,學者足不出戶就可以獲得全球各大圖書館的稀有文獻資料。數(shù)字化應用給人文社科研究既帶來了文獻資料獲取的豐富性和便利性,也帶來了方法和范式的變革。

“隨著海量數(shù)字資源的產(chǎn)生和積累,人類文化遺產(chǎn)的范疇也在擴展,并引發(fā)了新的人文學術問題,如數(shù)字遺產(chǎn)、數(shù)字記憶等?!蓖鯐怨庹劦溃诖笠?guī)模數(shù)字文獻資料和專題數(shù)據(jù)庫支撐下,文本挖掘、社會網(wǎng)絡分析、情感計算、數(shù)字化模擬復原分析等各種新興研究方法和研究手段的應用,改變了以往以人文學者個體分析和闡釋分析為主的范式。通過文獻資料的數(shù)據(jù)化和語義化建模,增強了文獻資料的功能可供性,同時也借助各種分析性軟件工具和數(shù)字平臺,提升了人文學者獲取、分析、比對的效率。

引領人文時空數(shù)字化轉換

人類現(xiàn)有的知識將陸續(xù)轉化為數(shù)字形式,再加上數(shù)字世界原生的知識(如互聯(lián)網(wǎng)本身),人們已從知識匱乏變成知識過盛?!稊?shù)字人文》編委桑海表示,數(shù)字時代人文領域的知識轉型,一種是呈現(xiàn)式,即把現(xiàn)有知識通過數(shù)字化方式呈現(xiàn),即知識表示;另一種是研究式,即借助數(shù)字化方式發(fā)現(xiàn)新知,即知識發(fā)現(xiàn)。知識表示的數(shù)字化,呼喚與之相應的知識發(fā)現(xiàn)方式。知識發(fā)現(xiàn)方式的變化,反過來又引發(fā)了知識表示的進一步變革。到最后,實質(zhì)都是把閱讀文獻的主體從人變成機器,進而可以用數(shù)字技術進行文本分析。他列舉了兩篇數(shù)字人文研究的文章。一篇是對科幻小說敘事形式的研究,以算法區(qū)分“展示”和“告知”兩種敘事形式,發(fā)現(xiàn)主流文學的敘事節(jié)奏普遍快于科幻小說,為敘事分析提供了新的視角。另外一篇在計量文學史視角下分析經(jīng)濟學、種族和美國戰(zhàn)后小說。文章通過對近五千部美國當代小說進行建模分析發(fā)現(xiàn),20世紀70年代中期白人男性寫的小說中經(jīng)濟學語言增長明顯,該研究的樣本體量令傳統(tǒng)研究難以望其項背。

上海社會科學院社會學研究所研究員陶希東進一步表示,數(shù)字時代,人文社科研究無論在理論研究還是方法論上都面臨數(shù)字化轉型,在理念和思維上也出現(xiàn)了新的變化,如數(shù)據(jù)庫建設和應用風行、定性與定量研究并重、從知識關聯(lián)中探尋新的研究結論等。同時,網(wǎng)絡問卷、大數(shù)據(jù)分析等現(xiàn)代研究方式,使得學者獲取資料的效率極大提高,樣本代表性進一步增強。

辯證對待人文領域數(shù)字化應用

盡管目前人文社科數(shù)字化還缺乏成熟成果,但已展現(xiàn)出令人鼓舞的潛力。桑海介紹了關于中國古典詩歌聲律統(tǒng)計分析與研究的一些新進展,提出通過對古典詩歌語料庫中的聲律現(xiàn)象進行統(tǒng)計分析,找出聲律現(xiàn)象的規(guī)律。若此研究能在大數(shù)據(jù)基礎上進行全面統(tǒng)計分析,相信會使執(zhí)著于局部規(guī)律的舊說失去其有效性,并對整個學科發(fā)展產(chǎn)生更大影響。

面對大數(shù)據(jù)和數(shù)字處理技術給人文社會科學研究提供的豐富素材和研究新模式、新思路,李金華提出,要辯證對待數(shù)字技術在人文社會科學研究中的應用,避免科學研究對軟件、分析技術的依賴,避免研究成果陷入信息的孤島。他說,人文社會科學研究的是人的思想、情感、觀念、精神、價值,研究的是人以及人與人之間的關系,人文社會科學成果是有思想、有溫度、有價值取向的。應保持人文社會科學研究的獨立性、嚴肅性和人性光輝,推動人文社會科學研究科學性和批判性的協(xié)調(diào)發(fā)展。

在陶希東看來,數(shù)字化浪潮下人文社科發(fā)展主要有兩條路徑,一是順應數(shù)字化社會的趨勢和規(guī)律,圍繞國家數(shù)字經(jīng)濟、數(shù)字治理、數(shù)字社會發(fā)展中碰到的重大問題,不斷拓展研究領域;二是轉變和更新傳統(tǒng)的研究方法,在融合利用現(xiàn)代科技手段上下功夫,增強研究成果的理論性、科學性、指導性。此外,還要重視人文社科領域數(shù)字化人才的培養(yǎng),主動組織開展普適性學習,更要實施專業(yè)化培訓,提高在研究中對數(shù)字化技術的利用能力。

“數(shù)據(jù)、技術終究是工具,核心是人,數(shù)字化技術不論如何發(fā)展,人文社科領域研究始終要堅守‘思想創(chuàng)新、觀點創(chuàng)新’的初心,要以產(chǎn)生‘偉大思想’為榮、‘出大師’為要。”陶希東說。

談及對人文社科數(shù)字化應用發(fā)展的期待,王曉光表示,面對數(shù)字文明的興起,人文社科的數(shù)字化轉型應該加快行動步伐,積極開展數(shù)據(jù)驅動與理論驅動的研究范式的探索性融合。學術研究只有走在數(shù)字化文明發(fā)展的前沿,才能指引社會發(fā)展的方向,規(guī)避文明建設的陷阱。期待高等教育與科研界加快數(shù)字化應用步伐,在反思與審慎批判中,創(chuàng)新學術研究與文化傳承手段,并借助“新文科”建設良機,推動“三大體系”建設。

數(shù)字技術的應用與賦能有望觸發(fā)人文社科研究在知識基礎、方法論和評價體系等多方面的反思與進步,借助數(shù)字的羽翼,一個學科大碰撞、知識大融通的時代正在到來。