語料庫技術(shù)在河北十大非遺中的應(yīng)用
非物質(zhì)文化遺產(chǎn)(以下簡稱非遺)是中華優(yōu)秀傳統(tǒng)文化的重要組成部分,是中華民族的寶貴財富。在新時代背景下,傳承和發(fā)揚(yáng)非遺尤為重要,且日益成為宣傳中華優(yōu)秀傳統(tǒng)文化的重要形式之一。將當(dāng)下熱門的語料庫技術(shù)與傳承千年的非遺相結(jié)合,成為宣傳中國非遺的可行路徑之一。文章以河北十大非遺為例,旨在通過構(gòu)建河北十大非遺雙語平行語料庫,為中國非遺翻譯工作提供一定參考依據(jù)。同時,為保護(hù)和宣傳河北地區(qū)非遺以及中國非遺提供一條新路徑。
一、河北非遺介紹及發(fā)展現(xiàn)狀
作為中華民族文明發(fā)祥地之一,河北歷史悠久,文化底蘊(yùn)豐富。在歷史長河中,這片燕趙大地為中華民族留下了眾多非遺,如河北梆子、武強(qiáng)年畫、衡水內(nèi)畫等。
近年來,河北積極響應(yīng)國家“講好中國故事,傳播中國聲音”的號召,實(shí)施文化“走出去”戰(zhàn)略,加大了對省內(nèi)非遺的宣傳力度,圍繞非遺的傳承和宣傳工作,開展了大量的理論研究和實(shí)踐。河北相關(guān)部門不僅出臺、完善了非遺的政策、法規(guī),還借助眾多新媒體為宣傳河北非遺提供了重要平臺。與此同時,河北加大了非遺保護(hù)專項(xiàng)資金的投入。換言之,河北在非遺的傳承和宣傳工作中注入了大量的人力、物力及財力。
然而,河北的非遺傳承與宣傳工作仍面臨一些亟待解決的問題。隨著互聯(lián)網(wǎng)發(fā)展的深入,非遺受到當(dāng)下新藝術(shù)形式的猛烈沖擊,其生存環(huán)境受到極大的威脅,它們正在不斷淡出人們的視野。當(dāng)前,河北對非遺的宣傳仍停留在表面,非遺宣傳的渠道少,導(dǎo)致公眾對非遺的關(guān)注少之又少,保護(hù)意識逐漸淡薄。因此,如何更有效地宣傳河北非遺,提升河北非遺在海外的影響力,成為當(dāng)前更為緊迫的任務(wù)。
綜上所述,河北非遺的傳承與宣傳工作任重而道遠(yuǎn)。如何向公眾推廣河北非遺,向世界宣傳中國非遺,需要破題,需要創(chuàng)新。
二、語料庫概述與發(fā)展現(xiàn)狀
語料庫是指按照一定的語言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)語言運(yùn)用文本或話語片段而建成的具有一定容量的大型電子文本庫。從本質(zhì)上來說,語料庫就是文本的集合。按照語料的語種,語料庫可以分成單語、雙語和多語語料庫。雙語和多語語料庫還可分為平行語料庫和可比語料庫。其中平行語料庫是指收集原文與譯文雙語對照的文本,按設(shè)定的標(biāo)準(zhǔn)將語料的句子或段落對齊。
現(xiàn)代意義上的語料庫最早出現(xiàn)于20世紀(jì)60年代,近年來,發(fā)展迅速,不僅規(guī)模越來越大,而且加工度越來越深。現(xiàn)如今,在計算機(jī)技術(shù)的輔助下,語料庫技術(shù)更加成熟,同時向?qū)I(yè)性和個性化的方向發(fā)展,各類語料庫層出不窮。語料庫技術(shù)成為新時代的一大熱門,有無數(shù)專家、學(xué)者都在探討語料庫技術(shù)的應(yīng)用。不僅如此,語料庫技術(shù)已經(jīng)被廣泛地應(yīng)用到多個領(lǐng)域。語料庫技術(shù)不單單能有效、快速查找所需信息,更能結(jié)合其他領(lǐng)域帶來創(chuàng)新性成果。當(dāng)前基于語料庫的翻譯研究也受到學(xué)者關(guān)注,語料庫與翻譯研究相結(jié)合是現(xiàn)代翻譯研究的重要手段。
由此,利用語料庫技術(shù)進(jìn)行非遺文本翻譯的研究是一條行之有效的新路徑,能夠?yàn)榉沁z翻譯工作帶來極大便利,也能夠推動中國的非遺外宣工作。
三、當(dāng)代語料庫技術(shù)與傳統(tǒng)河北非遺的結(jié)合
(一)構(gòu)建河北十大非遺雙語平行語料庫的必要性
在新時代文化強(qiáng)國和中華文化“走出去”戰(zhàn)略大背景下,非遺作為傳統(tǒng)文化的重要組成部分,是中華文化的重要載體,肩負(fù)塑造國家形象的重要使命。但隨著社會政治、經(jīng)濟(jì)、文化的日益發(fā)展,文化生態(tài)發(fā)生了翻天覆地的變化,間接地導(dǎo)致許多珍貴的非遺正面臨淡出人們視野的危機(jī)。由此,保護(hù)和傳承這些珍貴的非遺迫在眉睫。而在世界文化多元化發(fā)展的今天,語料庫技術(shù)的發(fā)展為中華民族非遺的保護(hù)和外宣提供了一條嶄新的途徑。因此,將這一新型技術(shù)與河北十大非遺相結(jié)合很有必要。
渤海漁村非遺剪紙傳人韓寶菊作品
當(dāng)代語料庫技術(shù)和河北十大非遺雙語文本的結(jié)合,是技術(shù)和文化相融合的一次嘗試。以大數(shù)據(jù)、開源軟件及語料庫技術(shù)等技術(shù)為依托來構(gòu)建河北十大非遺雙語語料庫是一項(xiàng)創(chuàng)新之舉。在此之前,河北并沒有針對河北非遺相關(guān)內(nèi)容而構(gòu)建專門性雙語平行語料庫。因此,這一舉措在一定程度上填補(bǔ)了河北非遺雙語平行語料庫的空白,為宣傳河北非遺提供了新的思路。此外,這一舉措對其他地區(qū)構(gòu)建地方性非遺雙語平行語料庫有著一定借鑒和參考意義——此為必要性之一。
構(gòu)建河北十大非遺雙語平行語料庫,需將翻譯融入其中,涉及非遺翻譯這一研究重點(diǎn)。非遺具有濃厚的歷史和文化特征,在翻譯的過程中會涉及很多獨(dú)特的詞匯和文化現(xiàn)象,增加了翻譯的難度和復(fù)雜程度?,F(xiàn)今的非遺翻譯工作存在譯文質(zhì)量參差不齊、非遺專業(yè)術(shù)語翻譯不到位、選取的翻譯策略有誤等問題。基于此,河北十大非遺雙語平行語料庫的構(gòu)建能夠在一定程度上改善這些問題。因?yàn)闃?gòu)建該語料庫會對河北十大非遺的雙語文本信息進(jìn)行語料收集、整理、對齊以及對比等工作,在這一過程中能探索、發(fā)現(xiàn)非遺漢英兩種文本在語言特征以及篇章功能方面的異同,從而進(jìn)一步歸納、總結(jié)出非遺翻譯原則、翻譯方法及翻譯策略等,可以為譯者提供可信度高的翻譯輔助平臺——此為必要性之二。
構(gòu)建河北十大非遺雙語平行語料庫有雙重目標(biāo),一是以傳播河北非遺為主要目標(biāo),力求講好河北非遺故事,傳播河北非遺聲音,進(jìn)而促進(jìn)河北地方經(jīng)濟(jì)發(fā)展;二是積極響應(yīng)國家“講好中國故事,傳播中國聲音”的號召,以向世界宣傳中國非遺為終極目標(biāo),希望借此來彰顯中國傳統(tǒng)非遺的文化自信?;谝陨蟽牲c(diǎn),筆者認(rèn)為構(gòu)建河北十大非遺雙語平行語料庫在文化價值層面有著不可忽視的作用——此為必要性之三。
因此,構(gòu)建河北十大非遺雙語平行語料庫,無論是在語料庫本身價值方面,還是在非遺翻譯工作及非遺外宣方面都具有積極作用。
(二)構(gòu)建河北十大非遺雙語平行語料庫的路徑
在開始構(gòu)建河北十大非遺雙語平行語料庫之初,筆者認(rèn)為需對構(gòu)建語料庫的研究方法進(jìn)行探討,以此更好地開展工作。研究方法可以包括問卷調(diào)查法、個案研究法、文獻(xiàn)研究法等。通過問卷調(diào)查法了解受眾人群對構(gòu)建該語料庫的意見和建議;通過個案研究法以及文獻(xiàn)研究法來推進(jìn)語料庫構(gòu)建工作,以確保其嚴(yán)謹(jǐn)性和權(quán)威性。除此之外,筆者認(rèn)為關(guān)注河北非遺的最新動態(tài)以及翻譯領(lǐng)域關(guān)于非遺翻譯的最新研究成果有重要意義,這會進(jìn)一步完善構(gòu)建語料庫的前期準(zhǔn)備工作。
前期準(zhǔn)備工作是構(gòu)建河北十大非遺雙語平行語料庫路徑的第一步。構(gòu)建一個雙語平行語料庫涉及雙語語料收集工作、整理工作、標(biāo)注與對齊工作及應(yīng)用工作等具體步驟。
第一,語料庫的構(gòu)建需要開發(fā)和使用語料庫分析統(tǒng)計軟件,該軟件主要包含索引、詞表生成、主題詞計算、搭配和詞族提取等多種功能,可為雙語平行語料庫構(gòu)建提供強(qiáng)大的技術(shù)支持。因此,熟悉該軟件的各項(xiàng)功能以及熟練掌握該軟件的操作是構(gòu)建語料庫的基礎(chǔ)。
第二,雙語語料的收集工作是構(gòu)建該語料庫的核心步驟之一。創(chuàng)建一個語料庫的關(guān)鍵在于所選語料是否適用于建立相應(yīng)的語料庫,其中包括語料的學(xué)術(shù)性和語料的質(zhì)量。該雙語平行語料庫的構(gòu)建依托于大量專業(yè)、權(quán)威的雙語文獻(xiàn)資料。確定非遺雙語語料的來源尤為重要,權(quán)威的雙語語料來源能夠最大程度上保證語料庫的真實(shí)性、準(zhǔn)確性、權(quán)威性,對外宣也有更積極的作用。非遺語料的收集來源主要有以下幾種途徑:(1)權(quán)威的官方信息渠道,如中國外文局、《中國日報》《河北日報》以及河北省非遺相關(guān)文件等;(2)中央機(jī)關(guān)和國家外事外宣部門提供的雙語資料;(3)國外權(quán)威的官方網(wǎng)站的英文文本等。
第三,語料收集工作完成后,則需進(jìn)行語料庫架構(gòu)、功能設(shè)計和語料加工。對于現(xiàn)有的語料進(jìn)行整理、歸納是語料庫構(gòu)建中最重要的操作。為確保最終能形成有效的語料,語料的整理、歸納工作包括篩選、刪除相關(guān)性不高的非遺雙語文本,并在這一基礎(chǔ)上對其進(jìn)行進(jìn)一步的加工和完善,使之成為能夠直接使用的語料資源,如總結(jié)河北十大非遺的高頻主題名詞、高頻形容詞及副詞等。其中,在加工和完善雙語語料的過程中,會遇到英文譯本不全、缺失或英文譯文質(zhì)量較低的情況,筆者認(rèn)為應(yīng)對其進(jìn)行改譯,并請專業(yè)翻譯團(tuán)隊(duì)進(jìn)行翻譯審校,以保證語料質(zhì)量。然后,將這些雙語語料資源按照河北十大非遺名單進(jìn)行排序、編號、命名,并將它們保存到相應(yīng)的文件夾中。
第四,語料的標(biāo)注與對齊工作是構(gòu)建雙語平行語料庫并使之應(yīng)用于現(xiàn)實(shí)生活的關(guān)鍵性步驟。標(biāo)注可采用機(jī)器和人工并用的方式:對漢語語料用漢語分詞工具ICTCLAS進(jìn)行切分標(biāo)注,對英文語料用詞性標(biāo)注軟件Tagger標(biāo)注,完成后對標(biāo)注后的文本進(jìn)行人工修正。為實(shí)現(xiàn)漢英雙語語料的快速對齊,需要借助成熟的自動對齊網(wǎng)站Tmxmall中的語料對齊功能。該步驟只需將之前整理好的雙語語料分別導(dǎo)入網(wǎng)站中,再點(diǎn)擊“對齊”就能快速地自動對齊。由于漢英兩種語言之間的差異較大,為確保研究的準(zhǔn)確性和可信度,還需進(jìn)行人工檢查和調(diào)整,以此達(dá)到語料的精準(zhǔn)對齊。完成以上步驟之后,該雙語平行語料庫的初步構(gòu)建已經(jīng)完成。
第五,在初步完成語料庫的構(gòu)建工作之后,在投入使用之前,要完成語料庫的雙語檢索測試,來檢測、修正語料庫的檢索功能以及檢測該語料庫能否運(yùn)用于實(shí)際操作。除此之外,仍要時刻關(guān)注有關(guān)河北十大非遺的最新動向,不斷收集有關(guān)非遺翻譯的專有名詞、固定搭配詞組以及句子等。為了提高翻譯質(zhì)量,語料庫在收錄大量詞、句的同時,還將深入挖掘其文化內(nèi)涵,并將這些詞、句進(jìn)行有機(jī)整合。
第六,在語料庫建成投入使用之后,仍需對該語料庫進(jìn)行日常維護(hù)及升級,以適應(yīng)新的軟硬件和用戶的不同需求。語料庫內(nèi)容也應(yīng)緊跟時事,根據(jù)各類非遺活動的開展及最新的非遺雙語文本而不斷更新,以確保該語料庫的代表性、時效性、權(quán)威性。此外,筆者認(rèn)為語料庫的推廣工作也很有必要,大范圍地推廣能讓更多人使用該語料庫進(jìn)行檢索,可以更好地體現(xiàn)其實(shí)用性,更加充分地宣傳非遺。
構(gòu)建河北十大非遺雙語平行語料庫的路徑是層層遞進(jìn)、環(huán)環(huán)相扣的,需要語料收集、整理、加工、對齊等步驟,當(dāng)然也離不開細(xì)致的審校工作。同時,筆者認(rèn)為,構(gòu)建語料庫的這一過程是“活”的,是動態(tài)發(fā)展的,因此,在形成相應(yīng)的語料庫之后,仍需不斷修改、校正,不斷探索、創(chuàng)新。
四、結(jié)語
非遺是中華民族源遠(yuǎn)流長的歷史長河中沉淀下來的燦爛瑰寶,是凝聚先輩智慧與卓越價值的精神財富。創(chuàng)新非遺傳播路徑是非遺傳承的需要,也是人類社會可持續(xù)發(fā)展的必然要求。
因此,構(gòu)建河北十大非遺雙語平行語料庫,無論是從實(shí)際應(yīng)用價值層面還是文化層面都具有深刻意義。從實(shí)際應(yīng)用價值層面來看,由于該語料庫可為譯者提供豐富、真實(shí)的源語、目的語及雙語互譯實(shí)例,因而可起到統(tǒng)一術(shù)語或?qū)S忻~翻譯的作用;而且該語料庫能探索發(fā)現(xiàn)漢英兩種語言在非遺文本方面的不同語言特征、形式以及篇章功能的異同,從而總結(jié)出非遺翻譯的方法及策略,進(jìn)而提高非遺翻譯的譯文質(zhì)量。從文化層面來看,構(gòu)建河北十大非遺雙語平行語料庫是新時代非遺傳承與宣傳的需要,肩負(fù)著向世界宣揚(yáng)非遺的使命,能夠向英文目標(biāo)讀者展示非遺的獨(dú)特魅力,對中華文化“走出去”起到積極的促進(jìn)作用,能進(jìn)一步彰顯中國的文化自信。
綜上所述,構(gòu)建河北十大非遺雙語平行語料庫,不僅能夠給非遺翻譯工作帶來助力,而且能夠創(chuàng)新性地將現(xiàn)代技術(shù)融入傳統(tǒng)文化,以達(dá)到宣傳非遺的目的。將當(dāng)代語料庫技術(shù)與傳統(tǒng)非遺相結(jié)合,一方面,要積極探索非遺內(nèi)在的文化內(nèi)涵,回歸傳統(tǒng),不忘祖輩的傳承;另一方面,要與時俱進(jìn)、緊跟時代腳步,在不失傳統(tǒng)根本的基礎(chǔ)上進(jìn)行創(chuàng)新發(fā)展,讓古老的非遺在當(dāng)今社會重?zé)ü獠剩?/p>
欄目分類
- 游戲教學(xué)法在網(wǎng)球教學(xué)中的應(yīng)用
- 心理素質(zhì)在網(wǎng)球比賽中的作用
- 綠色科技視角下企業(yè)環(huán)境績效指標(biāo)體系構(gòu)建
- 節(jié)約型基礎(chǔ)上的綠色財政稅收政策研究
- 財政投資項(xiàng)目竣工決算存在的問題及對策
- 基于精細(xì)化管理視域探析公立醫(yī)院成本管控優(yōu)化策略
- 農(nóng)村信用社在金融市場中的營銷技巧探究
- 實(shí)現(xiàn)我國糧食增產(chǎn)增收的財稅政策分析
- 離子色譜法同時測定卷煙紙中幾種金屬離子的含量
- IC厭氧反應(yīng)器處理造紙廢水效率的時間分布特征研究
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點(diǎn)分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級黨報?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!