11月21日,,應外國語學院邀請,,浙江工商大學博士生導師李文中教授在外國語學院智慧教室開設了“《語料庫與R統(tǒng)計應用》工作坊”,。講座由外國語學院副院長劉國兵主持,,學院專業(yè)教師,、研究生共計百余人聆聽了講座,。
講座中,,李文中圍繞近年來語料庫作為語言大數(shù)據(jù)在體量和分析技術上的發(fā)展,分析了語料庫研究面臨的新挑戰(zhàn)和問題,。針對這些問題,,李文中認為,新一代的研究者應充分掌握超大型語料庫處理和分析新技術和新方法,,深入理解“信任文本”思想,,把握語料庫研究從語言事實到數(shù)據(jù)、從數(shù)據(jù)再到文本的研究路徑,。工作坊基于真實案例,,以R為數(shù)據(jù)處理和統(tǒng)計平臺,探討語料庫定性數(shù)據(jù)的分析路徑和解讀方法,。隨后,,李文中圍繞語料庫詳細介紹了R軟件的基本操作,主要內容包括語料庫定性數(shù)據(jù)的提取和處理,其最終目標是獲得一個完整可用的xlsx格式的數(shù)據(jù)表,;R的數(shù)據(jù)結構及數(shù)據(jù)準備,,如離散數(shù)據(jù)轉換為分組數(shù)據(jù)(類型)、類型數(shù)據(jù)轉換為因子,、因子水平排序,、分組計算均值等;定性數(shù)據(jù)的基本分析手段及可視化,,如條形圖,、餅圖、扇形圖(plotrix包),、馬賽克圖等,;多變量分析,如對應分析,、多對應分析,、混合數(shù)據(jù)因素分析、多因素分析等,。最后,,李文中指出,數(shù)據(jù)是語料庫研究探索的起點和入口,,真正的文本意義分析必須從數(shù)據(jù)回到文本,,文本是第一階數(shù)據(jù)。
本次工作坊緊貼語料庫語言學發(fā)展前沿,,現(xiàn)場氣氛熱烈。結束后,,李文中就與會師生提出的技術難題進行了專業(yè)解答和深入交流,。此次工作坊提升了教師和研究生使用R軟件處理數(shù)據(jù)的能力,幫助其進一步認識技術和文本的深層關系,,師生皆表示受益匪淺,。
(外國語學院 卞孟孟 張孝蓮)