語料庫語言學(xué)既可以被看作是一門新興學(xué)科,又可以被看作是20世紀(jì)曾盛極一時(shí)的美國(guó)結(jié)構(gòu)主義語言學(xué)研究方法的延續(xù),是現(xiàn)代語言學(xué)的一個(gè)重要分支!锻庹Z學(xué)術(shù)普及系列:什么是語料庫語言學(xué)》以問答的形式,介紹了語料庫及語料庫語言學(xué)的基礎(chǔ)知識(shí)和基本概念、語料庫的處理和加工、語料庫的分析方法、語料庫的研究和應(yīng)用等。全書深入淺出,語言精煉,有助于初學(xué)者了解語料庫語言學(xué)的概貌,對(duì)于普及這一學(xué)科的基礎(chǔ)知識(shí)具有十分重要的價(jià)值。
據(jù)記載,公元一世紀(jì)時(shí),羅馬人發(fā)明了玻璃,還發(fā)現(xiàn)玻璃有放大效應(yīng),后來直到13世紀(jì),意大利人才發(fā)明了放大鏡——大約能放大6倍,可以看清跳蚤了,于是人們就把這東西叫做fleaglasses。1590年前后,一對(duì)荷蘭父子試著把鏡片放在圓筒內(nèi)壁,結(jié)果發(fā)現(xiàn)圓筒遠(yuǎn)端的東西會(huì)被放大,于是就試著加長(zhǎng)這個(gè)圓筒,把三個(gè)粗細(xì)不等的圓筒套接起來,套接后的圓筒可伸長(zhǎng)也可縮短,縮短的時(shí)候能放大3倍,伸長(zhǎng)的時(shí)候能放大9倍。我的問題是,這東西是放大鏡還是顯微鏡?
其實(shí)叫它放大鏡還是叫它顯微鏡并不重要,重要的是我們用它可以看到原來看不到的東西。一旦我們操起新式武器,仔細(xì)觀察一下本來已經(jīng)習(xí)以為常的東西,竟驚訝地發(fā)現(xiàn),我們?cè)玖?xí)以為常的東西根本就是錯(cuò)的。
這就是語料庫語言學(xué),而語言就是我們天天習(xí)以為常的東西。語料庫語言學(xué)像是新工具,它促使我們反思許多語言問題,尤其是一些本來已經(jīng)有了定論的問題。于是,我們開始越來越不相信定論,不時(shí)地發(fā)現(xiàn)那些所謂的定論其實(shí)是錯(cuò)誤的。
從我的故事里走出來,考慮一下什么是語料庫語言學(xué)。我們的第一感覺是,語料庫語言學(xué)就是工具,像放大鏡,或是顯微鏡。的確,語料庫語言學(xué)具有工具性是任何人都不能否認(rèn)的,然而,正是這種工具性才使得我們得以看見原本看不見的東西,這不同于我們把筷子當(dāng)做工具來吃飯夾菜(我們吃饅頭的時(shí)候還不用筷子呢。S肧inclair的話說,Language looks rather different when you look at a lot of itatonce。這里的look at a lot of itatonce就是工具,是方法,是一種工作方式。有了計(jì)算機(jī),有了語料庫,我們就可以同時(shí)看到很多語言,看到語言中千萬次復(fù)現(xiàn)的規(guī)律。Sinclair或許是希望提醒我們,每時(shí)每刻都應(yīng)該拿著那副放大鏡或顯微鏡,要讓它變成我們生活的一部分,變成我們觀察語言的唯一方法。當(dāng)它變成我們觀察語言的唯一方法時(shí),它就不僅僅是工具了,而成了一種根深蒂固的習(xí)慣,一種不變的態(tài)度。
以上我們說的是學(xué)界對(duì)語料庫語言學(xué)的兩種認(rèn)識(shí)。一些學(xué)者認(rèn)為語料庫語言學(xué)是工具,是方法;而另外一些學(xué)者認(rèn)為語料庫語言學(xué)是新理論、新學(xué)科、新視角,預(yù)示著新發(fā)現(xiàn)。語料庫語言學(xué)中充滿了這樣的爭(zhēng)議。
本書試圖解釋語料庫語言學(xué)中的一些基本問題,有的可能是我們?cè)?jīng)思考過的,有的則是我們從未想過的,甚至筆者在寫作之前自己也沒太想過的。
序言
(一)什么是語料庫
1.什么是語料庫?
2.為什么要使用語料庫?
3.語料庫與其他語言研究數(shù)據(jù)有什么不同?
4.什么是語料庫的代表性?
5.語料庫有哪些主要類型?
6.什么是布朗家族語料庫?
7.什么是網(wǎng)絡(luò)語料庫?
8.語料庫有什么局限?
9.什么是交叉驗(yàn)證?
(二)語料庫語言學(xué)學(xué)科
10.什么是語料庫語言學(xué)?
11.語料庫語言學(xué)的哲學(xué)基礎(chǔ)是什么?
12.語料庫語言學(xué)與計(jì)算機(jī)技術(shù)之間有何關(guān)系?
13.語料庫語言學(xué)與計(jì)算語言學(xué)之間有何種關(guān)系?
14.語料庫語言學(xué)是如何發(fā)展起來的?
15.利用語料庫從事語言研究必須學(xué)會(huì)計(jì)算機(jī)編程嗎?
16.什么是語料庫驅(qū)動(dòng)的研究范式?
17.什么是基于語料庫的研究范式?
18.語料庫驅(qū)動(dòng)的研究范式與基于語料庫的研究范式有何不同
19.什么是擴(kuò)展意義單位模型?
20.什么是搭配?
21.什么是類聯(lián)接?
22.什么是語義傾向和語義韻?
23.什么是0STI報(bào)告?
(三)語料庫的處理和加工
24.什么是文本清理?
25.什么是元信息?
26.什么是語料庫的標(biāo)注?
27.什么是分詞和詞形還原?
28.什么是詞性標(biāo)注?
29.什么是句法剖析?
30.什么是雙語對(duì)齊?
(四)語料庫分析方法
31.什么是詞表?
32.什么是N元分析?
33.什么是型次比?
34.什么是主題詞分析?
35.主題詞分析有何種擴(kuò)展應(yīng)用?
36.什么是索引分析?
37.什么是正則表達(dá)式?
38.什么是批量檢索?
39.什么是詞匯頻率概貌?
40.什么是多維度分析?
41.多維度分析的基本步驟有哪些?
42.什么是多因素分析?
(五)語料庫研究應(yīng)用
43.常用的英語語料庫有哪些?
44.常用的現(xiàn)代漢語語料庫有哪些?
45.語料庫可以應(yīng)用到語言研究的哪些領(lǐng)域?
46.什么是語料庫翻譯學(xué)?
47.什么是中介語對(duì)比分析?
48.中介語對(duì)比分析遇到了何種挑戰(zhàn)?
49.什么是數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)?
50.什么是微型文本?
51.什么是詞匯大綱?
52.詞匯大綱有什么不足?
53.什么是詞匯中心教學(xué)法?
54.語料庫在語言研究之外有何更廣泛的應(yīng)用?
55.大數(shù)據(jù)時(shí)代的語料庫語言學(xué)會(huì)有什么新的特征?
參考文獻(xiàn)
術(shù)語匯覽
CLAWS詞性標(biāo)注集
常用語料庫一覽
推薦書目