漢語中介語語料庫
漢語中介語語料庫由北京語言大學(xué)于1992年開始建設(shè)。該語料庫立足于漢語教學(xué)已收錄1635位外國學(xué)生共5774篇成篇成段的漢語作文或練習(xí)材料,總字?jǐn)?shù)約353萬,其中1731 篇約104萬字的語料經(jīng)過斷句、分詞和詞性標(biāo)注等加工處理。目前該漢語中介語料庫仍處于努力建設(shè)過程中,北京語言大學(xué)仍然努力于建設(shè)全球漢語中介語語料庫,其規(guī)模預(yù)計(jì)達(dá)5000萬字,包括筆語語料、口語語料和多模態(tài)子庫。筆語語料規(guī)模預(yù)計(jì)達(dá)4500萬字,其中2000萬字將加工成為熟語料;口語語料450小時(shí),約合400萬字;多模態(tài)語料110小時(shí),約合100萬字。