国产的一区二区三区_日韩图片精品午夜_国产清纯白嫩初高生在线被c_亚洲成av人片在线观看无下载_国产日韩香港欧美不卡三级_99久久精品成人免费_欧美a级完整在线观看_亚州av无码大片一区二区_狼友色成人网在线播放视频网站免费_日韩中文字幕精品一区

語料庫

Corpus
美國當(dāng)代英語語料庫(單語)

美國當(dāng)代英語語料庫(單語)

美國當(dāng)代英語語料庫(Corpus of Contemporary American English,簡稱COCA)是一個(gè)免費(fèi)的英語語料庫,它由包含5.2億詞的文本構(gòu)成,這些文本由口語、小說、流行雜志、報(bào)紙以及學(xué)術(shù)文章五種不同的文體構(gòu)成。
美國楊百翰大學(xué)BNC語料庫(單語)

美國楊百翰大學(xué)BNC語料庫
(單語)

由美國楊百翰大學(xué)語言學(xué)教授創(chuàng)立,下設(shè)多個(gè)字庫,語料極其豐富。
美國國家語料庫(單語)

美國國家語料庫(單語)

關(guān)于美語使用現(xiàn)狀的語料庫,記錄了自1990年起美語口頭和書面語,詞量達(dá)2200萬。
BNC (British National Corpus) (單語)

BNC (British National Corpus)
(單語)

英國國家語料庫由牛津出版社、朗文出版公司和大英圖書館等機(jī)構(gòu)共同建立。其中包括廣泛的書面語和口語,書面語90%,口語10%,總詞量超過1億。
Web Concordance English (單語)

Web Concordance English
(單語)

綜合多個(gè)語料庫,內(nèi)容包括歷屆美國總統(tǒng)演講及電視節(jié)目、學(xué)術(shù)、法律等,有口語和書面語兩種形式,詞量達(dá)數(shù)千萬。
Michigan Corpus of Academic Spoken English (單語)

Michigan Corpus of Academic Spoken English(單語)

密歇根大學(xué)英語語言所建立,內(nèi)容主要為學(xué)術(shù)英語口語,詞量達(dá)184萬。
Linggle

Linggle
(單語)

臺(tái)灣“清華大學(xué)”Linggle 系統(tǒng)是少數(shù)由學(xué)界開發(fā)且規(guī)模逼近業(yè)界搜尋引擎的特例。Linggle檢索引擎是一個(gè)可用于英語翻譯的語法工具和句子工具,可幫助譯者根據(jù)詞性來檢索搭配,提高譯文的豐富度和準(zhǔn)確度。
Sketch Engine(單語)

Sketch Engine(單語)

語料庫檢索工具Sketch Engine支持單詞概覽、單詞辨析、單詞搭配、同義詞查找、語料索引、建立語料庫等豐富的核心功能,被應(yīng)用于詞典編撰、語言教育和翻譯研究等多領(lǐng)域。另外,該工具也能基于網(wǎng)絡(luò)資源或本地文檔,自建特色語料庫,提取單詞表。
Online BLCKWIC Concordancer(雙語,英語、日語)

Online KWIC Concordancer
(雙語、英語、日語)

商業(yè)信函及其他信函類語料庫,由日本人建立,包括商業(yè)信函、名人信函、美國總統(tǒng)國情咨文部分名著等。
BOE——柯林斯英語語料庫(the Bank of English)

BOE——柯林斯英語語料庫
(the Bank of English)

為目前全球三大知名語料庫之一,該語料庫(The Bank of English)為英國伯明翰大學(xué)與Harper Collins出版社合作建立的COBUILD語料庫的一部分,目前固定在4.5億詞的規(guī)模,可以在線檢索。
WebCorp

WebCorp

由伯明翰城市大學(xué)英語學(xué)院英語研究小組開發(fā)的網(wǎng)絡(luò)語料庫WebCorp 除了具有傳統(tǒng)語料庫檢索軟件的詞表(wordlist)、語篇統(tǒng)計(jì)(token與type數(shù)目統(tǒng)計(jì))、KWIC索引(語境共現(xiàn))、搭配統(tǒng)計(jì)(Key phrases)、詞語型式(pattern)統(tǒng)計(jì)等功能以外,還具有網(wǎng)絡(luò)語料庫特有的功能。它能夠設(shè)定常見詞(stop words)排除,將the、a等常見詞從搭配中自動(dòng)去除掉,這樣檢索出來的詞語搭配更加精煉準(zhǔn)確;能夠設(shè)定搜索的域名范圍、時(shí)間范圍,可以提供不同地區(qū)、不同時(shí)期的語料資源。
現(xiàn)代漢語平衡語料庫(單語)

現(xiàn)代漢語平衡語料庫(單語)

現(xiàn)代漢語平衡語料庫的通用性和平衡性通過語料樣本的分布廣度和比例控制實(shí)現(xiàn)。語料輸出可選生語料與標(biāo)注語料。該語料庫共有三種檢索模式,分別是:整詞匹配、模糊匹配、全文檢索。
清華大學(xué)中英平行語料庫

清華大學(xué)中英平行語料庫

清華大學(xué)中英平行語料庫由清華大學(xué)自然語言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室在國家“863 計(jì)劃” 項(xiàng)目“ 互聯(lián)網(wǎng)語言翻譯系統(tǒng)研制” 的支持下,利用自身研發(fā)的互聯(lián)網(wǎng)平行網(wǎng)頁獲取軟件和雙語句子自動(dòng)對(duì)齊軟件獲取并處理得到的,共包含285萬中英平行句對(duì)。
北京語言大學(xué)語料庫中心BCC語料庫”

北京語言大學(xué)語料庫中心
Bcc語料庫

BCC語料庫是以漢語為主,兼有英語、西班牙語、法語、德語、土耳其語等語言的語料庫,其中漢語語料規(guī)模約150億字,涵蓋了報(bào)刊、文學(xué)、微博、科技、綜合和古漢語等多領(lǐng)域語料。Bcc語料庫包括了生語料、分詞語料、詞性標(biāo)注語料和句法樹,目前已對(duì)現(xiàn)代漢語、英語、法語的語料進(jìn)行詞性標(biāo)注。
中文語言資源聯(lián)盟

中文語言資源聯(lián)盟

中文語言資源聯(lián)盟是由中國中文信息學(xué)會(huì)語言資源建設(shè)和管理工作委員會(huì)發(fā)起,由中文語言(包括文本、語音、文字等)資源建設(shè)和管理領(lǐng)域的科技工作者自愿組成的學(xué)術(shù)性、公益性、非盈利性的社會(huì)團(tuán)體,具有完整性、權(quán)威性、系統(tǒng)性和開放性的特點(diǎn),涵蓋中文信息處理各個(gè)層面上所需要的語言語音資源,包括詞典、各種語音語言語料庫、工具等。
香港教育學(xué)院“LIVAC漢語共時(shí)語料庫”

香港教育學(xué)院
“LiVaC漢語共時(shí)語料庫”

LiVaC漢語共時(shí)語料庫以嚴(yán)謹(jǐn)、恒常與「共時(shí)」方式,搜索和處理了超常的大量具代表性漢語平面媒體語料,并通過精密的技術(shù),累積了泛華語地區(qū)眾多語言和語用統(tǒng)計(jì)數(shù)據(jù)。本語料庫的特點(diǎn)是采用「共時(shí)性」視窗模式,剖析來自香港,北京,上海,臺(tái)灣,澳門,新加坡等多地有代表性的定量華語媒體語料。直至2016年,LiVaC已累計(jì)過濾25億漢字語料,并已處理逾6億字,累積并持續(xù)提煉出2百多萬詞條。
漢語中介語語料庫”

漢語中介語語料庫

漢語中介語語料庫由北京語言大學(xué)于1992年開始建設(shè)。該語料庫立足于漢語教學(xué)已收錄1635位外國學(xué)生共5774篇成篇成段的漢語作文或練習(xí)材料,總字?jǐn)?shù)約353萬,其中1731 篇約104萬字的語料經(jīng)過斷句、分詞和詞性標(biāo)注等加工處理。目前該漢語中介語料庫仍處于努力建設(shè)過程中,北京語言大學(xué)仍然努力于建設(shè)全球漢語中介語語料庫,其規(guī)模預(yù)計(jì)達(dá)5000萬字,包括筆語語料、口語語料和多模態(tài)子庫。筆語語料規(guī)模預(yù)計(jì)達(dá)4500萬字,其中2000萬字將加工成為熟語料;口語語料450小時(shí),約合400萬字;多模態(tài)語料110小時(shí),約合100萬字。
北大法律英文網(wǎng)

北大法律英文網(wǎng)

北大法律英文網(wǎng)并非嚴(yán)格意義上的語料庫,但是它可以檢索法律新聞、法律法規(guī)、司法判例、法律期刊、條約、白皮書、公報(bào)與法律術(shù)語,支持中英文雙語對(duì)照查看,方便譯者研究、理解和提高用詞準(zhǔn)確度,進(jìn)一步提高法律翻譯能力,所以一定程度上可以作為語料庫使用。
知網(wǎng)翻譯助手

知網(wǎng)翻譯助手

知網(wǎng)翻譯助手是以知網(wǎng)總庫所有文獻(xiàn)數(shù)據(jù)為依據(jù),不僅提供英漢詞語、短語的翻譯檢索,還可以提供句子的翻譯檢索。不但對(duì)翻譯需求中的每個(gè)詞給出準(zhǔn)確翻譯和解釋,還給出大量與翻譯請(qǐng)求在結(jié)構(gòu)上相似、內(nèi)容上相關(guān)的例句,方便譯者得到恰當(dāng)?shù)姆g結(jié)果。
句酷

句酷

句酷致力于幫助非英語母語者尋找地道表達(dá),提高譯文準(zhǔn)確性。句酷的雙語例句庫語料量大、覆蓋面廣、真實(shí)地道,目前支持中英、中日、日英三種語言對(duì)的檢索。不僅可以查找雙語例句,同時(shí)具備詞典功能,提供高頻搭配供譯者選擇。
通譯典

通譯典

通譯典的翻譯句庫是目前國內(nèi)較大的翻譯例句庫,通譯典開發(fā)小組編撰句庫的目的是為廣大翻譯工作者提供翻譯參考。

其他單語語料庫

其他雙語/多語語料庫