國家標(biāo)準(zhǔn)GB/T 40035-2021《雙語平行語料加工服務(wù)基本要求》于4月30日由國家標(biāo)準(zhǔn)化管理委員會(huì)正式批準(zhǔn)發(fā)布,將于2021年11月1日實(shí)施。
隨著經(jīng)濟(jì)全球化的深入發(fā)展,以及大數(shù)據(jù)和云計(jì)算技術(shù)的廣泛應(yīng)用,機(jī)器翻譯技術(shù)近年來得到迅猛發(fā)展,各類翻譯軟件和語料庫如雨后春筍,為經(jīng)濟(jì)社會(huì)發(fā)展和國際交流合作帶來了極大便利。然而,機(jī)器翻譯質(zhì)量很大程度取決于語料質(zhì)量;由于缺乏語料加工相關(guān)標(biāo)準(zhǔn)的支持,產(chǎn)業(yè)發(fā)展出現(xiàn)了無標(biāo)可循帶來的亂象。特別是在語料加工服務(wù)方面,無論是國內(nèi)還是國際上都沒有相關(guān)標(biāo)準(zhǔn),一定程度上制約了該行業(yè)的可持續(xù)健康發(fā)展;由于長期缺乏雙語語料加工技術(shù)服務(wù)相關(guān)指引,產(chǎn)出的語料質(zhì)量層次不一,無法達(dá)到機(jī)器翻譯對雙語訓(xùn)練語料的質(zhì)量要求,導(dǎo)致機(jī)器翻譯的質(zhì)量難以進(jìn)一步提高。
《雙語平行語料加工服務(wù)基本要求》國家標(biāo)準(zhǔn)的出臺(tái)填補(bǔ)了國內(nèi)語料加工標(biāo)準(zhǔn)的空白,通過標(biāo)準(zhǔn)的有效實(shí)施可望實(shí)現(xiàn)行業(yè)的有序發(fā)展;本標(biāo)準(zhǔn)通過明確雙語語料加工服務(wù)的過程及其服務(wù)的要求,為雙語語料加工相關(guān)企業(yè)提供權(quán)威的生產(chǎn)研發(fā)依據(jù),有效提高雙語語料加工的管理水平及雙語語料質(zhì)量,為今后申報(bào)相關(guān)國際標(biāo)準(zhǔn)奠定了基礎(chǔ)。
該項(xiàng)標(biāo)準(zhǔn)是根據(jù)國家標(biāo)準(zhǔn)化管理委員會(huì)《關(guān)于下達(dá)2019年第四批推薦性國家標(biāo)準(zhǔn)計(jì)劃的通知》要求立項(xiàng)制定的,由全國語言與術(shù)語標(biāo)準(zhǔn)化技術(shù)委員會(huì)(SAC/TC 62)歸口申報(bào)并組織制定。中國標(biāo)準(zhǔn)化研究院擔(dān)任起草工作組組長單位,中國翻譯協(xié)會(huì)、上海一者信息科技有限公司、中譯語通科技股份有限公司、上海佑譯信息科技有限公司、北京悅爾信息技術(shù)有限公司、蘇州聯(lián)躍科技有限公司、四川語言橋信息技術(shù)有限公司、北京百度網(wǎng)訊科技有限公司、沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司、北京語言大學(xué)、北京郵電大學(xué)等單位參加了起草工作。