国产黄A三级三级三级看三级-国产A级毛片久久久久久精品-A级毛片无码久久精品免费-中文字幕日韩三级片-中国婬乱a一级毛片多女-亚洲一级Av无码毛片久久精品
歡迎您來到浙江省機(jī)械工業(yè)聯(lián)合會網(wǎng)站
當(dāng)前位置:
質(zhì)量標(biāo)準(zhǔn) >> 認(rèn)識和把握標(biāo)準(zhǔn)數(shù)字化...
×

認(rèn)識和把握標(biāo)準(zhǔn)數(shù)字化

2021-12-17 14:19閱讀數(shù):1017

一、標(biāo)準(zhǔn)數(shù)字化的概念

文字識別,又稱為光學(xué)字符識別(英文名:Optical Character Recognition,簡稱OCR) , 其工作原理為通過電子設(shè)備(例如掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備)獲取紙張上的文字圖片信息,利用各種模式識別算法分析文字形態(tài)特征,判斷出漢字的標(biāo)準(zhǔn)編碼,并按通用格式存儲在文本文件中。由此可以看出, OCR是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)文字自動輸入。是一種快捷、省力、高效的文字輸入方法。針對標(biāo)準(zhǔn)文本加工的現(xiàn)狀與需求, 將OCR技術(shù)運(yùn)用到標(biāo)準(zhǔn)文本加工領(lǐng)域,已經(jīng)成為標(biāo)準(zhǔn)加工與標(biāo)準(zhǔn)信息服務(wù)的趨勢。

標(biāo)準(zhǔn)數(shù)字化是從研究、挖掘標(biāo)準(zhǔn)全文的潛在價值出發(fā),采用計(jì)算機(jī)技術(shù),將常見的語言文字(或圖形符號)轉(zhuǎn)化為能被計(jì)算機(jī)識別的數(shù)字符號,從而制成標(biāo)準(zhǔn)題錄數(shù)據(jù)庫和標(biāo)準(zhǔn)全文數(shù)據(jù)庫,用以揭示標(biāo)準(zhǔn)文獻(xiàn)信息資源的一項(xiàng)系統(tǒng)工作。

二、標(biāo)準(zhǔn)起草應(yīng)注意的“線”(一)擴(kuò)大標(biāo)準(zhǔn)檢索的范圍、豐富檢索內(nèi)容。傳統(tǒng)標(biāo)準(zhǔn)信息檢索的方法和手段具有很大的局限性,尚處于初級搜索檢索階段,主要表現(xiàn)在:標(biāo)準(zhǔn)全文檢索缺失,仍停留在標(biāo)準(zhǔn)題錄的檢索。標(biāo)準(zhǔn)題錄只是標(biāo)準(zhǔn)全文的目錄,其承載的信息有限,而標(biāo)準(zhǔn)全文才是標(biāo)準(zhǔn)的主體,才是標(biāo)準(zhǔn)信息的主要承載者。標(biāo)準(zhǔn)全文檢索的缺失使標(biāo)準(zhǔn)服務(wù)效率無法實(shí)質(zhì)提升。檢索方式上僅停留在簡單的分類檢索。如國家標(biāo)準(zhǔn)、國外標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)和標(biāo)準(zhǔn)圖書等各大類的檢索,缺少二次擴(kuò)展檢索。

依據(jù)對標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)化成果,配合開發(fā)標(biāo)準(zhǔn)相應(yīng)的標(biāo)準(zhǔn)檢索系統(tǒng),將擴(kuò)大標(biāo)準(zhǔn)檢索的范圍、豐富檢索內(nèi)容。

借助新的檢索手段,可以實(shí)現(xiàn)檢索智能化,可以對標(biāo)準(zhǔn)信息內(nèi)容直接抽取。例如可在標(biāo)準(zhǔn)的前言、引言、范圍、規(guī)范性引用文件、術(shù)語等限定范圍內(nèi)進(jìn)行關(guān)鍵詞檢索和結(jié)果數(shù)據(jù)抽取,以及對標(biāo)準(zhǔn)文本中的圖形和表格進(jìn)行檢索和結(jié)果數(shù)據(jù)抽取,實(shí)現(xiàn)了用戶對所需信息的智能提供,實(shí)現(xiàn)了傳統(tǒng)的信息檢索向高精度檢索、文本挖掘、知識發(fā)現(xiàn)等方向轉(zhuǎn)變。
(二)提高標(biāo)準(zhǔn)加工的效率、保障標(biāo)準(zhǔn)數(shù)據(jù)的準(zhǔn)確性目前,標(biāo)準(zhǔn)加工錄入的字段中,標(biāo)準(zhǔn)的英文名稱、適用范圍、起草單位、批準(zhǔn)單位、出版單位、提出單位、歸口單位等字段均為手工錄入。由于傳統(tǒng)的數(shù)據(jù)加工模式是手工錄入,維護(hù)的字段又多,因此標(biāo)準(zhǔn)加工的效率較低:又因標(biāo)準(zhǔn)加工量大、人員少,未能實(shí)現(xiàn)數(shù)據(jù)校對后入庫,因此,數(shù)據(jù)錄入的準(zhǔn)確性得不到保障。(三)為標(biāo)準(zhǔn)研究提供扎實(shí)的基礎(chǔ)運(yùn)用PDF標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)化成果, 可以避免以上出現(xiàn)的準(zhǔn)確性問題。原來這些英文名稱、適用范圍、起草單位、批準(zhǔn)單位、出版單位、提出單位、歸口單位等需手工打字著錄的字段可以通過復(fù)制、粘貼完成,提高標(biāo)準(zhǔn)加工的效率,從而保障標(biāo)準(zhǔn)數(shù)據(jù)的及時性和準(zhǔn)確性。
通過對標(biāo)準(zhǔn)文本數(shù)字化的轉(zhuǎn)化,可對標(biāo)準(zhǔn)信息資源的深層次加工,充分挖掘標(biāo)準(zhǔn)文獻(xiàn)資源內(nèi)在附加值。借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以進(jìn)行標(biāo)準(zhǔn)立項(xiàng)前的查新;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以輕松、高效的進(jìn)行標(biāo)準(zhǔn)之間技術(shù)指標(biāo)的比對;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以通過具體指標(biāo)的查詢,快速精確的對標(biāo)準(zhǔn)進(jìn)行定位;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以對標(biāo)準(zhǔn)中強(qiáng)制性條款、關(guān)鍵性指標(biāo)進(jìn)行分析與研究。標(biāo)準(zhǔn)數(shù)字化建設(shè)將為標(biāo)準(zhǔn)研究的開展提供堅(jiān)實(shí)的基礎(chǔ)。(轉(zhuǎn)自論文《標(biāo)準(zhǔn)數(shù)字化的初探》,作者:胡甌靜,江蘇省標(biāo)準(zhǔn)化研究院,特此聲明致謝)
登錄|注冊
国产黄A三级三级三级看三级-国产A级毛片久久久久久精品-A级毛片无码久久精品免费-中文字幕日韩三级片-中国婬乱a一级毛片多女-亚洲一级Av无码毛片久久精品