国产黄A三级三级三级看三级-国产A级毛片久久久久久精品-A级毛片无码久久精品免费-中文字幕日韩三级片-中国婬乱a一级毛片多女-亚洲一级Av无码毛片久久精品
歡迎您來到浙江省機械工業(yè)聯(lián)合會網(wǎng)站
當(dāng)前位置:
質(zhì)量標(biāo)準(zhǔn) >> 標(biāo)準(zhǔn)數(shù)字化……...
×

標(biāo)準(zhǔn)數(shù)字化……

2023-12-05 15:54閱讀數(shù):361

一、標(biāo)準(zhǔn)數(shù)字化的概念。文字識別,又稱為光學(xué)字符識別(英文名:Optical Character Recognition,簡稱OCR) , 其工作原理為通過電子設(shè)備(例如掃描儀或數(shù)碼相機等光學(xué)輸入設(shè)備)獲取紙張上的文字圖片信息,利用各種模式識別算法分析文字形態(tài)特征,判斷出漢字的標(biāo)準(zhǔn)編碼,并按通用格式存儲在文本文件中。由此可以看出, OCR是讓計算機認(rèn)字,實現(xiàn)文字自動輸入。是一種快捷、省力、高效的文字輸入方法。針對標(biāo)準(zhǔn)文本加工的現(xiàn)狀與需求, 將OCR技術(shù)運用到標(biāo)準(zhǔn)文本加工領(lǐng)域,已經(jīng)成為標(biāo)準(zhǔn)加工與標(biāo)準(zhǔn)信息服務(wù)的趨勢。

標(biāo)準(zhǔn)數(shù)字化是從研究、挖掘標(biāo)準(zhǔn)全文的潛在價值出發(fā),采用計算機技術(shù),將常見的語言文字(或圖形符號)轉(zhuǎn)化為能被計算機識別的數(shù)字符號,從而制成標(biāo)準(zhǔn)題錄數(shù)據(jù)庫和標(biāo)準(zhǔn)全文數(shù)據(jù)庫,用以揭示標(biāo)準(zhǔn)文獻信息資源的一項系統(tǒng)工作。

二、標(biāo)準(zhǔn)起草應(yīng)注意的“線”(一)擴大標(biāo)準(zhǔn)檢索的范圍、豐富檢索內(nèi)容。傳統(tǒng)標(biāo)準(zhǔn)信息檢索的方法和手段具有很大的局限性,尚處于初級搜索檢索階段,主要表現(xiàn)在:標(biāo)準(zhǔn)全文檢索缺失,仍停留在標(biāo)準(zhǔn)題錄的檢索。標(biāo)準(zhǔn)題錄只是標(biāo)準(zhǔn)全文的目錄,其承載的信息有限,而標(biāo)準(zhǔn)全文才是標(biāo)準(zhǔn)的主體,才是標(biāo)準(zhǔn)信息的主要承載者。標(biāo)準(zhǔn)全文檢索的缺失使標(biāo)準(zhǔn)服務(wù)效率無法實質(zhì)提升。檢索方式上僅停留在簡單的分類檢索。如國家標(biāo)準(zhǔn)、國外標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)和標(biāo)準(zhǔn)圖書等各大類的檢索,缺少二次擴展檢索。依據(jù)對標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)化成果,配合開發(fā)標(biāo)準(zhǔn)相應(yīng)的標(biāo)準(zhǔn)檢索系統(tǒng),將擴大標(biāo)準(zhǔn)檢索的范圍、豐富檢索內(nèi)容。

借助新的檢索手段,可以實現(xiàn)檢索智能化,可以對標(biāo)準(zhǔn)信息內(nèi)容直接抽取。例如可在標(biāo)準(zhǔn)的前言、引言、范圍、規(guī)范性引用文件、術(shù)語等限定范圍內(nèi)進行關(guān)鍵詞檢索和結(jié)果數(shù)據(jù)抽取,以及對標(biāo)準(zhǔn)文本中的圖形和表格進行檢索和結(jié)果數(shù)據(jù)抽取,實現(xiàn)了用戶對所需信息的智能提供,實現(xiàn)了傳統(tǒng)的信息檢索向高精度檢索、文本挖掘、知識發(fā)現(xiàn)等方向轉(zhuǎn)變。(二)提高標(biāo)準(zhǔn)加工的效率、保障標(biāo)準(zhǔn)數(shù)據(jù)的準(zhǔn)確性。目前,標(biāo)準(zhǔn)加工錄入的字段中,標(biāo)準(zhǔn)的英文名稱、適用范圍、起草單位、批準(zhǔn)單位、出版單位、提出單位、歸口單位等字段均為手工錄入。由于傳統(tǒng)的數(shù)據(jù)加工模式是手工錄入,維護的字段又多,因此標(biāo)準(zhǔn)加工的效率較低:又因標(biāo)準(zhǔn)加工量大、人員少,未能實現(xiàn)數(shù)據(jù)校對后入庫,因此,數(shù)據(jù)錄入的準(zhǔn)確性得不到保障。(三)為標(biāo)準(zhǔn)研究提供扎實的基礎(chǔ)。運用PDF標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)化成果, 可以避免以上出現(xiàn)的準(zhǔn)確性問題。原來這些英文名稱、適用范圍、起草單位、批準(zhǔn)單位、出版單位、提出單位、歸口單位等需手工打字著錄的字段可以通過復(fù)制、粘貼完成,提高標(biāo)準(zhǔn)加工的效率,從而保障標(biāo)準(zhǔn)數(shù)據(jù)的及時性和準(zhǔn)確性。通過對標(biāo)準(zhǔn)文本數(shù)字化的轉(zhuǎn)化,可對標(biāo)準(zhǔn)信息資源的深層次加工,充分挖掘標(biāo)準(zhǔn)文獻資源內(nèi)在附加值。借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以進行標(biāo)準(zhǔn)立項前的查新;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以輕松、高效的進行標(biāo)準(zhǔn)之間技術(shù)指標(biāo)的比對;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以通過具體指標(biāo)的查詢,快速精確的對標(biāo)準(zhǔn)進行定位;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以對標(biāo)準(zhǔn)中強制性條款、關(guān)鍵性指標(biāo)進行分析與研究。標(biāo)準(zhǔn)數(shù)字化建設(shè)將為標(biāo)準(zhǔn)研究的開展提供堅實的基礎(chǔ)。

轉(zhuǎn)自論文《標(biāo)準(zhǔn)數(shù)字化的初探》,作者:胡甌靜,江蘇省標(biāo)準(zhǔn)化研究院,


——來源:學(xué)習(xí)標(biāo)準(zhǔn)化
登錄|注冊
国产黄A三级三级三级看三级-国产A级毛片久久久久久精品-A级毛片无码久久精品免费-中文字幕日韩三级片-中国婬乱a一级毛片多女-亚洲一级Av无码毛片久久精品