《國家標(biāo)準(zhǔn)化發(fā)展綱要》提出,要“推動標(biāo)準(zhǔn)化工作向數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型”。市場監(jiān)管總局副局長、國家標(biāo)準(zhǔn)委主任田世宏在全國標(biāo)準(zhǔn)化工作會議的報告中提出“積極推進機器可讀標(biāo)準(zhǔn)工作,探索數(shù)字化條件下國家標(biāo)準(zhǔn)管理新機制。加強標(biāo)準(zhǔn)數(shù)字化技術(shù)研究,把握前沿科技發(fā)展趨勢,增強標(biāo)準(zhǔn)化基礎(chǔ)理論儲備?!睒?biāo)準(zhǔn)數(shù)字化成為今后標(biāo)準(zhǔn)化工作的重要內(nèi)容之一。為此,本刊近日專訪了中國工程院院士、國家標(biāo)準(zhǔn)化專家咨詢委員會主任鄔賀銓,請他分享對標(biāo)準(zhǔn)數(shù)字化的理解和建議。
?
標(biāo)準(zhǔn)數(shù)字化順應(yīng)數(shù)字化、
網(wǎng)絡(luò)化、智能化時代的發(fā)展
2022年政府工作報告提出要加快數(shù)字技術(shù)和實體經(jīng)濟的融合,這種融合表現(xiàn)在很多方面,其中包含有標(biāo)準(zhǔn)化怎樣與數(shù)字技術(shù)融合。標(biāo)準(zhǔn)數(shù)字化指利用數(shù)字技術(shù)對標(biāo)準(zhǔn)本身及生命周期全過程賦能,使標(biāo)準(zhǔn)承載的規(guī)則與特性能夠通過數(shù)字設(shè)備進行讀取、傳輸與使用的過程。提出標(biāo)準(zhǔn)的數(shù)字化,是希望借助新一代數(shù)字技術(shù),更好實現(xiàn)標(biāo)準(zhǔn)的制定和標(biāo)準(zhǔn)的推廣、宣貫和實施。標(biāo)準(zhǔn)的數(shù)字化包括兩個方面,一是標(biāo)準(zhǔn)的表現(xiàn)形式的數(shù)字化,二是標(biāo)準(zhǔn)化方法的數(shù)字化,通過數(shù)字化技術(shù)來推動標(biāo)準(zhǔn)化工作的發(fā)展。
標(biāo)準(zhǔn)數(shù)字化不僅在中國,國際上也在研究這個課題。國際標(biāo)準(zhǔn)化組織ISO對標(biāo)準(zhǔn)數(shù)字化給出一個被稱為SMART的定義,即無需人員參與可實現(xiàn)標(biāo)準(zhǔn)的機器可讀、可用、可理解、可解析,這應(yīng)該是標(biāo)準(zhǔn)化工作發(fā)展的一個里程碑。從過去單純的文字表達方式轉(zhuǎn)變到現(xiàn)在的機器可讀方式,這不僅因數(shù)字技術(shù)的發(fā)展成為可能,而且它也是社會發(fā)展的需要,數(shù)字化已經(jīng)滲透到實體經(jīng)濟產(chǎn)業(yè)的各個方面,在不少應(yīng)用場景已經(jīng)機器換人,讓機器理解標(biāo)準(zhǔn)將是社會發(fā)展的大勢所趨。
我們以智慧城市攝像頭拍攝的視頻為例,馬路上數(shù)十萬的交通監(jiān)控攝像頭都聯(lián)網(wǎng)到城市的交管中心,可是交管中心監(jiān)控室電視墻再大也放不下這么多視頻屏幕?,F(xiàn)在基本上是按馬路分時顯示,例如每分鐘一條馬路,一條馬路上的攝像頭也不少,靠人盯著看的效率很低。現(xiàn)在我們希望把所有馬路上的監(jiān)控視頻通過人工智能的技術(shù)合成為一個全城交通動態(tài)視頻,可顯著提升人來監(jiān)看的效率。還有一種方法無需合成,通過計算機直接來讀這些分散的視頻,依據(jù)監(jiān)控點時空位置的標(biāo)簽,由機器代替人獲得全局的了解。未來的這種交通監(jiān)控視頻不是供人來看的,以人作為觀看對象時考慮的是視頻的幀率與分辨率對應(yīng)人眼的分辨率能力即可,機器視覺的視頻編碼算法標(biāo)準(zhǔn)跟供人看的標(biāo)準(zhǔn)會有不同,所以我們要考慮從人來閱讀到機器來閱讀不僅僅是方式發(fā)生了變化,可能連標(biāo)準(zhǔn)內(nèi)容甚至里邊的一些內(nèi)涵、規(guī)定、指標(biāo)都會有所不同。
我們現(xiàn)在進入信息技術(shù)的新時代,整個社會經(jīng)濟都在向數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型發(fā)展,在標(biāo)準(zhǔn)化方面體現(xiàn)的就是標(biāo)準(zhǔn)的數(shù)字化。
?
標(biāo)準(zhǔn)數(shù)字化
能為我們帶來什么
一
首先是標(biāo)準(zhǔn)的呈現(xiàn)形式的變化。
我們知道標(biāo)準(zhǔn)過去基本上都是文本,那么未來要讓機器可讀,標(biāo)準(zhǔn)文本就要變革。機器的可讀化首先是機器可檢索,即從機器可以發(fā)現(xiàn)和找到這個標(biāo)準(zhǔn)。然后是機器可讀,也就是把標(biāo)準(zhǔn)的內(nèi)容能夠讀出來。進一步發(fā)展到標(biāo)準(zhǔn)的可理解,機器能理解標(biāo)準(zhǔn)的內(nèi)涵,可交互,最后可以去執(zhí)行。機器可檢索相對容易,機器可讀就有困難了。
人工智能的技術(shù)發(fā)展都可以通過語義理解把中文變英文,英文變中文,那機器可讀有什么困難呢?首先標(biāo)準(zhǔn)是專業(yè)的,人工智能的模型和算法是要根據(jù)處理的任務(wù)經(jīng)過大量的數(shù)據(jù)訓(xùn)練才能優(yōu)化,這種訓(xùn)練不可能覆蓋所有專業(yè),何況人來閱讀標(biāo)準(zhǔn)都有專業(yè)門檻問題。其次標(biāo)準(zhǔn)里面包含公式、圖表、曲線等非結(jié)構(gòu)化數(shù)據(jù),計算機一般比較難理解非結(jié)構(gòu)化的內(nèi)容,在這些方面的標(biāo)準(zhǔn)可視化和可讀化并不簡單,還要做不少工作。
如何做到機器可讀,可以先從標(biāo)準(zhǔn)的描述語言入手。現(xiàn)在有人用XML的語言來描述標(biāo)準(zhǔn),XML是可擴展的標(biāo)記語言,是一種可以描述數(shù)據(jù)對象的計算機的語言,而且它比一般的數(shù)據(jù)語言多了一個包含對這個數(shù)據(jù)對象的解釋,這就降低了計算機對數(shù)據(jù)的理解難度。
要做到機器可讀還可以引入程序來描述標(biāo)準(zhǔn),比如說有些算法可以直接成為標(biāo)準(zhǔn),這就引入到標(biāo)準(zhǔn)數(shù)字化表現(xiàn)形式的另外一方面——開源軟件和開源軟件的應(yīng)用。《國家標(biāo)準(zhǔn)化發(fā)展綱要》提到的標(biāo)準(zhǔn)數(shù)字化,涉及機器可讀、開源軟件兩大方面。開源軟件現(xiàn)在在開源社區(qū)里用的比較多,它是一種軟件,或者說它是把一個技術(shù)規(guī)范以一種算法來描述,計算機就便于執(zhí)行,顯然開源也是標(biāo)準(zhǔn)數(shù)字化的一種表現(xiàn)形式。不過符合以開源軟件方式表達的標(biāo)準(zhǔn)還是很有限的。
標(biāo)準(zhǔn)數(shù)字化不僅在于標(biāo)準(zhǔn)的表現(xiàn)形式,還表現(xiàn)為標(biāo)準(zhǔn)化方法的數(shù)字化,讓數(shù)字化貫穿標(biāo)準(zhǔn)化的全生命周期,便于標(biāo)準(zhǔn)的制定、實施和推廣應(yīng)用。首先通過開源眾包加快標(biāo)準(zhǔn)制定和修訂的過程。過去我們制定標(biāo)準(zhǔn)習(xí)慣用會議和函審的方式,現(xiàn)在我們可以用開源眾包的方式即建立一個“在線協(xié)作寫作”平臺讓更多人參與標(biāo)準(zhǔn)制定的過程,在數(shù)字化環(huán)境中進行標(biāo)準(zhǔn)協(xié)作開發(fā),能夠在數(shù)周時間內(nèi)形成可交付成果,顯著縮短標(biāo)準(zhǔn)制定周期。標(biāo)準(zhǔn)按照常規(guī)的辦法,幾年才修訂一次,而開源可以快速迭代,動態(tài)更新,加快標(biāo)準(zhǔn)的制修訂。這里會涉及到一些管理體制的問題,未來國家標(biāo)準(zhǔn)能否允許這樣做還需要研究,但團體標(biāo)準(zhǔn)可以探索,大家可以快速地參與到開源平臺上,只要同意了就能更新,這適用于新興或快速演進技術(shù)領(lǐng)域的標(biāo)準(zhǔn)。
二
易于發(fā)現(xiàn)標(biāo)準(zhǔn)制定的背景
及與知識產(chǎn)權(quán)等的關(guān)聯(lián)。
我們可以通過人工智能和大數(shù)據(jù)的技術(shù),很好地將國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)、團體標(biāo)準(zhǔn)快速進行對照,找出標(biāo)準(zhǔn)間的引用關(guān)系,發(fā)現(xiàn)哪些內(nèi)容是一致的,哪些是不一致的,國際標(biāo)準(zhǔn)的采標(biāo)率到多少,適用范圍有什么區(qū)別?還可以在術(shù)語、技術(shù)體制、規(guī)范、測試方法、產(chǎn)品要求等系列的技術(shù)標(biāo)準(zhǔn)中發(fā)現(xiàn)有無矛盾或需要改進以便表述更嚴謹之處。標(biāo)準(zhǔn)數(shù)字化還方便將標(biāo)準(zhǔn)與知識產(chǎn)權(quán)關(guān)聯(lián),包括易于檢索到在標(biāo)準(zhǔn)制定過程中相關(guān)方對知識產(chǎn)權(quán)的聲明,以及專利持有人是否承諾遵守FRAND(公平、合理、無歧視)原則對專利實施人許可,或有關(guān)知識產(chǎn)權(quán)機構(gòu)對該專利是否授權(quán)等,既可知道某一標(biāo)準(zhǔn)涉及多少標(biāo)準(zhǔn)必要專利(SEP),也可識別某一專利是否SEP??傊瑯?biāo)準(zhǔn)數(shù)字化結(jié)合新一代信息技術(shù)可以很好地把標(biāo)準(zhǔn)的一些細節(jié)搞清楚。
三
助力對標(biāo)準(zhǔn)實施的監(jiān)管。
因為標(biāo)準(zhǔn)是數(shù)字化的,監(jiān)管部門能從實施標(biāo)準(zhǔn)的行為數(shù)據(jù)上發(fā)現(xiàn)它是否符合標(biāo)準(zhǔn),容易對這種標(biāo)準(zhǔn)實施的合規(guī)性進行檢查。過去讓政府主管部門去讀那么多標(biāo)準(zhǔn)是有困難的,但是如果我們做的事情有數(shù)據(jù)留痕,根據(jù)這些可以跟標(biāo)準(zhǔn)來比對,就能發(fā)現(xiàn)這些工作是否符合標(biāo)準(zhǔn),就可以更好地進行社會的治理,這也是標(biāo)準(zhǔn)數(shù)字化希望能夠?qū)崿F(xiàn)的一個好處。
四
標(biāo)準(zhǔn)知識的快速檢索。
一個標(biāo)準(zhǔn)文本往往很長,在一個執(zhí)行實施的項目里,可能只是用到這個標(biāo)準(zhǔn)的某一點或某一方面,并不一定涉及全部標(biāo)準(zhǔn),但是實施方需要將整個標(biāo)準(zhǔn)從頭到尾讀一遍,有些工作涉及到多個標(biāo)準(zhǔn),把所有有關(guān)的標(biāo)準(zhǔn)都讀起來,可能就比較難。為什么會導(dǎo)致現(xiàn)在有些工作沒有很好地符合標(biāo)準(zhǔn),實際上是覺得標(biāo)準(zhǔn)太多了,不知道這個事情跟哪個標(biāo)準(zhǔn)有關(guān),所以就導(dǎo)致了執(zhí)行可能不符合規(guī)定?,F(xiàn)在通過機器可讀無需下載閱讀大量的標(biāo)準(zhǔn)文本即可智能推送,實現(xiàn)快速的知識檢索,甚至通過機器直接編譯成工作指令或規(guī)則,可精準(zhǔn)地指導(dǎo)實施。標(biāo)準(zhǔn)數(shù)字化不僅僅是對標(biāo)準(zhǔn)制定部門和起草單位例如標(biāo)準(zhǔn)化技術(shù)委員會受益,也有利于標(biāo)準(zhǔn)的監(jiān)管部門如國家標(biāo)準(zhǔn)化管理委員會,同時對我們實施的部門也都很有幫助。
?
技術(shù)、體制方面的挑戰(zhàn)
標(biāo)準(zhǔn)數(shù)字化是工業(yè)革命以來標(biāo)準(zhǔn)化發(fā)展史的一次里程碑,是數(shù)字經(jīng)濟時代標(biāo)準(zhǔn)化的主要特征,為標(biāo)準(zhǔn)化工作創(chuàng)新展現(xiàn)難得的機遇,促進標(biāo)準(zhǔn)化方法和管理制度的變革,但也帶來前所未有的挑戰(zhàn)。
一
標(biāo)準(zhǔn)化管理的挑戰(zhàn)。
標(biāo)準(zhǔn)數(shù)字化本身不完全是技術(shù)工作,這里邊是有很多技術(shù)上的事要做,但還要管理上做相應(yīng)改革,需要重新審定標(biāo)準(zhǔn)制修訂流程與審批管理權(quán)限。我們原來的標(biāo)準(zhǔn)規(guī)定都是針對人來讀和人來執(zhí)行的,雖然每個人讀標(biāo)準(zhǔn)可能會有不同的解釋,但每一個標(biāo)準(zhǔn)都會注明解釋權(quán)的歸屬,標(biāo)準(zhǔn)的實施方遇到問題會申請解釋?,F(xiàn)在轉(zhuǎn)到了機器來讀,機器執(zhí)行的算法是人來編的,不同機器也可能有不同的理解,解釋權(quán)的歸屬沒有變化,還得回到標(biāo)準(zhǔn)的制定單位或標(biāo)準(zhǔn)實施的主管部門,但機器會認識到標(biāo)準(zhǔn)條款可能有理解的多義性而主動提出要求解釋嗎?在標(biāo)準(zhǔn)機器可讀的時代不能都交給機器仍然需要人介入,什么時候人要介入以及如何介入,需要在管理上加以明確。另外,按現(xiàn)在的管理規(guī)定,團體標(biāo)準(zhǔn)機構(gòu)需要具有在民政部注冊的法人資格,而負責(zé)制定開源軟件標(biāo)準(zhǔn)的開源社區(qū)不具有這樣的資質(zhì),標(biāo)準(zhǔn)化管理模式的改革需要適應(yīng)標(biāo)準(zhǔn)數(shù)字化做探索。
二
人工智能技術(shù)的挑戰(zhàn)。
利用人工智能技術(shù)分析大數(shù)據(jù),從錯綜復(fù)雜的事物中厘清來龍去脈,給出決策參考,在很多領(lǐng)域的應(yīng)用已經(jīng)表現(xiàn)出超越工作人員的智慧,但也要注意到人工智能通過內(nèi)部神經(jīng)網(wǎng)絡(luò)運算給出的結(jié)果可解析性差,往往是知其然不知所以然,無法說明為什么是這個結(jié)果,在一些重要的應(yīng)用中難免對人工智能給出結(jié)果的可信性有疑慮。標(biāo)準(zhǔn)的機器可讀會用到人工智能技術(shù)來理解語義,同樣也面臨人工智能技術(shù)方面的這些困境,如果某些很重要的事情按機器可讀的標(biāo)準(zhǔn)操作了,99%的時候可能是對的,但是并不排除有1%的時候會誤判。如何能避免人工智能導(dǎo)致的誤操作呢?在人讀標(biāo)準(zhǔn)出現(xiàn)理解偏差時當(dāng)然是人的責(zé)任,在機讀標(biāo)準(zhǔn)出問題時很難界定是機器算法的設(shè)計者還是機器的使用者或所有者須承擔(dān)責(zé)任。我們不能因為標(biāo)準(zhǔn)機器可讀會陷入到目前人工智能技術(shù)的誤區(qū)而放棄標(biāo)準(zhǔn)數(shù)字化的努力,任何技術(shù)不用是不可能完善的,還是要推動機器可讀的應(yīng)用,為了避免風(fēng)險,機器可讀標(biāo)準(zhǔn)可從那些即便出現(xiàn)機讀誤判也不至于產(chǎn)生很大影響的標(biāo)準(zhǔn)做起。
三
網(wǎng)絡(luò)安全的挑戰(zhàn)。
機器可讀必然會利用計算機系統(tǒng),信息技術(shù)是雙刃劍,網(wǎng)絡(luò)系統(tǒng)本身容易遭遇黑客木馬攻擊,網(wǎng)絡(luò)上有的風(fēng)險在標(biāo)準(zhǔn)數(shù)字化以后也會有這樣的風(fēng)險,可以想象使用“中毒”的機器來理解標(biāo)準(zhǔn)會有什么結(jié)果?標(biāo)準(zhǔn)數(shù)字化需要高度重視其所關(guān)聯(lián)的信息系統(tǒng)的安全性,并且重要的標(biāo)準(zhǔn)不能完全依賴機器來解讀,人要對機器解讀的結(jié)果把關(guān)。
?
任重道遠
標(biāo)準(zhǔn)數(shù)字化工作任務(wù)艱巨,需要有長遠規(guī)劃有序推進,當(dāng)前需要從以下幾方面做起。
一
當(dāng)務(wù)之急需要一個
關(guān)于機器可讀標(biāo)準(zhǔn)的標(biāo)準(zhǔn)。
明確機器可讀的要素以及用什么技術(shù)來支撐機器可讀。關(guān)于標(biāo)準(zhǔn)描述語言,前面提到XML可擴展的標(biāo)記語言,也有人提出用JSON語言,未來可能還會出現(xiàn)別的格式的語言,需要從中優(yōu)選,如果多語言并列的話還要解決兼容問題。對標(biāo)準(zhǔn)中的公式、算法、程序、流程圖、電路圖、曲線圖等都要有一個統(tǒng)一的機器表示形式。總之,對機器可讀標(biāo)準(zhǔn)中最基礎(chǔ)的元數(shù)據(jù)需要先有規(guī)定,國標(biāo)委部署了中國標(biāo)準(zhǔn)化研究院來做這方面的研究。中國標(biāo)準(zhǔn)化研究院、浙江省標(biāo)準(zhǔn)化研究院等也分別開過一些研討會,探討怎么做標(biāo)準(zhǔn)數(shù)字化的基礎(chǔ)工作。
現(xiàn)在ISO和ITU以及國外一些標(biāo)準(zhǔn)化機構(gòu)都在研究標(biāo)準(zhǔn)數(shù)字化,但到目前為止國際上也還沒有出臺一個大家公認的機器可讀標(biāo)準(zhǔn)的標(biāo)準(zhǔn),這方面起步還不那么容易。不過在個別領(lǐng)域已經(jīng)開始探索,出國旅行都要護照簽證,過去是靠邊防的人員來看,現(xiàn)在可以讓機器來讀。2017年出現(xiàn)了機器可讀護照的國家標(biāo)準(zhǔn),包括機器可讀護照、機器可讀簽證和機器可讀旅行文件三個部分?,F(xiàn)代的護照本內(nèi)有芯片,就像我們國內(nèi)的二代身份證,機器讀身份證和護照實際上是在讀芯片,把芯片的信息讀出來跟預(yù)存的信息對比。機器可讀護照的模式難以用到機器可讀標(biāo)準(zhǔn),將芯片嵌入到每一個標(biāo)準(zhǔn)文本中的方法難以推廣。
二
標(biāo)準(zhǔn)可讀可理解
需要建立相應(yīng)的專業(yè)平臺來支撐。
標(biāo)準(zhǔn)基本都是專業(yè)性的,對這些專業(yè)的理解不是一般的人工智能就能勝任,需要經(jīng)過訓(xùn)練。利用大數(shù)據(jù)技術(shù)從海量的標(biāo)準(zhǔn)文本中建立知識圖譜,構(gòu)建標(biāo)準(zhǔn)知識“本體”,發(fā)現(xiàn)機器可讀的規(guī)律。中國電子技術(shù)標(biāo)準(zhǔn)化研究院正在研究標(biāo)準(zhǔn)知識圖譜的規(guī)范,這也是一個基礎(chǔ)的研究,目前還未形成可發(fā)布的標(biāo)準(zhǔn)。不過標(biāo)準(zhǔn)覆蓋的領(lǐng)域非常多,僅有通用的知識圖譜還是不夠的,需要分專業(yè)領(lǐng)域來開發(fā)相應(yīng)的標(biāo)準(zhǔn)知識圖譜,開發(fā)和建設(shè)一批針對專業(yè)領(lǐng)域標(biāo)準(zhǔn)機器可讀的云平臺,例如機械、電子、生物、化工、冶金、建筑等行業(yè)的標(biāo)準(zhǔn)數(shù)字化技術(shù)平臺。這些工作需要國家標(biāo)準(zhǔn)化管理部門統(tǒng)籌協(xié)調(diào),責(zé)成有關(guān)部門開發(fā)建立這樣的平臺,幫助促進標(biāo)準(zhǔn)數(shù)字化的應(yīng)用。據(jù)了解我國國標(biāo)委曾經(jīng)部署在航空專業(yè)領(lǐng)域探索機器可讀標(biāo)準(zhǔn)的研究與可能的技術(shù)支撐。
三
人才培訓(xùn)。
我們原有寫標(biāo)準(zhǔn)的人應(yīng)該說很多都是老手,知道怎么寫標(biāo)準(zhǔn),用標(biāo)準(zhǔn)的語言都比較簡潔,而且很少歧義。但原有的標(biāo)準(zhǔn)化老手未必勝任編寫用XML等語言來描述的機器可讀標(biāo)準(zhǔn),通常的IT的專家也并不熟悉標(biāo)準(zhǔn)化的規(guī)則與行業(yè)的技術(shù)。既要熟悉專業(yè),還要熟悉原來標(biāo)準(zhǔn)編寫的規(guī)則,還需要熟悉使用機器可讀的技術(shù),這樣的人才絕對是稀缺的。標(biāo)準(zhǔn)數(shù)字化的人才培養(yǎng)問題需盡早提到議事日程。
四
建立標(biāo)準(zhǔn)數(shù)字化的管理規(guī)范。
標(biāo)準(zhǔn)數(shù)字化是個新問題,涉及到標(biāo)準(zhǔn)化全生命周期的管理,我們需要針對性地修改標(biāo)準(zhǔn)化相應(yīng)的規(guī)定和流程,否則標(biāo)準(zhǔn)機器可讀化這種文本形式及其產(chǎn)生方式的合法性就是個問題。標(biāo)準(zhǔn)化具有很強的國際性,標(biāo)準(zhǔn)數(shù)字化的研究需要加強國際合作。另外,標(biāo)準(zhǔn)數(shù)字化不能一哄而起,需要有規(guī)劃做好試點再推開,機器可讀標(biāo)準(zhǔn)的最有效應(yīng)用場景是生產(chǎn)現(xiàn)場的裝備按標(biāo)準(zhǔn)自動執(zhí)行流程,這些領(lǐng)域的標(biāo)準(zhǔn)機器可讀化可以先行推進?,F(xiàn)有這么多存量的標(biāo)準(zhǔn)都要變成機器可讀其工作量很大,需要從長計議。總之,標(biāo)準(zhǔn)數(shù)字化對于標(biāo)準(zhǔn)化發(fā)展是難得的機遇,對從事標(biāo)準(zhǔn)化研究、標(biāo)準(zhǔn)制定和實施及標(biāo)準(zhǔn)化管理部門也是新的挑戰(zhàn)。
信息來源:《中國標(biāo)準(zhǔn)化》