隨著大數(shù)據(jù)的快速發(fā)展,很多行業(yè)的都已經(jīng)慢慢建設(shè)自己的大數(shù)據(jù)平臺,利用數(shù)據(jù)的價(jià)值,給自己帶來更多的利益。坦率地說,與同各行業(yè)相比,高校信息化發(fā)展已經(jīng)處于比較落后的水平,數(shù)據(jù)質(zhì)量總體情況依舊比較差。雖然其重要性已獲得眾多高校的共識,但很少有學(xué)校真正投入人力、財(cái)力去對數(shù)據(jù)進(jìn)行治理。隨著數(shù)據(jù)服務(wù)的深入,數(shù)據(jù)的質(zhì)量問題將會是數(shù)據(jù)治理解決方案里的一個絆腳石。那么如何才能解決數(shù)據(jù)的質(zhì)量問題呢?
為了保證數(shù)據(jù)的質(zhì)量,強(qiáng)智科技建議在數(shù)據(jù)的整個生命過程要統(tǒng)一規(guī)劃、有效采集、合理存儲。
首先要制定統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),對于采集的新數(shù)據(jù),應(yīng)采用新的標(biāo)準(zhǔn)進(jìn)行采集、清洗和轉(zhuǎn)換,對于現(xiàn)存的數(shù)據(jù),要進(jìn)行一致性校驗(yàn)、清洗、信息補(bǔ)充等,未來保證數(shù)據(jù)時效性,要保證數(shù)據(jù)采集、傳輸過程的時效性。
其次,目前很多大數(shù)據(jù)采用的是普通云架構(gòu)的存儲方式,這種存儲方式是面向應(yīng)用程序運(yùn)行的。但是對于數(shù)據(jù)分析,應(yīng)該采取分布式的存儲方式,以便采取分布式的算法提供分析效率。
除此之外,數(shù)據(jù)質(zhì)量的完善很難一蹴而就,有一個逐步完善的過程。所以人們需要改變數(shù)據(jù)屬性的觀念,逐步從“我的數(shù)據(jù)”到“部門的數(shù)據(jù)”再到“學(xué)校的數(shù)據(jù)”,把數(shù)據(jù)從“私有”變?yōu)?ldquo;公有”,共同來維護(hù)數(shù)據(jù)質(zhì)量。同時還需要完善管理機(jī)制和數(shù)據(jù)標(biāo)準(zhǔn),科學(xué)規(guī)劃,重構(gòu)數(shù)據(jù)基礎(chǔ),以“面向?qū)ο?rdquo;方式有機(jī)組織教學(xué)、科研、財(cái)務(wù)、人事、生活等各類數(shù)據(jù)資源。
事實(shí)上,隨著科技的進(jìn)步,高校想要更方便、快捷地做好數(shù)據(jù)治理工作,可以借助一些先進(jìn)的數(shù)據(jù)管理平臺。比如強(qiáng)智科技的數(shù)據(jù)治理平臺,以用戶為中心,以元數(shù)據(jù)為基礎(chǔ),貫穿信息標(biāo)準(zhǔn)、數(shù)據(jù)采集、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)質(zhì)量、主數(shù)據(jù)管理、數(shù)據(jù)共享等從源端到數(shù)據(jù)中心,再到應(yīng)用端的全過程管理,并通過大數(shù)據(jù)治理,讓用戶能更便捷、更靈活、更準(zhǔn)確地獲得大數(shù)據(jù)資產(chǎn)的能力。