發布時間:2019-03-27 08:44:40
當物質世界的潛力越來越難以挖掘的時候,通過數據分析提供的指導來優化物質世界運行,有望打開廣闊的增長新空間,讓一切都可以計算、分析和預測。信息化時代最重要的核心資源就是數據,各行各業對大數據的運用相當廣泛。大家都在談大數據,那么究竟什么是大數據?大數據目前的發展態勢是什么?有哪些產業應用呢?
在中國建筑業協會智能建筑分會2019會員代表大會現場,中國信息通信研究院 云計算與大數據研究所副所長 張雪麗從大數據概念與重要意義、大數據發展態勢與關鍵問題,以及中國信通院大數據及相關領域工作三方面進行大數據深度解讀。
張雪麗,中國信息通信研究院 云計算與大數據研究所 副所長,大數據與人工智能領域主席,長期從事人工智能、業務與應用、工業互聯網、物聯網等領域的國際合作、國家專項、軟科學研究、標準制修訂等工作,其研究成果獲得多個部委級獎項,包括一等獎4項,二等獎4項。作為專家支持中歐ICT對話,歐盟地平線2020 EXCITING 項目、第七框架CHOICE、PROBE-IT項目中方負責人。
大數據概念與重要意義
大數據
大數據就是把物理世界通過信息化方式映射到數據世界,讓一切都可以計算、分析和預測。反之,通過這樣一個數字化過程,也可以對我們的物理世界進行反饋、控制和優化。大數據是4V特征的數據集合,即Volume數據量大、Variety類型復雜、Velocity速度快、Value價值。
近年來,我們國家大數據政策熱度持續攀升,2014年大數據首次寫入政府工作報告,2016年十三五規劃綱要”提出“實施國家大數據戰略”,2017年12月中央政治局就實施國家大數據戰略進行集體學習,近平總書記提出了五個方面的要求:推動大數據技術產業創新發展、構建以數據為關鍵要素的數字經濟、運用大數據提升國家治理現代化水平、運用大數據促進保障和改善民生、切實保障國家數據安全。
同時,我們國家大數據產業繼續高速增長,企業數據總量與結構逐年變化,數據來源愈發多樣。根據中國信息通信研究院結合對大數據相關企業的調研測算,2018年我國大數據產業規模為6200億元人民幣,與2017年4700億的規模相比同比增長31.9%。預計到2020年,全球數據總量將達44ZB,我國非結構化數據占比達到90%,數據增速快、處理速度和實時性要求高,運用非常規工具完成數據處理將產生巨大價值。
大數據產業應用
近年來,我國大數據產業從無到有,全國各地發展大數據積極性較高,行業應用得到快速推廣,市場規模增速明顯。
政府政務:推動政府公共數據資源開放共享,促進政府治理能力的精細化
健康醫療:建立統一電子健康檔案和電子病歷數據庫
互聯網金融:應用大數據的精準分析和預測能力,發掘金融行業數據資源
教育文化:建設共享應用平臺系統,完善教育管理公共服務平臺,整合優化教
育資源
工業制造:推動“吸包設計”、個性化定制、云制造等新型制造模式的產生和發展
大數據發展態勢與關鍵問題
大數據熱點
數據是無形資產已成共識,價值評估成為關鍵;
相對于傳統數據管理,數據資產管理模式升級顯現;
數據資產管理工具日趨成熟,服務標準化成為趨勢;
大數據技術不斷創新,呈現諸多融合趨勢
發展態勢
從大數據技術本身來講,也呈現出大分析、大事務、大融合等新的發展趨勢。
大數據分析技術:逐步轉向分布式快速迭代,軟硬結合,逐步與人工智能相融合
大事務處理技術:生產系統/生命線/門檻高,目前正在轉向分布式
大數據流通技術:用技術手段緩解數據共享矛盾,以往技術力量被低估
應用路徑
大數據與實體經濟融合提速,但不均衡現象突出,主要表現在以下幾方面。
1. 行業分布不均衡:大數據與金融、政務、電信等行業的融合效果較好,而在其它眾多行業的融合效果則有待深化,與實體經濟融合領域還在發展初期。
2. 業務類型不均衡:大數據融合應用主要集中在營銷分析、客戶分析和內部運營管理等外圍業務,在產品設計、產品生產、企業供應鏈管理等核心業務的滲透程度還有待提高,大規模應用尚未展開。
3. 地域分布不均衡:受經濟發達程度、人才聚集程度和技術發展水平影響,大數據應用主要分布在北京、上海、廣東、浙江等東部發達地區。中西部地區雖然市場需求較大,但發展水平仍較低。
(數據來源:2017大數據產業地圖,中國信息通信研究院)
大數據技術不斷創新,呈現諸多融合趨勢,面臨著數據量增長,存儲成為瓶頸;非結構化數據處理成為挑戰;個人數據保護問題備受關注;數據實時處理需求不斷提升等諸多問題。與此同時也相應產生了以下幾點技術創新思路:
1. 數據存儲硬件不斷升級,閃存、PCM等新型存儲介質不斷發揮作用,其物理特性、讀寫特性等均與磁盤有著顯著的不同;
2. 存儲處理一體化框架得到應用,二維堆疊、嵌入式NVM(非易失存儲器)等技術在非結構化處理方面取得突破;
3. 匿名化技術、差分隱私技術、同態加密技術以及與安全多方計算、區塊鏈的融合逐漸落地;
4. 批處理與流計算結合,Beam、Spark、Flink等傳統批處理軟件的流計算功能增強。
數據已經成為最重要的戰略資源,隨著國家大數據戰略推進實施以及配套政策的貫徹落實,大數據產業發展環境將進一步優化,社會經濟各領域對大數據服務需求將進一步增強,大數據的新技術、新業態、新模式將不斷涌現,產業規模將繼續保持高速增長態勢。