• <menu id="csacu"></menu>
  • 提交中...

    << 返回

    數說智慧水務:大數據中的“大”、“數”、“據”(一)

    分享: 發布日期:2018-01-02作者:高雅麟10950 0
    以數據的名義,說一說智慧水務

    菜鳥與順豐之爭,似乎讓大家忽然明白,數據真的是資產,而資產就是可以賣錢的,可以在資產負債表在予以體現的。前幾天,我在博客上發了一篇“《菜鳥有點菜,順豐不太順:向谷歌學習格局》(http://gaoyl2003.blogchina.com/482502200.html)”的文章。中間提到了幾個觀點:

    一是大數據歸誰所有。菜鳥平臺、順豐快遞、水費者似乎都是這些數據的創造者,他們都應該是數據的擁有者。只是誰都沒有承認誰是主角,誰是配角,誰在臺前,誰在幕后。這個問題沒有搞清,數據之爭,只是時間問題。

    二是大數據需要避免壟斷。很多數據其實是公共資源,它可能在隱私權的形式出現,需要以法律為準繩予以保護;它也可能在是公開的信息,以共享的形式供社會使用者合理的免費或付費的方式進行查詢。

    三是大數據的使用需要授權。使用數據者,需要得到數據所有者的法律許可,必須聲明使用的場合與用途,從而決定許可的形式。

    四是大數據的使用者必須負責,包括法律責任,也包括為數據使用所必須支付相應費用的經濟責任。

    互聯網時代,以上四點將是一具普遍性的問題,水務數據也不例外。所以說一說水務數據,是非常具有現實意義的話題。

    接著上一講,我來來談一談智慧水務中大數據的特點。

    “大、數、據”

    智慧水務與大數據的關系,一言以蔽之:數據業務化,業務數據化?;谶@些認知。我分別從“大”、“數”、“據”三個層面上分別討論。

    大,是指數據的特點;

    數,指數據的內容;

    據,是指數據的邏輯關系。

    本月我將在水視點網站www.washingtondc-electrician.com及水務經理人公眾號(waterchinese)上獨家分享,難夠掛一漏萬,或有失偏頗,我將不斷完善文內容,請大家隨時關注,也歡迎同行不吝批評指正。

    今天先講一講大數據中的“大”


    大,四層意思:更多、更雜、更快、更好。

    1更多

    更多的意思是:通俗講,數據的數量比以往更多,但不僅僅是數量上的多。

    隨著數據采集手段的改進、渠道的增多,尤其是互聯網的工具應用,信息的爆增,我們對數據的收集數量上有一個猛增,因此數據在量上的突破,從而引發了質的突變。因此,“總體=樣本”的設想,成為了可能。我們以前的觀念總是對“采樣”做一些很深的研究,因為采樣的方式往往決定了結果是不是客觀,正確的。在實踐過程中,‘采樣’的行為不可避免地帶有主觀性,從而使樣本失去了代表性,這是致命的弱點。所以“更多”的特點,是大數據的一個最基本的價值體現所在。

    而智慧水務數據中的“更多”,與以前的水務管理模式相比,無論是在內部運營,對外服務過程中,數據上也確實有了相當的進步,但目前存在的瓶頸是:一是在內部運營的數據中,感知層的數據采集數量過少。由于資金與技術上的障礙,導致硬件投入不足,采集量與“大數據”的概念并不匹配。當量上沒有一定突破的時候,便導致樣本的不足,對智慧水務的“智能決策”上,就存在一個天然的短板。比如,管網DMA管理中,在線流量壓力監測的點不夠,失去了精準判斷漏點的能力。

      有了“多”的概念之后,機器的學習功能,才可以下下顯現。機器的學習功能必須建立在大數據的基礎上,使它具備不同于人類的認知方式。比如說,機器如何認識一只貓,如果數量過小,它可能會把貓認成虎或貓頭鷹,但當機器記憶了一萬張、一億張各種貓的圖片的時候,它的認知準確度和速度都會遠遠超過人類。推而廣之,如果我們收集了關于供水區域范圍內的一萬個停水、漏水的狀態時,機器的學習功能,基本上可以有一個可靠判斷或預警的功能了。至于機器如何識別,它的研究就交給專門的研究機構吧。你只需要知道,機器的思維方式、判斷方式不是你想象中的思維方式。電腦的學習功能,對水力模型的應用方式或許會有質的突破。

    只是目前的問題是,水務數據不遠沒有達到這個量,因為感知層的硬件投入(或說經濟投入)不足以支撐這個“多”的要求?;蛘哒f,目前狀況下,感知層的硬件投入產出比過大,從經濟投資角度來講是不經濟的。于是,智慧水務系統的感知層過少,是一個痛點!缺少了豐富的數字神經系統,智慧水務的數據效用,自然也受到極大的制約。

    2更雜

    更雜的意思:作為信息載體,數據將會變得更加繁鎖、復雜。所以,大數據中有一個非常明顯的特點,就是允許不精確?;祀s性,是大數據固有的特點。由于它的“多”,導致數據結構無法細致分類,形成了非結構化的數據,所以新的數據庫設計也從而形成。在實務中,我們從大數據中,快速獲得一個大概的輪廓(發展趨勢),比嚴格的精確性更具有現實中的指導意義。比如:數據之間的因果關系并不明顯,但相關性就成為非常明顯的現象。所以,在大數據思維下,一個體系對數據分析與加工的過程中,更多考察的是大勢的相關性,而不是精確的因果關系。在“更多”的基礎上,體現出大量數據的優勢,使考察許多事件的相關性成為可能。

    而模型的建立,是關鍵要素。數據的維度也讓分析方法變得更加豐富多彩。物理世界與數學世界將會更加深入的融合,物理世界就是感知層,數學世界就是數學模型針對感知導的數據進行邏輯運算。

    顯然,大數據關注的首先是相關性,而不是因果關系。相關性比因果關系,在現實中具有強烈的指導意義。主要原因在于:一是因果關系比較精確,而模糊性的定性結論往往在實踐中具有更多的應用場景;二是相關性是大數據中優勢的一個明顯突破。在量上的采集使相關性的揭示與驗證成為一種可能。

    用水量也電視劇的關系。就是一個非常典型的安全。就是我常講的一個非常典型的案例。大家可以在我寫的《智慧如何引領水務》一文中查看。

    3更快

    更快可以理解為:實時、即時的傳遞。數據作為信息流,作為業務流,在傳輸的時間上也不要求。包括感知層上的一些傳感器的性能要求。比如數據延時的問題,傳輸過程中的誤差問題。對數據的應用不同,對傳輸速度,傳輸頻率,傳輸精度、正確度就會有不同數量級的要求。

    在智慧水務實踐中,水質、水量、水壓的信息采集,機電設備的溫度、噪音、電耗等運營指標的采集,水力模型、GIS系統、內部流程管理、數據分析決策系統的數據流處理,等等不一而足。又比如:污水處理廠廠區內工藝調整,往往根據外圍集污管網中關于水質、水量的情況來進行及時調整,確保出水達標排放,這就與數據的傳遞速度非常相關。而水務行業中,在這個“快”字上,仍然是一個瓶頸,外圍水質的突變對生化系統的沖擊,在技術手段上仍然存在極大的障礙。


    4更好

    更好的意思:數據發揮的效用會更好,并形成一個完整的價值鏈,改變個體,即改變總體。收集的速度會更快,分析的邏輯關系在一個合理的模型中,將功能發揮得心應手。分析工具+專業背景,將是大數據加工分析的一個根本組合。相關關系的核心是量化兩個數據之間的數理關系,這就需要一個好的數學模型;行業需要有自身的,內在的邏輯關系體現在數學模型中,所以又需要一個專業背景。兩都不可偏頗。

    就象要判斷一個人,還可以看看他的朋友一樣,要判斷一個數據的價值,就得找到與這個數據相關的關聯物,只有它可以更好地幫助我們捕捉現在和預測未來。比如說超市中,尿布與啤酒放在一起銷售可以大增,比如說沃爾瑪通過大數據分析,發現颶風來時,草莓味的蛋糕銷量就會大幅上升。颶風、蛋糕、尿布、啤酒,就是我們需要關注的關聯物。這是讓數據“更好”的一些技術與技巧,此處不細述。


    又比如, 水務數據是人們生活習慣的一個體現,同時也是一個地方區域的經濟發展的晴雨表,而即時數據,與人口分布、交通狀況、天氣狀況、生活水平都存在著相關性。智慧水務中體現的數據,可以與“智慧城市”、“海綿城市”、“政務云”等項目互相融合,以數據為橻帶,使它位成為“數學模型”不可分割的一部分,從而體現出1+1〉2的集聚效益。所以,就象一滴水放入大海,可以保持它更強的生命力一樣,智慧水務的數據需要融入到“智慧城市”的大數據中去,才可以發揮它“更好”的價值。


           舉個簡單例子,最近浙江政府推出的“最多跑一次”的業務辦理,得到基層百姓的占贊。表面上看去是一個辦理流程加快的便民服務,或是“政治任務”,實質上也是對政務辦理流程數據業務流的一次挑戰與完善,水務便民措施,也是對智慧水務數據業務的一個檢驗與挑戰?!白疃嗯芤淮巍?,不是說百姓與水務部門溝通一次就夠了,而是指通過技術手段、加快了業務數據的流轉速度,從而達到了“便民”的目的。這就是水務數據中從“更快”向“更好”的華麗轉身。



    給這篇稿打賞,讓作者更有動力

    發表評論

    打賞

    用微信掃把完成支付

    在線調查

    在線調查

    提交中...

    明星被爽到呻吟的视频
  • <menu id="csacu"></menu>