大資料城市的智慧型轉型

2022-12-26 21:09:02 字數 5153 閱讀 6953

進入二十一世紀的第二個十年,實現工業資訊化、農業現代化和城鎮新型化已經成為中國特色社會主義建設發展的乙個戰略需求和當前的緊迫任務。那麼這三個方面的交匯和融合發展使我們必須以資訊化為統領,以建設新型城鎮化為抓手才能夠圓滿完成。在過去十年裡頭以資訊化城市大資料城市智慧型城市等等這些已經成為學術界各種相關論壇和**熱議的話題。

實際上任何乙個行業或者乙個區域的資訊化過程,都可以分為兩個階段。第一階段是數位化階段,這包括資訊的感測、儲存、計算、傳輸和控制的網路化和數位化。第二階段就是智慧型化,就是它是數位化的更高階段。

那麼這個數位化城市我想現在大家已經意見都比較統一了,什麼是數位化城市呢?就是如果這個城市能夠最大限度地使用數字感測技術、網路技術和計算技術構成的資訊基礎設施,在雲計算的軟體環境下,對城市的人口、資源、環境、經濟、社會等大資料加以計算和處理,把反映城市社會的各種大資料有效地整合,用於規劃、**、運營、以及城市監管,來提公升**部門的管理和決策能力,提高城市居民的生活品質,這就是如果做到了這一點,那就是達到了數字城市的要求。比如說歐美發達國家的一些主要地區,以及包括我國在內的新型國家的發達地區和城市應該說基本上現在都實現了數位化的目標。

從數位化到城鎮化的這個智慧型轉型,應該包括哪些任務呢?我認為就是智慧型城市,城市的智慧型化和數位化的標誌性的區別有三個:第一就是智慧型城市是乙個複雜的資訊生態系統,它要提供下屬三種標誌性的服務,深度查詢、定律發現、決策生成,這相當於智慧型裡頭的發現知識、使用知識、然後改造社會這都包括在智慧型查詢定律發現和決策生成裡面。

下面我要乙個乙個來談談它們應該是什麼東西。

那麼從大資料處理角度,智慧型城市和數位化城市的區別我覺得在於智慧型城市要建立乙個對於非結構化資料的乙個統一的模型。這個等會兒下面我也要想談談這問題,第三從軟體開發角度看,就是智慧型化的城市要使用軟體的群體軟體的開發方法。

第一,什麼叫做深度查詢?比如現在咱們大家向google也好,百度也好,輸入一條資訊:「我經常頭疼噁心,有時候嘔吐,看東西不清楚,偶爾出現耳鳴,我應該怎麼辦」,我想解決我當前的這些問題。

我這是google的回答,我用了0.54秒查出了42900條跟你這個數有關的網頁請你逐個兒察看,前三條就是我這兒前三條。這就是資料查詢,資料查詢和我們智慧型查詢區別在**呢?

資料查詢你是從42900個網頁這些東西裡頭去找。

所謂智慧型化的深度查詢,就像人一樣,我們到醫院或者是直接看乙個大夫,他首先要進行導醫服務,跟你先查一下判斷你是什麼病,機器如果有這個智慧型應該怎麼樣?第一步機器就回答根據你輸入的東西,你有可能有下屬四種可能,第一種叫做頸椎病,我今天上午沒參加會就是去看頸椎病,也可能是腦部腫瘤,也可能是美尼爾氏證,也可能是感冒。醫生就是**子給一些東西給乙個初步的診斷,下一步計算機,假設我選擇了腦部腫瘤,接著計算機就應該給你深度查詢所謂知識上的交流就應該給你回答有三種醫治的方案,三套方案,第一套方案是建立腫瘤醫院提供給你,第二個是有關腦瘤腫瘤醫生按照現在按照排行榜把名單列給你你可以隨便挑選,或者是根據你現在的症狀你可以服用什麼樣的藥,提供給你,來供使用者選擇。

如果我選擇了醫院,而且我選擇了中國醫學科學院腦腫瘤醫院,它就會回答中國科學院腦腫瘤醫院,它就能夠回答你具體所有需要的知識,比如說**,****我應該注意哪些事項怎麼**,第二種醫藥費你也可以參考我腫瘤需要多少錢,如果是外地來怎麼方便查詢。這樣的查詢是深度查詢,跟以前查詢有什麼不同,就是它已經不是資料交換,而是知識交換,你查到的知識。要實現這樣深度查詢,實際上用到的東西首先說我們輸入了頭疼噁心,這就叫做使用的方法就是歸納猜想,歸納推理,我們從乙個症狀就界定你乙個性質是腦瘤還是美尼爾氏症。

然後你選擇了腦瘤之後,你的選擇實際上就是大家討論的關聯。本來大家選擇腫瘤醫院腫瘤藥物都是不同的個體,儲存在不同的地方,因為他們有共同的症狀共同點,所以計算機把它們都挑出來來供給你選擇,但是一旦選擇了腦腫瘤之後,是中山大學還是腫瘤醫院,我都推給你,這就是邏輯推理。

另外就是中國醫學院腫瘤醫院的**手續,路線圖,醫療費用,這些原始資料等於你每個個體和實體和原始資料之間的勾連,連線。

深度查詢是提供知識而不是網頁的一種和人的使用者的知識交流。這個系統從描述事故的現象或者初步症狀開始,通過人機互動的方式,系統提供與現象或者症狀相關的所有可供選擇的概念和實體,在使用者作出選擇以後系統查詢出與之相關聯的本體和相關聯的知識圖譜,在與使用者深度知識互動中,系統邏輯推理,歸納,關鍵演算改變現狀的所有網上可能的與之相關的解決方案和知識,這是知識層面的交流。這就是智慧型,這就是一種智慧型,是我們知識方面的交流。

比如現在大家最近前一段討論的turing test,是一種特殊的深度查詢,這是第一種應該有深度查詢的功能,這是我說的第一點。

要建立這樣深度查詢,我們需要做什麼呢?我們需要最好就是在對原始資料來講有乙個統一的四面體,有乙個統一的資料模型,這個等會兒***要講。另外要計算機裡面要存有大量的本體、實體、知識圖譜,本體、實體知識圖譜類似的實體原始資料連線,包括推理機制都應該在軟體裡頭提供。

這就是我說的第一種智慧型應用,智慧型轉型的第一種應用。

第二種就是叫做規律發現。大家可能以前學過邏輯或者是感興趣的科學發現的感覺,我們都知道,不論是經典資料邏輯還是卡爾波普爾的科學發現的邏輯原子語句都是這些語言中不可再分的物件。科學學問都是有乙個形式化的語言叫做一階語言,一階語言包括原子語句和復合語句,復合語句就是有語言邏輯結構的問題,原子語句就是出發點,包括概念和數量之間的關係,這就是方程式。

實際上概念和他們之間的方程式,這些東西是構成了每乙個科學理論的核心,剩下的東西邏輯之間都可以通過計算出來。原子語句這套東西在邏輯學裡面是不研究的,過去是靠科學家通過實驗眼耳鼻舌喉決定,現在是通過大資料,大資料裡面怎麼通過資料怎麼提取概念,怎麼提取概念之間的方程式,這就成了當今的所有搜尋,大量的研究都在這方面。凡是有這樣的功能從感測器直接得來的資料然後產生關係的東西我們叫規律發現,如果都有這就是智慧型應用的乙個方面。

比如說舉個例子,其實核心咱們看所有的歷史從亞里斯多德開始一直到現在的科學家們,比如牛頓,牛頓最重要的貢獻是力學,力學裡最核心的是什麼東西?就是牛頓發現了這些,第一基本概念,力、質量和加速度,特別是力和質量以前古希臘就有,加速度是真正的牛頓的發現。這是提出了乙個概念,概念之間的數量關係是什麼呢?

就是f力等於質量乘上加速度,這些東西都叫做原子語句再從邏輯學角度,對原子語句發現過去專家從眼耳鼻舌身的感覺,現在是人們通過分析找到這些概念,同時找到這些概念之間的數量關係,下面所有東西都是這五個方面可以解決。

所以,定律發現就是系統通過獲得的描述事物相關的大資料統計分析計算,通過人機互動方式提取本質的原子概念,以及以數學方程式的形式給出的與此事物有關的概念與概念之間的精確關係,有這一部分就是知識的發現。

什麼是決策生成呢?我這兒舉個例子,比如說北京天通苑地區8平方公里現在一共是91.5萬人,主要進城的道路有兩條,一條是回龍觀到g6然後繞行進京,第二個路線就是從立湯路到安立路進到城,現在是早高峰運輸人數14萬人,因此天天超載安全舒適性很差,交通堵塞路上交通時間很長,問題根源在**呢?

假設如果每輛車乘70個人,平均早上9點每分鐘發10輛公交車的話,要2000次車,這車擺40公里才能把人運輸出去,所以這是每天的問題。現在如果我們想給百度輸入這麼一條資訊,天通苑交通擁堵我要尋求解決方案,那麼它也是在幾秒鐘之內回答說我這兒一共有124000個網頁供你參考,具體地比如說我今天住在天通苑,我今天希望7點上班8點到班上行不行,這個交通情況怎麼樣,沒法給你解答,有了智慧型化以後將會變成什麼呢?

先說大資料的情況,現在我們北京這塊也算是數字城市,經過大資料的分析就發現居民對於一**這塊14萬人都是有的,居民出行主要通往城市有38個地區現在已經分出來誰在什麼地方,但是實際上只有9個地區是他們的主要目的地集中了83%的人口,這就是現在的大資料的計算情況。

我們希望智慧型與轉型到什麼情況?就應該是這樣,也是應該是人機互動式的,比如說我輸入天通苑交通擁堵解決方案,首先計算機回答你高屋建瓴的,你現在尋找今天解決方案還是長遠解決方案?我當然選擇今天的方案,今天我怎麼辦。

這個計算機就應該接著就告訴我說你挑選有幾種辦法來解決,你是希望優化公交排程還是熱點區域直達的辦法還是優化作息安排和繞行其他道路安排的辦法。比如我挑選既要公交排程又要短期方案,我什麼時候合適?根據計算機個體意願我今天最佳出行時間和上班時間,推動我個人,你把你的建議既發給我而且同時同時又發給我的老闆,告訴我的領導我今天上班晚乙個小時,下班晚乙個小時,這就可以不扣通勤。

這就是人工智慧的解決辦法。智慧型解決辦法包括實際上通過人機互動作用,不斷地把整個問題理清是個什麼問題,比如舉個很簡單的例子,假設乙個公交車的負荷就是p階,發車的城市是y階,然後p接乘以y階,大於x,等等變成了數字描述的條件,這個條件我們最後求的總的運輸量,p階乘上y階求極大的值,這就是整個優化問題,其他就變成了邊界條件和出使條件,這些都是通過人機互動的作用輸入進去,然後繼續問你打算用什麼方法解決,用動態方式還是靜態方式各種演算法,現在網際網路上有各種演算法完整的資料庫供大家挑選,當然也是專家挑選。

所以總體來說,決策生成就是針對使用者的要求,通過人機互動的方式對本體、實體概念屬性多層次的歸納猜想,邏輯推理關鍵操作來處理,提供與之相關的決策型別,你是求極大的值還是極小值。這個結果出來以後根據問題數學模型並且根據人機互動作用把初始條件給出來,最後根據求解方程根據使用者提供群體的統計規律和群體動態演變過程,並且根據群體每乙個個體要求給出針對個體的解決方案,不僅僅是我們找到乙個統計規律就完了,最終的目的是給每乙個人每乙個個體解決方案,做到群體優化,這不僅是剛剛發現知識,使用知識,而且是解決問題更高的智慧型。所以我認為這是智慧型轉型如果能夠具備這三種功能,深度查詢,規律發現和決策生成,那麼我們才可以說我們完成了數位化城市的智慧型轉型。

軟硬體方面需要做什麼呢?首先就是很重要的問題就是當前需要原始資料的語意方面非結構化資料的統一模型。就是城市的大資料是承載知識和資訊實體,通過多種數位化和感測器來自城市各個角落和人群來自於不同的知識領域,他們可以是結構化資料,過去原始資料,也可以是非結構化資料,比如語音、**、**等等,來自於格式不統一,而且既使是同乙個時間版本不統一,極大的增加了資料難度處理的效率,所以需要統一的模型,我覺得這個很重要。

我就不詳細講了,這模型應該有統一性關聯性可擴充套件性。

另外我想給大夥兒再談乙個群體軟體,就是軟體工程的辦法也跟傳統的不一樣了。城市是乙個複雜的社會生態系統,它的組成和演化的基本特徵就是巨集觀就是市政管理機構對城市的巨集觀規劃和對城市資源配置的比較調控,微觀上就是競爭和市場機制對城市資源配置和城市發展的決定性作用。這是咱們每乙個城市都是這樣的。

群體軟體工程,智慧型城市是乙個複雜的資訊生態系統,它在每乙個時刻所擁有的大資料都是承受社會生態系統的數字映象,是關於市政機構對城市巨集觀調控和市場機制對城市資源配置和發展起決定性作用的乙個描述。

這種東西怎麼來開發?能不能請微軟來開發乙個智慧型北京行不行?現在有點問題。

為什麼?我給大家解釋,傳統的軟體定義方法就是精英化,是google還是微軟,都是名牌大學的優秀學生,專業骨幹。第二是計畫性,整個開發過程都是封閉的,保證開發安全。

這樣的優點是程式設計序的質量高,歷史已經證明只要沒有惡意的攻擊,像微軟我們大家天天使,非常好用的乙個軟體系統。

大資料時代教育的三大轉型趨勢探析

空蜒嘞熬贏薰 口席曉圓 趨勢撅櫪 南京市教育科學研究所,江蘇南京 自 年起,大資料 一詞越來越多理能力 做更新更炫的廣告 搞些 活動 這 地被提及,人們用它來描述和定義資訊 時代產生的海量資料,它並具有大容量 多樣性高速度 與大價值 的特 性。大資料作用於醫療就可以成功 非典的發生,些方式當然都會很...

基於城市交通的大資料社會計算

基於城市公交情況的城市大資料應用 劉平成 中科院高能物理研究所,北京,100049 摘要 現在網際網路大資料越來越多的應用在社會計算的學科之中,人們的生活 出行方式,人們通過上傳資料 共享資料,共同完成資料收集的過程,分享資料處理結果,形成良性迴圈。本文基於城市的公交系統,簡單分析了幾種城市公交情況...

構建大資料智慧型商業生態系統

作者 張巨集俊 安家 2015年第05期 對於實體商業來講,在電商的衝擊下,到底還有沒有人上街?我們看看最近的資料。從2012年 2013年 2014年來看,其實實體商業平均的日客流是有增長的,包括2014年我們有4.8 的增長,這是整個實體商業的資料。而對不同的業態,可能也有些微區別。乙個是購物中...