大資料可以用來「證偽」卻不能用來證明

2022-12-28 00:30:02 字數 887 閱讀 8328

作者:李迅雷

**:《中國商人》2023年第11期

3年前,我曾經以《相信奇蹟還是相信邏輯》為題做過一次演講。核心觀點是,從古至今,國人的形象思維比較發達,但形式邏輯偏弱,建議用資料說話,提倡理性思考。今天,在人人都講大資料的時代,我們該如何看待和運用大資料?

當大資料不合邏輯時,究竟是相信大資料還是相信邏輯?

相信個案還是相信大資料

大約從2023年開始,「大資料」成為網際網路資訊科技行業的流行詞彙。美國網際網路資料中心指出,網際網路上的資料每年將增長50%,每兩年翻一番,目前世界上90%以上的資料是最近幾年才產生的。

資料又並非單純指人們在網際網路上發布的資訊,全世界的工業裝置、汽車、電表上有著無數的數碼感測器,隨時測量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也產生了海量的資料資訊。

有人把資料比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大資料並不在「大」,而在於「有用」。

價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模資料成為贏得競爭的關鍵。

2023年諾貝爾經濟學獎獲得者托馬斯·薩金特近期在中國公開演講時認為,人工智慧實質上就是統計學。我覺得他說的有一定道理,但過於簡單粗暴。其實他想表達的是,人工智慧中運用的不少方法就是過去的統計方法。

又有人認為大資料就是全樣本統計,這樣理解大資料未免有點淺薄,全樣本統計只是大資料的一種形式而已。大資料的涵義要比傳統意義上的統計資料廣泛,但又具有統計資料的很多屬性,因此大資料需要通過合適的方法,才能發揮其作用。

兩年半前,我曾從螞蟻金服公布的居民網路消費資料中發現天津在網路消費上的怪異現象:作為直轄市的天津,人均網消水平明顯低於上海、北京、浙江、江蘇、海南、福建、廣東,甚至低於全國平均水平(因為前七個省市的消費權重較大)。

可以用來套裝的作文題目

人們常說 眼睛有神龍會飛,標題有神文添彩。考場作文簡潔 新穎 生動 切合文意的標題,常常會贏得閱卷老師的青睞,當然考場作文快速擬題的方法很多。其實,把影視劇片名 歌曲名 詩詞名句 俗語 諺語 歇後語 廣告語 歌詞等適當改動,進行套裝借用作為文章的題目,不僅是考場作文快速擬題的高明之舉,而且常能使文章...

可以用來套裝的作文題目

2007 06 26 20 05100個可以用來套裝的作文題目人們常說 眼睛有神龍會飛,標題有神文添彩。考場作文簡潔 新穎 生動 切合文意的標題,常常會贏得閱卷老師的青睞,當然考場作文快速擬題的方法很多。其實,把影視劇片名 歌曲名 詩詞名句 俗語 諺語 歇後語 廣告語 歌詞等適當改動,進行套裝借用作...

試金可以用火

試金可以用火,試女人可以用金,試男人可以用女人 人生最美好的時光,一定要開心的笑 孩子把玩具當朋友,把朋友當玩具。1 要生活得漂亮,需要付出極大的忍耐,一不抱怨,二不解釋,絕對是個人才。變形記 2 站在高跟鞋上,我才能看見真正的世界,使腳不舒服的不是鞋子的高度,而是慾望。3 我注意到,許多人在獨處的...