舉謬《大數據時代》:對大數據的認識不應盲目跟風
文章來源:中國社會科學報 作者:楊迪 時間:2014-04-08 08:00:00近年來,大數據在我國得到一致重視,各行各業興起了一股重視大數據、應用大數據的熱潮。這種全民迅速接受新生事物的現象,反映了中國經過改革開放,現代化意識深入人心的可喜狀況,令人鼓舞。但是,由于大數據技術發展迅速,一些囫圇吞棗的淺知誤見也隨之流傳,如不及時糾正,將造成對大數據先入為主的誤區,影響經濟社會發展。當前國內十分流行的《大數據時代》(維克托·邁爾-舍恩伯格等著,浙江人民出版社,2013年,以下簡稱《時代》)中提出了三個存在嚴重謬誤的觀點,特此指出,以期引起注意。
“不是因果關系,而是相互關系”?
《時代》一書的主要觀點之一是,大數據時代“不是因果關系,而是相互關系”。其實,早在18世紀,英國懷疑論者休謨就指出,“不但我們的理性不能幫助我們發現原因和結果的最終聯系,而且經驗給我們指出它們的恒常結合以后,我們也不能憑自己的理性使自己相信,我們為什么把那種經驗擴大到我們所曾觀察過那些特殊事物以外。我們只是假設,卻永遠不能證明,我們所經驗過的那些事物必然類似于我們所未曾發現的那些對象。”
《時代》一書將這一早已提出幾個世紀的觀點,作為大數據時代的新概念,不僅陳舊,而且錯誤。因為,簡單地說大數據時代“不是因果關系,而是相互關系”,說明作者不了解因果關系本身也是一種相互關系,即原因與結果前后相繼的相互關系,因此將因果關系歸結為相互關系并不比因果關系本身更有內涵,實際上,這甚至是一種同義反復。
正確的觀點應該明確因果關系是一種什么樣的相互關系,而這一點經過20世紀自然科學和數理哲學的研究已經有了更深刻的認識。計算機的發明,使得人們開始從計算機語言表達、傳遞信息的角度來理解知識的起點。大數據時代的到來,使得人們豁然開朗。
經濟學者李德偉教授在《時代》中譯本發表之前,就已提出大數據時代不再強調因果關系,也不是簡單地將因果關系歸為相互關系,而是精確地指出客觀事物運動序列之間存在同構關系,特別是人類認識與外部客觀事物之間存在對應的、同構的關系,信息的表達、傳輸和存儲就是一種同構關系,也就是說,外部客觀事物運動與人的主觀認識都是客觀世界的事物現象,是協調性的、一一對應的相互關系,主觀認識映像只是承載、傳遞外部客觀事物現象的一種符號系統。無論是從人自身悟出來,還是從外部經驗事物抽象出來,都是同構的、對應的關系。
“不是隨機樣本,而是全體數據”?
《時代》一書認為大數據時代“不是隨機樣本,而是全體數據”,認識事物不再是從隨機抽取的部分樣本,而是從全部數據出發。這種說法忽視了全部與部分的辯證關系。人類在有限的時間內不可能窮盡事物的全部,絕對真理只能在人類前后相繼的、永遠不會停止的認識過程中實現。任何事物的發展總是有過去、現在和未來,現在的是現在,未來的尚未出現,全部案例不可能在有限時間內達到,認識也永遠不會完結。未來的與過去和現在相比還是無窮大的。正因為如此,波普爾才提出,“全稱命題不可證實,只能證偽。”
實際上,過去的小數據時代的抽樣調查方法與現在的大數據方法相比,只能說是大數據時代可以用更為精確的、全面的數據,以包含更大因素的仿真模型來追蹤、分析模擬現實,取得比過去更為精確的認識結果。盡管如此,與全體相比,已經認識的永遠是少數,誤差、錯誤還是不能完全消除。例如,通過人口普查分析現在中國人具有什么特點。不要說全部認識現有13億人口的全部屬性不可能(因為事物屬性有無窮層次),即使說能夠完全認識現有13億人口全部屬性,也不意味著過去、未來的中國人,也能夠全部認識。未來的中國人與已經認識的現有中國人相比還是無窮大。因此,大數據與小數據相比只是以巨量的、全面的、即時的數據來認識事物,但是要掌握全體數據在有限時間內總是不可能的。
“不是精確性,而是混雜性”?
《時代》作者說大數據時代“不是精確性,而是混雜性”,意指小數據時代是講究精確性,大數據時代因為掌握了大量數據可以不再拘泥于精確性,而是依靠大數據比較模糊地行動。這顯然是錯誤的。因為在小數據時代能夠掌握精確的小數據,但是大多數數據卻被遺漏、舍棄,認識的結果就無法實現精確、全面,真理和錯誤的邊界也不是很清楚,這時的認識是模糊的、有偏差的。在大數據時代,因為掌握了更為全面的數據,可以在更大的范圍認識事物,因此,能夠更為準確、量化,以至于對一些中間模糊區域也可以得到更為準確的認識,其精確度和模糊度、誤差本身都更為精確量化。例如,在計算機信息系統中,發布更多的信息,通過反復比對、糾錯機制,降低噪音,到達精確度。這一點在人類的認識活動中本來就是這樣做的,“耳聽為虛”就以“眼見為實”來糾錯,小數據一兩個來回不可能正確,反復多次大數據比對,就能達到越來越高的精確度,誤差率就越來越小。
中國人口世界第一,信息產業市場最大,最有機會發展信息化、大數據和智慧化產業。但中國目前在對大數據的認識上有一種盲目跟外國之風的傾向。對于國外大數據理論,我們應以批判的眼光保持清醒的認識。
(作者單位:中國電子商務協會大數據和智慧城市研究院)
- 省社科聯召開深入貫徹中央八項規定精神學習教育警示教育會
- 湖南省社科聯九屆二次常委會會議召開
- 2025年湖南省社會科學普及主題活動周啟動
- 240余項湖南社科普及活動清單來啦!等你來解鎖……
- 倒計時1天!湖南省社科普及主題活動周明日啟動
- 倒計時2天! 湖南省社會科學普及主題活動周即將啟幕
- 湖南省社科普及讀物專區在湖南圖書館亮相
- 省社科聯開展“書香潤社科·青春擔使命”“五四”青年主題讀書分享會
- 2025年永州市社科普及活動周啟動
- 婁底市社科理論界學習貫徹《習近平文化思想學習綱要》座談會召開
- 《常德通史》編纂工作委員會召開第一次全體會議
- 湖南省周敦頤理學文化研究會召開成立大會暨周敦頤理學思想學術研討會
- 湘潭市社科聯到會祝賀湖南科技大學科學技術現代化研究院揭牌成立
- 湘潭市社科聯赴湘潭醫衛職業技術學院調研立項課題推進情況
- 湘潭市社科聯開展“我愛湘潭我的家”志愿服務活動
- 張家界市社會科學界聯合會第七屆委員會第三次全體會議召開