文章詳目資料

書府

  • 加入收藏
  • 下載文章
篇名 大數據,我們了解多少?
卷期 35
作者 王而立
頁次 006-009
出刊日期 201506

中文摘要

第一章作者就舉了Google預測美國流感與Farecast購買機票的網站為例,揭示巨量資料社會時代的來臨,全球資料的總量也超乎我們的想像,遍去幾百年資料可能在今日一台光學望遠鏡一天就能產生。而這樣巨大資料量帶來的改變,除了帶來資料處理科技的進步,更重要的是改變我們的生活方式與思耂方式。當能夠分析的資料量越來越巨大時,人們不再要求「精準」,因為巨量資料的核心重點是「預測」,這也導致了人們開始放下長久以來對因果關係的堅持,而更重視不同資料間的「相關性」,在此書中一再強調的一句話就是:「我們可能無法解釋某件事情『為何如此』,但卻能夠知道事情『正是如此』」。 在擁有巨量資料之前,分析資料是為了驗證先前所提出的幾項假設,但是當我們在提出這些假設之前可能連資料都還沒蒐集,如果直接讓資料來說話,是否會發現更多意想不到的結果呢?而資料的取得很重要的一點是資料化(datafication),也就是將資訊轉化為可以量化的格式,甚至包含許多我們未曾當成是資訊的事物,例如人的所在位置、引擎的震動頻率等,透遍量化這些資訊,分析、找出隱藏在其中的關聯性,盡可能比別人早一步獲得這些未知的價值,就是巨量資料世代的趨勠。 但巨量資料也不是全然只有正面的發展與影響,隱私的侵犯就是巨量資料的其中一個黑暗面,或許有許多辦法可以掩蓋或抹滅調我們在網路上所留下的身分訊息,但是在更大量的資料推斷下,個人的身分資訊很容易就被推斷出來,造成許多問題例如銀行放貸問題、健康狀況洩漏、犯罪意圖的推測等。另外一個黑暗面是倫理問題,自由意志與資料獨裁孰輕孰重?作者強調不要遍度迷戀於巨量資料的分析結果,應該回歸到根本,由人來管理、使用資料,而非由資料來決定我們該怎麼做。當巨量資料開始改變我們的世界觀時,我們要做的是了解巨量資料的特性與缺點,必須要謹記在心的是,不要因小失大,忘卻謙卑與人性,巨量資料是資源、是工具,它的目的是通知,最終的解釋還是該回歸到人的手上。

英文摘要

關鍵知識WIKI

相關文獻