《大數據時代》讀書筆記
導語:生活在信息時代的我們,讀一讀大數據時代,會改變一些我們對這個世界的看法。
《大數據時代》讀書筆記一
世界的本質就是數據,當你掌握了數據,你便掌控了世界—你可以輕而易舉地通過數據中的相關關系預測事物的發展,將一切不利因素扼殺于搖籃之中—這遠勝于"防患于未然"。
《大數據時代》一書,讓我們在觀念上有了三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。全書介紹了 "大數據"時代三種大的變革:思維變革,商業變革和管理變革。在這些巨大變革如洪水一般的"沖擊"之下,現代社會的運作方式必將有重大的改變,若不順應這種變革的潮流,就像古中國固步自封,最終被堅船利炮打開國門而自己還用著長鉤鐵戟抗爭一樣,不可避免被掠奪,被落于世界進程之后,所以我們必須轉變我們的思想。
"我們不再熱衷于尋找因果關系,而應該尋找事物間的相關關系",我想這句話是本書的核心思想。大數據時代,信息與數據已成為了一切的本源,我們生活在各種數據構成的海洋之中,如果從另一種視角看,就好像無數條"看不見的線"將我們與這些數據聯系到一起,這是我們以前從未有過、從未想過的。大數據改變了我們以前的通過因果關系了解世界的方法,而提供了幾種新的途徑,因為,在大數據時代,我們可以分析更多數據,有時甚至可以處理和某個特別現象相關的所有數據,也就是:樣本=總體;而且,當研究數據如此之多時,我們已不熱衷于"精確",而是"混亂",若不接受"混亂",那么有95%的非結構化數據無法利用,這將無法使我們構建完整的數據世界,在分析更多、更全面的數據之后,我們就可以從這些數據之中發掘它們的相關關系,即以"是什么"而不是"為什么"的角度看待數據,不用管其從何而來,只要分析其如何影響其他事物既可,即"讓數據自己發聲",這些,徹底推翻了人類以前探索數據的方法,展現了一個全新的世界。
這種觀念以驚人的力量給現知識狀況帶來了巨大的沖擊,通過對海量數據的分析,獲得巨大價值的產品和服務,或深刻的洞見。比如谷歌公司,2009年H1N1流行之時,通過檢測檢索詞條,處理34。5億個不同的數據模型,通過預測并與2007、2008年的美國疾控中心記錄的實際流感病例進行對比后,確定了45條檢索詞條組合,并將其用于一個特定的數學模型后,預測結果與官方數據相關系數高達97%,這種大數據技術,以前所未有的方式,通過海量數據分析得出流感所傳播的范圍,為預測流感提供了一種更快速、高效的工具。
同時,雖然大數據可為人類造福、對抗病癥,但這僅限于掌握這門技術而言,若不重視這種技術,當我們的對手早于我們一步構建這種數據網絡之時,便是我們的災難,想想,大數據雖核心的在于預測,當敵人通過這種手段預測我方下一步的行動,將是可怕的—比如你的.導彈將從何處發射,將飛往哪,你的軍隊動向、目標,總之所有一切"未來"將掌控于敵手,敵方甚至可以借此發現那些將來有"大作為"的人,從而進行滲透或扼殺,這對我們的發展無疑是致命的,所以,盡快加速大數據系統的構建進程是必須的。
對于我們國防生,也必須順應這種發展趨勢,未來的時代必將是數據極易獲取,數據網絡共享化的時代,通過這些數據,建立數據模型,可以準確分析并給出適合每一個人的計劃,如運動量、訓練強度,可以"先知、先覺",及時發現一個人的負面情緒前及時疏導,這些必將成為現實,我們必須跟進時代,做好準備,去應對大數據時代的一切!
《大數據時代》讀書筆記二
這本書里主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了2009年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之后才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區間為3%,這個數字遠遠小于傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯系Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
【《大數據時代》讀書筆記】相關文章:
《大數據時代》的讀書心得03-11
大數據時代經典語錄02-02
大數據時代讀后感07-17
大數據時代讀后感作文01-15
大數據時代閱讀理解附答案01-17
小時代讀書筆記01-06
小時代的讀書筆記01-16
《大數據時代》讀后感1500字06-05
大數據時代讀后感1500字05-13