《大數(shù)據(jù)時代》讀書筆記
導(dǎo)語:生活在信息時代的我們,讀一讀大數(shù)據(jù)時代,會改變一些我們對這個世界的看法。
《大數(shù)據(jù)時代》讀書筆記一
世界的本質(zhì)就是數(shù)據(jù),當(dāng)你掌握了數(shù)據(jù),你便掌控了世界—你可以輕而易舉地通過數(shù)據(jù)中的相關(guān)關(guān)系預(yù)測事物的發(fā)展,將一切不利因素扼殺于搖籃之中—這遠勝于"防患于未然"。
《大數(shù)據(jù)時代》一書,讓我們在觀念上有了三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對精確,要相關(guān)不要因果。全書介紹了 "大數(shù)據(jù)"時代三種大的變革:思維變革,商業(yè)變革和管理變革。在這些巨大變革如洪水一般的"沖擊"之下,現(xiàn)代社會的運作方式必將有重大的改變,若不順應(yīng)這種變革的潮流,就像古中國固步自封,最終被堅船利炮打開國門而自己還用著長鉤鐵戟抗?fàn)幰粯,不可避免被掠奪,被落于世界進程之后,所以我們必須轉(zhuǎn)變我們的思想。
"我們不再熱衷于尋找因果關(guān)系,而應(yīng)該尋找事物間的相關(guān)關(guān)系",我想這句話是本書的核心思想。大數(shù)據(jù)時代,信息與數(shù)據(jù)已成為了一切的本源,我們生活在各種數(shù)據(jù)構(gòu)成的海洋之中,如果從另一種視角看,就好像無數(shù)條"看不見的線"將我們與這些數(shù)據(jù)聯(lián)系到一起,這是我們以前從未有過、從未想過的。大數(shù)據(jù)改變了我們以前的通過因果關(guān)系了解世界的方法,而提供了幾種新的途徑,因為,在大數(shù)據(jù)時代,我們可以分析更多數(shù)據(jù),有時甚至可以處理和某個特別現(xiàn)象相關(guān)的所有數(shù)據(jù),也就是:樣本=總體;而且,當(dāng)研究數(shù)據(jù)如此之多時,我們已不熱衷于"精確",而是"混亂",若不接受"混亂",那么有95%的非結(jié)構(gòu)化數(shù)據(jù)無法利用,這將無法使我們構(gòu)建完整的數(shù)據(jù)世界,在分析更多、更全面的數(shù)據(jù)之后,我們就可以從這些數(shù)據(jù)之中發(fā)掘它們的相關(guān)關(guān)系,即以"是什么"而不是"為什么"的角度看待數(shù)據(jù),不用管其從何而來,只要分析其如何影響其他事物既可,即"讓數(shù)據(jù)自己發(fā)聲",這些,徹底推翻了人類以前探索數(shù)據(jù)的方法,展現(xiàn)了一個全新的世界。
這種觀念以驚人的力量給現(xiàn)知識狀況帶來了巨大的沖擊,通過對海量數(shù)據(jù)的分析,獲得巨大價值的產(chǎn)品和服務(wù),或深刻的洞見。比如谷歌公司,2009年H1N1流行之時,通過檢測檢索詞條,處理34。5億個不同的數(shù)據(jù)模型,通過預(yù)測并與2007、2008年的美國疾控中心記錄的實際流感病例進行對比后,確定了45條檢索詞條組合,并將其用于一個特定的數(shù)學(xué)模型后,預(yù)測結(jié)果與官方數(shù)據(jù)相關(guān)系數(shù)高達97%,這種大數(shù)據(jù)技術(shù),以前所未有的方式,通過海量數(shù)據(jù)分析得出流感所傳播的范圍,為預(yù)測流感提供了一種更快速、高效的工具。
同時,雖然大數(shù)據(jù)可為人類造福、對抗病癥,但這僅限于掌握這門技術(shù)而言,若不重視這種技術(shù),當(dāng)我們的對手早于我們一步構(gòu)建這種數(shù)據(jù)網(wǎng)絡(luò)之時,便是我們的災(zāi)難,想想,大數(shù)據(jù)雖核心的在于預(yù)測,當(dāng)敵人通過這種手段預(yù)測我方下一步的行動,將是可怕的—比如你的.導(dǎo)彈將從何處發(fā)射,將飛往哪,你的軍隊動向、目標(biāo),總之所有一切"未來"將掌控于敵手,敵方甚至可以借此發(fā)現(xiàn)那些將來有"大作為"的人,從而進行滲透或扼殺,這對我們的發(fā)展無疑是致命的,所以,盡快加速大數(shù)據(jù)系統(tǒng)的構(gòu)建進程是必須的。
對于我們國防生,也必須順應(yīng)這種發(fā)展趨勢,未來的時代必將是數(shù)據(jù)極易獲取,數(shù)據(jù)網(wǎng)絡(luò)共享化的時代,通過這些數(shù)據(jù),建立數(shù)據(jù)模型,可以準(zhǔn)確分析并給出適合每一個人的計劃,如運動量、訓(xùn)練強度,可以"先知、先覺",及時發(fā)現(xiàn)一個人的負面情緒前及時疏導(dǎo),這些必將成為現(xiàn)實,我們必須跟進時代,做好準(zhǔn)備,去應(yīng)對大數(shù)據(jù)時代的一切!
《大數(shù)據(jù)時代》讀書筆記二
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運作的影響。
《大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預(yù)測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時代》開篇就講了Google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測了2009年美國的H1N1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。Google的預(yù)測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時Google的預(yù)測與政府?dāng)?shù)據(jù)的相關(guān)性高達97%,這也就意味著Google預(yù)測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠遠小于傳統(tǒng)統(tǒng)計學(xué)上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預(yù)測結(jié)果的相對準(zhǔn)確性與事件的可預(yù)測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準(zhǔn)確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系Google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準(zhǔn)確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。
之后,維克托又預(yù)測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。
無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預(yù)測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。
【《大數(shù)據(jù)時代》讀書筆記】相關(guān)文章:
大數(shù)據(jù)時代讀后感07-17
大數(shù)據(jù)時代讀后感作文01-15
小時代讀書筆記01-06
小時代的讀書筆記01-16