《大資料》讀後感(精選多篇)

文思社 人氣:1.29W

目錄

《大資料》讀後感(精選多篇)
第一篇:大資料 讀後感第二篇:《大資料》讀後感第三篇:《大資料》讀後感第四篇:《大資料》讀後感第五篇:大資料讀後感更多相關範文

正文

第一篇:大資料 讀後感

從徐子沛的《大資料》中得到的感悟

資料,對於我們現代社社會來說,已經是再熟悉不過了。大量化(volume)、多樣化(variety)、快速化(velocity)和大價值(value)。這四個v就是大資料的基本特徵。每天我們都不得不和資料打交道,比如我們平常所說得“眼觀六路,耳聽八方,”就是生活中一個很好的的收集資料的例子。還有,在我們平時的學習中,我們對於一些學習上的資料的整理等等。可以說,資料已經成為了我們的影子一樣,無時無刻的在我們的身邊活動。

拿到《大資料》這本書時,吸引我的不是書評的內容,而是書的封面上的一句話“除了上帝,任何人都可以用資料說話。”也就是說,上帝可以不用資料來說話,但是,作為一個平常人,我們做事,言論等都必須用資料來說話。用資料論來證我們的觀點正確性。

那麼資料真的就是那麼重要嗎?其實不然,資料果真有那麼的重要。作者在書中大量應用世界頭號強國美國的例子來說明美國是如何利用資料以及資料在美國人的利用下,是如何造福美國人的。使得美國人走上了民主、發展的道路。書中還引用了大量的利用資料的案例,以及利用資料會有什麼樣的後果。當然,作者在書中也很明確的表達了自己觀點,也就是資料要被人利用,利用的好了,造福人類,否則,禍害無窮。

毫無疑問,我們正處在一個真正意義的大資料時代。但是,大資料浪潮的來龍去脈如何?資料技術變革何以能推動政府資訊的公開、透明和社會公正?又何以給我們帶來無限的商機,既便利又危及我們

每個人的生活?《大資料》給了我們一個很好的答案。在拿到徐子沛《大資料》時,與其說這是個新概念,還不如說就是一個現實。資訊科技的迅速發展和普遍應用,儲存能力的膨脹,網路傳輸的便捷,必然產生巨大的資料量。即使是一個公司,經過多年的積累,產生的資料也是驚人的。每天繁多的資料,這就是要求企業要很好地儲存資料,利用資料通過資料,使得資料說話,提升企業的業績和知名度。對於一個企業來說,比較實際的倒是關注一下企業微觀大資料,如何充分利用現有的、能夠得到的和自己創造的資料,採用《大資料》裡提及的新技術、新方法、新理念,篩選、組織、關聯、分析,精細化管理和挖掘資料,探索規律性的東西,指導企業活動。 儘可能多的獲取資料,首先是要有心,對於公司員工來說,隨時隨地注意收集客戶資料、需求資料、產品資料、市場資料、資源資料等,經過整理,把它變成公司的資料資產;然後是要有據,資訊與資料最大的不同,就是資料是能夠度量或者確定的資訊,不能“毛估估”,收集資料要精細化,要準確;其次要有序,資料需要儲存,更加需要整理,單個數據沒有很大意義,靜止的資料也沒有很大意義,有價值的資料是流動的、與其他資料互動作用的。一個大雜燴的資料庫,在需要時讓人找不到北,沒有任何意義。再次,需要技術支援,大量的資料如何檢索,如何關聯,單靠人腦是不行的,需要建立基於特定理論的資料處理系統來分析管理。對於一個企業,最理想的是建立一個類似人類神經系統的資料管理系統,採用各種資訊終端採集內部和外部資訊,通過分析、歸納、篩選,形成管理資料,某些資料可以成為系統的“本

能”,一旦觸發能夠自動做出反應;某些資料可以成為組合資訊提交大腦綜合分析,作出決策和反應。 資料應該為人服務,這是一條基本原則。在大資料時代始終發揮人的主觀能動性,採用先進的理念和技術駕馭資料,讓人們生活更方便,工作效率更高,勞動強度降低,為社會創造更多的物質財富和精神財富。

《大資料》是一本視野獨特的書。它以資料為軸線,描繪了美國走過的改革創新的過程,行文如流水,引人入勝。書中,我讀到的不是大資料處理技術,更多的是與大資料相關的美國政治、經濟、社會和文化的演進,從民主和國家戰略的層面細解大資料的影響力。美國是全書的主體,但又處處反觀中國當下的現實。內容非常值得我們身處改革開放前沿的政府工作者深思。它讓我們更加深刻地理解了汪洋書記提出的“堅持用資料說話、用資料改進管理、用資料推動創新”的深刻內涵和殷切期望。我們只有重視資料,加強對資料的收集、分析和使用,才能更好地應對正在到來的資料革命的挑戰。那麼,作為與資料打交道、用資料說話的前線統計工作者,如何應對大資料時代的種種挑戰?

對比《大資料》,結合平時工作和學習的實際情況,我認為最少應該認真思考和解決好三個問題:

一、提供什麼樣的資料?

在中國,統計部門提供的資料,是各級政府部門和廣大人民群眾瞭解國家社會經濟發展和人民生活狀況主要渠道。只有真實可靠統計資料,才能使政府決策有的放矢,人民瞭解國家經濟與人民生活的

真實狀況。如果統計資料虛假不實,就會誤導政府和人民,讓政府失信於人民。因此,我們一定把握好資料的生命線—質量關,確保給國家和人民提供準確、真實、可靠、無誤的資料。

二、如何高效有序地收集資料?

面對資訊大爆炸時代海量資料,必須充分利用高科技手段,高效有序地收集整理各種資料,以滿足政府和人民群眾越來越廣泛的資訊需求。為此,我們需要建立完善資料收集網路,包括部門內部的縱向資料收集網路和部門之間的橫向資料收集網路,通過這種縱橫結合的網路資料收集系統,針對特定主題,持續不斷地收集相關資料,為大資料發展提供基礎。需要運用網際網路、電子計算機等現代技術手段,加快資料收集、加工資料的速度,確保政府和人民及時得到所需資料。

三、如何加強資料分析利用能力?

收集資料的目的是為分析利用資料。通過資料分析挖掘資料背後隱含的經濟規律及有利於提高效率、改進工作的因素,提高政府管理、決策和人民生活水平,實現“用資料改進管理”。因此,作為統計人,不僅要做好資料收集的及時有效和真實正確,更重要的是要善於分析利用資料,寫好專業分析報告,發現問題、支撐決策、評估績效的目的。

此外我們還可以看到不少政府機構或者其他一些組織也在開始大資料解決他們遇到的一些問題。在本書的最後一章,作者告訴了我們大資料可能帶來的壞處。如:通過大資料可能我們的個人各種資訊、隱私會很容易地被大資料的擁有者找到,這些資訊,可能被政府用來

監管我們等;通過大資料可以預測可能發生的事,或者預測我們人個人本書即將做的行為,書中有個例子:警察通過大資料分析得出一個人即將可能犯罪,並把它逮捕了,但事實上這個人現在並沒有犯罪。也許這就限制、約束了我們個人的自由。

看完這本書,顛覆了自己之前的一些想法: 以前我們認為錯誤的資料是沒有用,我們需要保證統計的資料的準確性,但是在大資料中,錯誤的資料也是有用的,它和其他所有相對正確的資料一起構成了整體,也就算不了什麼了。我們同樣可以從這些資料中得出比較正確的預測和分析。 google利用人們搜尋的關鍵字來預測和判斷某個地區是否發生流感,google通過分析這個地區的人們搜尋和流感有關的詞的數量等來分析得出。 google 從網際網路抓取數以億記的各種語言、各種翻譯水平的翻譯結果,使用其翻譯出來的準確率比那些微軟使用正確的詞庫翻譯出來的句子準備率更高。我自己的感想是,其實大資料無處不在,只要我們細心,我們就可以挖掘出身邊的那些大資料,並做一些有意義的是,就像書中說的那樣,我們不需要強求每條資料都那麼真實準確,但是從大量的資料中我們就可以得出相對準備的結果。未來成功的公司必定是是那些擁有大量資料、並使用那些資料為大眾提供服務的公司。

公佈官員財產美國是怎麼做的,美國能讓少部人腐敗起來嗎,美國式上訪是怎麼回事,憑什麼美國礦難那麼少,全民醫改美國做得到嗎,美國總統大選有什麼利器才能贏,下一輪全球洗牌我們世界工廠會被淘汰嗎?? 除了上帝,任何人都必須用資料來說話。也就是是

說,美國更好的利用了資料,那麼,我們何嘗不去利用大資料時代的資料呢?

第二篇:《大資料》讀後感

《大資料》讀後感

佘潔婕

讀完《大資料》,我才意識到這並不是一本枯燥無味的書籍。作者運用案例和講故事的方式,把美國資料開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。

我在想,大資料概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。 在教學過程中,學生的行為表現都可以被資料化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我才會想到,所謂教育技術與其研究教育的數字化,不如研究教育的資料化來得實在,來的有意義。長期以來,我們並不瞭解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行為對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大資料概念至少提出了關注“是什麼”比“為什麼”要有實際意義得多。而我們的教育恰好需要把注意力從“為什麼”轉移到“是什麼”上面來,只有如此,才能把教育從為什麼發展成“可能成為什麼”上來,這會是一次思想上的革命。而對於現在地位岌岌可危的教育技術來說,把研究的重點從數字化轉移到資料化上面,這才是它的出路。

如何將資料融入教學,教育者首先通過標準化全科教學處方,實現了教師授課模板和教學內容的標準化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的資料,處理好資料,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果為導向的教學體系。

與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去的教育教學顯然是不同的,面對大資料時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,資料如何複雜,我們都不能不去改變自己的教學去迎合將來的這個大資料時代。

二等獎

第三篇:《大資料》讀後感

《大資料》讀後感

現代社會是一個技術奔騰、資訊爆炸的社會,大資料這個新概念一出現就受到了人們極大的熱捧。每天都身處網路的資訊海洋中,常常會有被資料、資訊“淹沒”的窒息感和無力感。塗子沛的《大資料》一書,通過講述美國半個多世紀資訊開放、技術創新的歷史,以別開生面的經典案例——奧巴馬建設“前所未有的開放政府”的雄心、公共財政透明的曲折、背後的隱情、全民醫改法案的波瀾、統一身份證的百年糾結、街頭警察的創新傳奇、美國礦難的悲情歷史、商務智慧的前世今生、資料開放運動的全球興起,以及雲端計算、facebook和推特等社交媒體、web3.0與下一代網際網路的未來圖景等等,詳細詮釋了資料技術變革與權力合法性、執政正義以及公民社會之間的關係。全面闡述了資訊時代資料的重要性,如何加強資料的收集、分析和使用以及通過資料開放改進政府治理等問題。這本書給了我一個全新的閱讀主題,讓我感受到了作為一名教師必須擁有但卻正是我們目前缺乏的兩種態度。

目前,人類已進入資訊社會。人類文明已處於資訊時代,人們在因特網上傳和下載資料,傳統的臺式電腦上網更新成了移動終端瀏覽和傳播資訊。qq、微信等通訊軟體已然實現手機版,人人、微博、臉譜能夠分享即刻心情,電訊服務商正大張旗鼓地爭奪客戶資源,網路通訊商也大力渲染雲服務和大資料時代。不管你願不願意,我們已經處在大資料時代。如何在新的時代爭取話語權,如何在新的時代維護自身權益,如何在新的時代實現利益最大化,必將成為這個時代中每個國家,甚至每個公民應當思考並付諸實踐的重大問題。

一、從美國的發展看美國發展的不足。美國,世界最大的已開發國家,藉助其自身的優勢,已然處於資訊時代的領頭羊位置。到底是什麼原因使得這個建國才兩百多年的年輕國傢俱備如此強大的實力和創新的活力呢?他們具備什麼優勢?他們成功的祕訣是什麼?結合書中分析和歷史實踐不難得出:適合自身的體制制度、法律、科技、人才、監督是這個年輕國家領跑世界的關鍵因素。

首先、美國結合本國實際選擇“三權分立”的體制制度。政府執法、法院司法、國會立法。政府首腦總統可以提名法官,法院可以宣佈總統行為違憲;總統能夠否決國會的立法,國會批准總統提名,並可以彈劾、罷免總統;法院可以宣佈國會某項法律違憲,國會也有許可權彈劾、罷免法官。這種源於法國思想家孟德斯鳩的“三權分立”民主制度適用美國,並契合美國文化社會生態,為美國的發展提供了社會基礎。然而,“沒有任何一項民主制度是完美的或者萬能的,甚至在別的國家成為一種糟糕的制度。(原英國首相丘吉爾)”因此,別的國家必須結合自身國情、民情進行參考,選擇符合自身條件和社會發展需要的制度,而決不能照抄。這樣,才能滿足自身人民需求,推動社會發展。這個觀點的論述將在後文講述“我國國情”中提到。

其次、法律保障。《資料質量法》和《資訊自由法》的頒佈為美國成為大資料帝國提供了基礎的法律保證,也喚醒了美國民眾對自身資料權益保護的意識。

第三、美國具備發達的科技支援和廣泛的人才支撐。早在上世紀四十年代,第一臺電子計算機誕生在美國,二戰後大量工程師移民美國等諸多因素為美國的高速發展夯實了人才基礎。

第四、美國擁有完善的、職責分明的社會監督體系。民眾、社團、新聞媒體時刻注視著政府的一舉一動,陽光般的注視成為防治腐敗最好的消毒劑。

世事無絕對。美國雖然藉助民主制度、法律保證等優勢條件成為資訊時代的領頭羊,也正是這些“優勢”成為了阻礙其發展的“劣勢”。突出表現在:(一)“三權分立”的民主權衡看似給美國社會帶來了民主、公平、自由的管理體制,實質存在不足,甚至是缺陷。舉個簡單例子,當政府執法時遇到法律障礙,總統就會遞交良法於國會討論,力爭通過。而國會集結的是各黨派、各團體、各企業,甚至是各說客的利益集團,各部分之間產生的利益糾紛必然成為良法通過的掣肘。就算是投票表決法案通過,在呈交總統簽署的法案裡也會放入短時間內難以解決的問題,即“摻沙子”。“沙子法案”必將成為社會發展過程中的阻礙;同時,“旋轉門”前後串場的說客們背後強大的利益集團在國會山上說話的語氣也是制約民主的制度硬傷。(二)美國嚴謹卻冗雜的司法程式造成了民眾不滿。2014年上大支礦難便是這一硬傷的突出表現。

二、中國的快速發展與發展中的不足。中國,世界最大的開發中國家,擁有世界最多的人口,最智慧的人民,最悠久的歷史。中國的文化吸引著世界的目光。上世紀七十年代末,中國進行的“改革開放”使中國人民和政府深受裨益。經過三十五年的大膽創新,科學發展,中國已超越日本,成為世界第二大經濟體,中國政府在世界的發言權已得到足夠的重視,中國人民的聰明才幹也得到充分挖掘,中華民族已鬥志昂揚地屹立在世界民族之林。

但是,我們不能不承認在大資料時代,中國暫時處於靠後的位置,並且行動相對遲緩。主要表現在:(一)不少地方政府為表政績,存在“邀功尋賞”、謊報資料行為,導致資料大範圍失真。《焦點訪談》曾經報道過多地基層政府的類似行為。例如,國家退耕還林政策涉及資金補貼,某地村幹部連續三年虛報資料,最終竟導致所報耕地面積大於該村行政村面積。(二)存在大量應當公開、公佈的資料實際並未及時公之於眾。就拿近年來炒的沸沸揚揚的晒“三公經費”問題來說,目前僅是一線或二、三線城市才敢於公開,而落實到地、市、縣級卻姍姍來遲。(三)精確的資料測量與統計工作起步晚,差距大。資料收集方法多以基層上報、被動接受為主,容易“摻水”。

三、結合自身工作和生活實際,發現存在的問題。作為一名從事經濟研究工作者,身處於我國經濟工作的一線,在進行調查研究的過程中發現了一些機制中或許存在的漏洞或缺陷,正巧反映出我國在大資料時代中所處的不利地位。舉例一:如果m先生想在a地購置房產(普通住房),若是首次購房,那麼根據稅法規定,該項經濟活動買方將涉及契稅優惠,但是必須要求m先生提供房產局出示的家庭唯一住房證明。漏洞便出現了:假設m先生已經在b地事先擁有一套房產,而m先生身份證件登記在a地,那麼m先生便有了在a地成功領取家庭唯一住房證明的可能(前提是a、b兩地房產部門資訊無法共享)。

這樣,“聰明”的m先生在已擁有一套房產的前提下,再次在異地購房仍可享受契稅優惠。這將直接導致稅款的流失和稅賦的不公平,不利於我國稅收徵管工作,不利於“兩度”的提升。堵住這一漏洞的前提條件只有一個房產部門全國資訊聯網。然而,現實並非如此。舉例二:我國正大力興起的“全民醫保”在大資料時代同樣不盡如人意。醫保卡無法在全國通用,甚至無法在本省內、本市(州)內通用,仍然存在指定醫院刷卡。這直接給一些出差在外的居民,亦或是離指定刷卡醫院較遠的居民帶來不便。

四、中國面臨發展的機遇與挑戰。問題與機遇並存。中國在大資料時代中正面臨著巨大的挑戰和重大的機遇。問題的存在和挑戰的並行必然構成我們在這個時代迎頭追趕的機遇:

第一、體制條件。我國是社會主義國家,我國採取的是民族集中制。也就是說,在絕大多數公民認可的良法在立法過程中不會出現像美國那樣的利益集團間的博弈,或是“摻沙子”。亦即,被廣泛民眾認可的良法在我國立法過程中受到的阻礙相對較小。

第二、政策機遇。黨的十八大報告明確把“資訊化水平大幅提升”納入全面建設小康社會的目標之一,並提出了走中國特色新型工業化、資訊化、城鎮化、農業現代化道路。明確要堅持資訊化和工業化深度融合,工業化和城鎮化良性互動、城鎮化和農業現代化相互協調,促進工業化、資訊化、城鎮化、農業現代化同步發展。從此,資訊化本身(包括大資料發展)不再只是一種手段,而將成為發展的目標和途徑;同時提出建設下一代資訊基礎設施,發展現代資訊科技產業體系,健全資訊保安保障體系,推出資訊網路技術廣泛運用作為“推進經濟結構戰略性調整”方案。資訊化建設和大資料時代已納入國家重點戰略層面,中國資訊化建設正處於巨大的歷史機遇期和轉折點。

第三、客觀因素。我國是網際網路大國、手機大國,我國是世界上網民人數最多的國家,巨大的資料產生、消費、使用給我國大資料資訊科技的發展提供了堅實的客觀條件,我們千萬不可停滯不前,相反,要主動出擊,迎頭趕上。

第四、技術優勢。相對於美國,我國擁有充分的客觀技術優勢----身份證。美國因其文化或歷史原因,公民使用的身份標識不統一,這為美國政府進行管理和施行政策提出難題。中國卻有著便利的解決方法,因為每位合法中國公民都擁有唯一的身份標識,有了這一技術優勢作保障,我國大資料推行擁有巨大便捷。

這就從一定意義上說明了大資料時代已經來臨,收集資料,使用資料,開放資料,都是我們需要一一面對的挑戰,我們該如何從容應對?我想,唯有積極參與其中,才能緊跟時代腳步,成為社會發展的受益者。綜上所述,我認為美國是一個值得我們認真學習的國家。“中國崛起”要求我們有正確的學習態度和敏銳的學習能力。不要有橋不走,硬要下河摸石頭。要學習、要上路是我們的當務之急。我們應該以全世界的文明為基礎,客觀洞悉西方世界,理性思考自身問題,刻苦落實解決方案,才能實幹興邦,才能實現中華兒女心中偉大的民族復興之夢!誠然,人心、真情、給予、奉獻……等等,這些也許很難用資料來衡量,但面對社會未來之世界走向,中國如何應對大資料時代的挑戰,我們自己又該從自身、從自己的崗位做哪些改變、哪些突破,這是我們需要,也可以認真思考的問題(注:本文系中國綠色經濟部落格博主和中國綠色經濟圈圈主陳玉榮博士撰寫,特此說明)。

第四篇:《大資料》讀後感

《大資料》讀後感

荊家鎮中心學校荊超

在數字資訊時代,資料和空氣一樣遍佈生活,對於有些人來說,資料無意義,而對於有些人來說,資料,即真相。讀完《大資料》,我才意識到這並不是一本枯燥無味的書籍。透過全書,一個立體的美國及美國人民的思想呈現在我們面前——美國人民執著於個人隱私的保護,卻又不遺餘力地推動著政府資訊的透明與公開。作者運用案例和講故事的方式,把美國資料開放、收集、使用背後的立法故事、公民故事、技術故事、商業故事娓娓道來,引人入勝,令我大開眼界。我在想,大資料概念對於教育來說會產生什麼樣的實用價值呢?一直以來,中國教育在研究教育的數字化,比如數字化校園,這個思路就是把我們教育的內容進行數字化,其結果指向的就是電子教材的研發或者是教學過程的數字化。美其名曰,這是教育技術的重要內涵。

在教學過程中,學生的行為表現都可以被資料化,而這項研究不是任何一個專業可以深入下去的,它的專業性太強,所以我才會想到,所謂教育技術與其研究教育的數字化,不如研究教育的資料化來得實在,來的有意義。長期以來,我們並不瞭解教育對一個人的影響具體會如何表現,我們有的只是一個輪廓,我們也並不確定一個教師的行為對學生具體產生了哪些影響。所以,人們對教育一直有一個深深的質疑,它是不是科學的?大資料概念至少提出了關注“是什麼”比“為什麼”要有實際意義得多。而我們的教育恰好需要把注意力從“為什麼”轉移到“是什麼”上面來,只有如此,才能把教育從為什麼發展成“可能成為什麼”上來,這會是一次思想上的革命。

如何將資料融入教學,教育者首先通過標準化全科教學處方,實現了教師授課模板和教學內容的標準化,保證每個教學過程和內容是可控的,然後結合每天的教學內容,處理好面對的資料,處理好資料,自然也就處理好了課堂的反饋,最終形成了既注重教學體驗又以教學結果為導向的教學體系。

與此同時,不僅要注重課上的學生資源,在課後還要對這些資源進行跟蹤處理。這與過去(推薦訪問範文網:)的教育教學顯然是不同的,面對大資料時代的到來,教學有所改變是必然的。所以,無論環境怎麼變換,資料如何複雜,我們都不能不去改變自己的教學去迎合將來的這個大資料時代。

第五篇:大資料讀後感

假設你要測量一個葡萄園的溫度,但是整個葡萄園只有一個溫度測量儀,那你就必須確保 這個測量儀是精確的而且能夠一直工作。反過來,如果每100棵葡萄樹就有一個測量儀,有些測試的資料可能會是錯誤的,可能會更加混亂,但眾多的讀數合起來就可以提供一個更加準確的結果。因為這裡麵包含了更多的資料,而它不僅能抵消掉錯誤資料造成的影響,還能提供更多的額外價值。

現在想想增加讀數頻率的這個事情。如果每隔一分鐘就測量一下溫度,我們至少還能夠保 證測量結果是按照時間有序排列的。如果變成每分鐘測量十次甚至百次的話,不僅讀數可能出錯,連時間先後都可能搞混掉。試想,如果資訊在網路中流動,那麼一條記錄很可能在傳輸過程中被延遲,在其到達的時候已經沒有意義了,甚至乾脆在奔湧的資訊洪流中徹底迷失。雖然我們得到的資訊不再那麼準確,但收集到的數量龐大的資訊讓我們放棄嚴格精確的選擇變得更為划算。在第一個例子裡,我們為了獲得更廣泛的資料而犧牲了精確性,也因此看到了很多如若不然無法被關注到的細節。在第二個例子裡,我們為了高頻率而放棄了精確性,結果觀察到了一些本可能被錯過的變化。雖然如果我們能夠下足夠多的工夫,這些錯誤是可以避免的,但在很多情況下,與致力於避免錯誤相比,對錯誤的包容會帶給我們更多好處。(小微金融創新,也可借鑑此思想,然後做好對資料收集與儲存的支撐成為首要完成的事務,然後是對資料的正確運用是重點)

我們可以在大量資料對計算機其他領域進步的重要性上看到類似的變化。我們都知道,如 摩爾定律所預測的,過去一段時間裡計算機的資料處理能力得到了很大的提高。摩爾定律認 為,每塊晶片上電晶體的數量每兩年就會翻一倍。這使得電腦執行更快速了,儲存空間更大 了。大家沒有意識到的是,驅動各類系統的演算法也進步了——美國總統科技顧問委員會的報告顯示,在很多領域這些演算法帶來的進步還要勝過晶片的進步。然而,社會從“大資料”中所能得到的,並非來自執行更快的晶片或更好的演算法,而是更多的資料。(資料本身的價值,及資料的價值的體現)

容忍錯誤帶來的是更多資料吞吐(大資料),容忍風險帶來的大量業務的湧現(小微金融) 大量業務的湧現帶來的收益需要大於其風險帶來的損失,最好辦法就是從他處大量收集這些資料,並容忍這些資料存在錯誤,再基於大資料分析(同業資料收集,依託網際網路中搜索等進行收集,阿里可以根據淘寶進行收集)

一致性多樣性

hadoop的輸出結果沒有關係型資料庫輸出結果那麼精確,它不能用於衛星發射、開具銀行 賬戶明細這種精確度要求很高的任務。但是對於不要求極端精確的任務,它就比其他系統執行得快很多,比如說把顧客分群,然後分別進行不同的營銷活動。 信用卡公司visa使用hadoop,能夠將處理兩年內730億單交易所需的時間,從一個月縮減 至僅僅13分鐘。這樣大規模處理時間上的縮減足以變革商業了。也許hadoop不適合正規記賬,但是當可以允許少量錯誤的時候它就非常實用。

zestfinance,一個由谷歌前任資訊長道格拉斯·梅里爾創立的公司,用自己的經驗再次 驗證了“寬容錯誤會給我們帶來更多價值”這一觀點。這家公司幫助決策者判斷是否應該向某些擁有不良信用記錄的人提供小額短期貸款。傳統的信用評分機制關注少量突出的事件,比如一次還款的延遲,而zestfinance則分析了大量不那麼突出的事件。2014年,讓zestfinance引以為豪的就是,它的貸款拖欠率比行業平均水平要低三分之一左右。唯一的

得勝之道還是擁抱混雜。

梅里爾說:“有趣的是,對我們而言,基本沒有任何一個人的資訊是齊備的,事實上,總有 大量的資料缺失。”由zestfinance建立的用來記錄客戶資訊的矩陣是難以想象得稀疏,裡面充滿了資料的空洞,但zestfinance在這些支離破碎的資料中如魚得水。舉個例子,有10%的客戶屬性資訊顯示“已經死亡”,但是依然可以從他們身上收回貸款。梅里爾一臉壞笑地說:“顯然,沒有人會企盼殭屍復活並且主動還貸。但是我們的資料顯示,放貸給殭屍是一項不錯的生意。”

所以有時候,通過代理取得資料資訊比自己去操作煩瑣的程式要便宜得多。同時還有另一 個徵信機構出售“支付能力指數”和“可支配支出指數”,這些指數是用來預測一個人的支付能力的。

資料化

必須收集所有資訊(包括被否掉的資訊和被忽略的資訊),所有跟行業接觸的客戶的資訊,甚至沒有需求的客戶資訊。所以可以分四步來走,第一步所有達成交易客戶的全面資訊(*只要能收集到能接觸到的),第二步收集所有跟公司有接觸的客戶的全面資訊,第三步收集跟整個行業有接觸的客戶的全面資訊,第四步所有跟客戶相關的人或法人的全面資訊,第五步所有人的全面資訊。

一切給馮·安這位家裡經營糖果廠的瓜地馬拉人帶來了相當高的知名度,使他能夠在取得 博士學位後進入卡內基梅隆大學工作,教授電腦科學;也使他在27歲時獲得了50萬美元的麥克阿瑟基金會“天才獎”。但是,當他意識到每天有這麼多人要浪費10秒鐘的時間輸入這堆惱人的字母,而隨後大量的資訊被隨意地丟棄時,他並沒有感到自己很聰明。

於是,他開始尋找能使人的計算能力得到更有效利用的方法。他想到了一個繼任者,恰如 其分地將其命名為recaptcha。和原有隨機字母輸入不同,人們需要從計算機光學字元識別程式無法識別的文字掃描專案中讀出兩個單詞並輸入。其中一個單詞其他使用者也識別過,從而可以從該使用者的輸入中判斷註冊者是人;另一個單詞則是有待辨識和解疑的新詞。為了保證準確度,系統會將同一個模糊單詞發給五個不同的人,直到他們都輸入正確後才確定這個單詞是對的。在這裡,資料的主要用途是證明使用者是人,但它也有第二個目的:破譯數字化文字中不清楚的單詞。recaptcha的作用得到了認可,2014年穀歌收購了馮·安的公司,並將這一技術用於圖書掃描專案。

我們所處的時代之所以與眾不同,是因為資料的收集不再存在固有的侷限性。技術已經發 展到一定程度,大量資訊可以被廉價地捕捉和記錄。資料經常會得到被動地收集,人們無須投入太多精力甚至不需要認識這些資料。而且,由於儲存成本的大幅下降,儲存資料比丟棄資料更加容易。這使得以較低成本獲得更多資料的可能性比以往任何時候都大。

大資料創新可以有兩個方向:

1、更適合於已有大量資料在手的進一步資料價值挖掘。

2、或打造向大資料收集方向靠攏的模式,建立一種好的收集機制。

資料創新1:資料的再利用

資料創新2:重組資料

資料創新3:可擴充套件資料 :可擴充套件資料

資料創新4:資料的折舊值

資料創新5:資料廢氣

資料創新6:開放資料

這兩家公司的不同做法很能說明問題。微軟只看到了拼寫檢查作為文書處理這一個目的的 價值,而谷歌卻理解了其更深層次的價值。不僅利用錯別字開發了世界上最好、最新式的拼寫檢查器來提高搜尋質量,而且將其應用於許多其他服務中,如搜尋的“自動完成”功能、gmail、谷歌文件甚至翻譯系統。

容錯,包容能帶來新的價值

一位谷歌的員工說:“我們喜歡從大的‘噪音’資料集中吸取教訓。”

很多企業都開始設計他們的系統,以這種方式收集和使用資訊。在facebook的早期,資料 科學家們研究了資料廢氣的豐富資訊,發現人們會採取某種行動(如回帖、點選圖示等)的最重要的預測指標就是他們看到了周圍的朋友也在這麼做。緊接著,facebook重新設計了它的系統,使每個使用者的活動變得可見並廣播出去,這為網站的良性迴圈做出了新的貢獻。逐漸地,這個想法從網際網路行業傳播至可以收集使用者反饋的任何公司。

資料本身、技能與思維

資料來源,信用卡 匿名資訊

手/網遊公司。。。

大資料只是科技發展的一個階段,人類卓越的才華才是人類最大的優勢(相比較於機器),是我們行進道路上可能用到或可以說必定會用到工具,工具就需要擅用的才華與技巧。 如果存在超越或近似於人類才華的能力,那它就具備人類同樣的智慧。

預設推薦其他範文:

常來福《大資料》讀後感9.03

大資料時代讀後感

《大資料時代》讀後感

大資料時代讀後感

大資料時代讀後感

TAG標籤:多篇 讀後感 精選