區塊鏈對大(dà)數據的意義,區塊鏈應用與大(dà)數據

 大(dà)數據     |      2018-09-10 08:44
  在過去(qù)幾年中(zhōng),區塊鏈可能是IT領域最重要的發展,它有可能改變世界接近大(dà)數據的方式,增強安全性和數據質量。
 
  “可以說是過去(qù)幾年信息技術最重要的發展,區塊鏈有可能改變世界接近大(dà)數據的方式,增強的安全性和數據質量隻是使用Satoshi Nakamoto标志(zhì)性技術爲企業帶來的兩個好處。 ”
 
 
什麽是區塊鏈?
 
  Blockchain是一(yī)個分(fēn)布式數據庫系統,充當存儲和管理事務的“開(kāi)放(fàng)式分(fēn)類帳”。數據庫中(zhōng)的每個記錄稱爲塊,并包含諸如事務時間戳之類的詳細信息以及指向前一(yī)個塊的鏈接。這使得任何人都無法回溯地更改有關記錄的信息。此外(wài),由于在多個分(fēn)布式數據庫系統上記錄相同的事務,該技術在設計上是安全的。
 
  考慮到上述情況, 區塊鏈是不可變的 – 隻要網絡存在,信息就會保持相同的狀态。
 
區塊鏈和大(dà)數據
 
  當你在比特币的背景下(xià)談論區塊鏈時,與大(dà)數據的聯系似乎有點脆弱。如果區塊鏈不是比特币,而是其他金融交易的分(fēn)類賬,該怎麽辦?還是商(shāng)業合同?還是股票(piào)交易?
 
  金融服務業開(kāi)始認真研究區塊鏈技術。瑞銀集團首席信息官奧利弗·巴斯曼(Oliver Bussmann)表示,區塊鏈技術可以“将交易處理時間從幾天縮短到幾分(fēn)鍾”。
 
  區塊鏈金融服務的業務需求是強大(dà)的。想象一(yī)下(xià)這種規模的區塊鏈。包含每個金融交易完整曆史的巨大(dà)數據塊,均可用于分(fēn)析。區塊鏈提供分(fēn)類帳的完整性,但不用于分(fēn)析。這就是大(dà)數據和相關分(fēn)析工(gōng)具将發揮作用的地方。
 
大(dà)數據
 
大(dà)數據分(fēn)析——區塊鏈應用
 
  一(yī)家由47家日本銀行組成的财團與一(yī)家名爲Ripple的區塊鏈創業公司簽約,以利用區塊鏈促進銀行賬戶之間的資(zī)金轉賬。此舉背後的主要原因是以極低的成本執行實時轉賬。傳統實時轉賬昂貴的原因之一(yī)是潛在的風險因素。雙重支出(這是一(yī)種交易失敗的形式,其中(zhōng)相同的安全令牌被使用兩次)是實時轉移的真正問題。使用區塊鏈,可以在很大(dà)程度上避免這種風險。 大(dà)數據分(fēn)析 使得識别消費(fèi)者支出模式和識别風險交易的速度比目前更快。這降低了實時交易的成本。
 
  在銀行業以外(wài)的行業中(zhōng),采用區塊鏈技術的主要動力是安全性。在醫療保健,零售和公共管理部門,企業已開(kāi)始嘗試使用區塊鏈來處理數據,以防止黑客攻擊和數據洩露。在醫療保健領域,區塊鏈等技術可以确保在每個級别的數據訪問中(zhōng)都尋求多個“簽名”。這可以幫助防止諸如2015年襲擊事件的重複,這些事件導緻超過1億的 患者記錄被盜 。
 
區塊鏈應用大(dà)數據的優勢
 
1,實時分(fēn)析的可能性
 
  到目前爲止,實時欺詐檢測隻是一(yī)個白(bái)日夢,銀行機構一(yī)直依賴于使用技術來回顧性地識别欺詐性交易。由于區塊鏈每個交易都有一(yī)個數據庫記錄,因此它爲機構提供了一(yī)種實時挖掘模式的方法,如果需要的話(huà)。
 
  但所有這些可能性也引發了對隐私的質疑,這與區塊鏈和比特币首先變得流行的原因直接矛盾。一(yī)些行業專家表示擔心,能夠提供每筆交易記錄的技術可用于“從客戶分(fēn)析到其他不太良性的原因”的所有事情。
 
  然而,從另一(yī)個角度來看,區塊鏈極大(dà)地提高了數據分(fēn)析的透明度。與以前的算法不同,區塊鏈設計拒絕任何無法驗證且被認爲可疑的輸入。因此,零售等行業的分(fēn)析師隻處理完全透明的數據。換句話(huà)說,區塊鏈系統識别的客戶行爲模式可能比現在更加準确。
 
2.發現交易數據
 
  區塊鏈中(zhōng)的數據預計價值數萬億美元,因爲它繼續進入銀行,小(xiǎo)額支付,彙款和其他金融服務。事實上,到2030年,區塊鏈分(fēn)類賬的價值可能高達整個大(dà)數據市場的20%,年收入高達1000億美元。從這個角度來看,這種潛在的收入超過了Visa,Mastercard和PayPal目前産生(shēng)的收入。大(dà)數據分(fēn)析對于跟蹤這些活動以及幫助使用區塊鏈的組織做出更明智的決策至關重要。
 
  數據情報服務正在興起,以幫助金融機構,政府和各種組織深入研究他們可能在區塊鏈上與誰進行互動并發現“隐藏”模式。
 
3.揭開(kāi)社交數據
 
  随着比特币在2014年和2015年的普及,由于現實世界事件和公衆對該技術的看法,虛拟貨币開(kāi)始大(dà)幅波動。這些波動證明虛拟貨币具有幾個特征,使其成爲社交數據預測的理想選擇。
 
  根據Freshminds的Rick Burgess的說法:“使用社交數據預測消費(fèi)者行爲并不是什麽新鮮事,許多交易者一(yī)直在尋求将社交指标納入其交易算法。但是,由于大(dà)多數金融工(gōng)具的定價涉及很多因素,因此預測市場将如何變化可能非常困難。“
 
  幸運的是,比特币用戶和社交媒體(tǐ)用戶傾向于很好地協調,并且将它們用于數據分(fēn)析可能是有益的, 因爲他進一(yī)步解釋說:
 
  比特币用戶往往與社交媒體(tǐ)用戶處于相同的人群中(zhōng),因此他們對比特币的态度,意見和情緒都有很好的記錄。
 
  比特币和其他加密貨币的價值幾乎完全由市場需求決定,因爲市場上的硬币數量是可預測的,并且與任何實物(wù)商(shāng)品無關。
 
  比特币主要由個人而非大(dà)型機構進行交易。
 
  影響比特币價值的事件首先在社交媒體(tǐ)上傳播。
 
  數據分(fēn)析師現在正在挖掘 社交數據, 以深入了解關鍵的加密貨币趨勢。反過來,這可以幫助組織發現強大(dà)的人口統計信息,并将比特币的表現與世界事件聯系起來。
 
4.新形式的數據貨币化
 
  根據戴爾EMC服務公司首席技術官Bill Schmarzo的說法,區塊鏈技術“還有可能通過消除中(zhōng)間人促進交易來實現數據和分(fēn)析的共享和貨币化的民主化。”在商(shāng)業領域,這爲消費(fèi)者提供了更強大(dà)的公司談判權力。 。它允許消費(fèi)者通過區塊鏈控制誰有權訪問他們的數據。然後,他們可以要求定價折扣,以換取他們個人消費(fèi)公司産品或服務的數據。
 
  Schmarzo還解釋了區塊鏈如何導緻新形式的數據貨币化,因爲它具有以下(xià)大(dà)數據分(fēn)支:
 
  參與交易的所有各方都可以訪問相同的數據。這加速了數據采集,共享,數據質量和數據分(fēn)析。
 
  所有交易的詳細記錄保存在單個“文件”或區塊鏈中(zhōng)。這提供了從頭到尾的完整事務概述,消除了對多個系統的需求。
 
  個人可以管理和控制他們的個人數據,而無需第三方中(zhōng)介或集中(zhōng)存儲庫。
 
  最終,區塊鏈可以成爲數據貨币化的關鍵推動因素,通過創建新的市場,公司和個人可以直接相互分(fēn)享,銷售和提供他們的數據和分(fēn)析見解。
 
  在大(dà)規模采用比特币的帶頭下(xià),區塊鏈技術在整個商(shāng)業和金融領域都在不斷發展。它促成的快速安全交易可能會徹底改變傳統數據系統。根據畢馬威和Forrester Consulting的調查, 三分(fēn)之一(yī)的決策者信任他們公司的數據。但是使用區塊鏈技術,這種信任可以大(dà)大(dà)加強,真正的應用程序将變得更加普遍。
 
總結:
 
  現在,每個公共區塊鏈上都存有數百萬比特的數據。它的潛在價值是巨大(dà)的。
 
  然而,還沒有一(yī)種簡單的方法可以全面地查看它,這意味着我(wǒ)(wǒ)們無法研究,跟蹤或以其他方式充分(fēn)利用它。
 
  這是一(yī)個失去(qù)的機會,因爲可以用這些數據做很多事情。例如,如果我(wǒ)(wǒ)們将這些數據植入機器學習模型,我(wǒ)(wǒ)們就可以跟蹤有助于我(wǒ)(wǒ)們防止惡意用戶行爲的趨勢 – 例如盜版或販毒。
 
區塊鏈與大(dà)數據總結
 
  目前,我(wǒ)(wǒ)們僅将區塊鏈用于交易目的。
 
  我(wǒ)(wǒ)們使用比特币區塊鏈将錢從一(yī)個地址彙到另一(yī)個地址。通過以太坊的智能合約,區塊鏈上的各個地址可以在另一(yī)個地址上調用一(yī)個函數。
 
  但是,數據僅用于事務或狀态機目的。
 
  我(wǒ)(wǒ)們需要考慮的是:這筆錢是如何被轉移的?它在哪裏?誰在做什麽?我(wǒ)(wǒ)們可以将哪些地址識别爲騙子或恐怖分(fēn)子地址 – 黑暗網絡的中(zhōng)心?
 
  想象一(yī)下(xià),如果我(wǒ)(wǒ)們可以标記這些地址。然後,我(wǒ)(wǒ)們可以生(shēng)成一(yī)個模型,以防止資(zī)金進入我(wǒ)(wǒ)們知(zhī)道是恐怖分(fēn)子,毒販或其他不良行爲者的财産的交易所或地址。
 
  這對個人,公司和情報機構都很有用。但是這樣的功能還可以讓我(wǒ)(wǒ)們獲得某些經濟洞察力,例如能夠随時間預測代币的價格,我(wǒ)(wǒ)們可以通過跟蹤投機和移動的趨勢來做到這一(yī)點。
 
  問題是,我(wǒ)(wǒ)們還沒有可用的機制來幫助我(wǒ)(wǒ)們進行跟蹤。
 
  用戶可以查看區塊鏈并訪問與他們及其周圍人員(yuán)進行的交易有關的信息,但他們無法在更廣泛的範圍内或以有意義的可視化方式執行此操作。在以太坊中(zhōng),很容易通過etherscan跟蹤一(yī)個用戶,但不能同時跟蹤一(yī)大(dà)堆用戶。當然,這禁止我(wǒ)(wǒ)們利用這些數據進行潛在的有價值的事情,例如跟蹤資(zī)金流動的位置。
 
  其中(zhōng)一(yī)個原因是區塊鏈本身仍處于概念驗證階段。它的數據結構已被證明是合理的,但它還沒有發展到它提供明顯效用的程度。它仍然隻是一(yī)種存儲數據的機制。但現在有大(dà)量的數據,它相當于未開(kāi)發的金礦。
 
  但那很快就會改變。數據就在那裏 – 它就在那裏使用,它就在那裏進行實驗。
 
  現在是時候開(kāi)始使用區塊鏈上的數據來創建實用程序了。
 
  在許多方面,區塊鏈的出現與早期的互聯網類似。
 
  當互聯網首次啓動時,它實際上隻是一(yī)個相互連接的計算機社區。那個社區确實産生(shēng)了數據,但沒有多少。
 
  但随後,當越來越多的人開(kāi)始使用它時,數據量呈指數級增長。人們意識到,如果他們能夠使用這些數據 – 從中(zhōng)學習,訪問,閱讀,以允許其他人找到它的方式創建更多數據 – 他們需要某種增強的搜索能力。
 
  這就是爲什麽搜索引擎 – 以及後來的社交媒體(tǐ)平台 – 誕生(shēng)的一(yī)個重要原因。
 
  區塊鏈應該進行類似的計算。
 
  僅在以太坊和比特币上,已經有數百萬筆交易。ICO已經創建。我(wǒ)(wǒ)們進入了一(yī)個新時代,這種技術在90年代早期就采用了與互聯網類似的規模。
 
  我(wǒ)(wǒ)們需要的是專門爲利用這些數據而設計的應用程序。
 
  這種技術已經在其他領域廣泛使用。
 
  有些公司(如Palantir)收集和分(fēn)析與電(diàn)話(huà),銀行賬戶和消息相關的數據,并将這些信息提供給FBI以協助搜索嫌疑人。可以輕松構建類似的東西來跟蹤,分(fēn)析和利用跨各種區塊鏈收集的數據。
 
  建立機制以幫助我(wǒ)(wǒ)們跟蹤和使用區塊鏈上的數據不僅僅是一(yī)個機會。這是保證我(wǒ)(wǒ)們的資(zī)金和數據安全的一(yī)種手段。