大資料與區塊鏈:天地之間有本賬

大資料與區塊鏈:天地之間有本賬

近幾年來,區塊鏈(blockchain)技術為大資料的應用提供了一個新的發展方向。區塊鏈,就是由很多區塊(block)組成的鏈(chain),其實它本質上是一種分散式、去中心化的網路資料庫系統,在這個網路資料庫中,可以發生無數各類交易,所有交易的資料透過加密的形式壓縮成一個超級小的資料檔案,由網路中所有的參與者共同來確認和維護。區塊鏈具有五個特點:去中心化、時序資料、集體維護、可程式設計和安全可信。

去中心化,就是在P2P的網路結構下,資料的驗證、記賬、儲存、維護和傳輸等過程,都是網路中端點對端點的直接操作,不存在一個數據集散的中心組織;時序資料,是採用帶有時間戳的鏈式結構儲存資料,具有極強的可驗證和可追溯性;集體維護,是區塊鏈所在網路的所有節點,均可參與資料的驗證;可程式設計,是區塊鏈技術可提供靈活的指令碼程式碼系統,支援使用者建立智慧合約、數字貨幣等去中心化的應用;安全可信,因為區塊鏈技術採用非對稱密碼學的原理對資料進行加密,確保了資料的安全性,並同時藉助全網各節點的共識演算法形成的強大算力來抵禦外部攻擊,使資料很難被篡改和偽造。

因為區塊鏈的網路資料庫本質上就是個電子版的賬本,這個賬本全網的參與節點人手一冊,所以當前很多企業利用區塊鏈技術開發分散式記賬功能,以求在供應鏈金融業務中緩解資訊不對稱導致的信任風險。比如,張三如果在微信群裡大喊一聲要給李四10塊錢,群裡所有人就都看到這條訊息了,如果張三反悔,就需要刪除群裡所有人手機裡的訊息(區塊鏈中認定為至少51%的篡改量),這種可能基本是不存在的,這就是區塊鏈的分散式記賬幾乎沒法篡改的原理。

因為區塊鏈是由很多區塊組成的鏈狀資料庫,所以可以把區塊鏈視為一本“總賬”,上面的每個區塊就像記載著交易資料的每一“頁”,這些頁都有唯一的“頁碼”,這個頁碼就是每個區塊的版本號,這些版本號前後相連,構成了區塊的前後順序。每個區塊包含了區塊頭和區塊主體兩部分,區塊頭記載了區塊中的屬性資訊,包括版本號、前區塊雜湊(Hash)值、默克爾(Merkle)根、時間戳、難度目標、隨機數(Nonce);區塊主體則記載了本區塊中的交易內容,但這些內容是經過某種雜湊演算法加密的,當前通常使用SHA-256(安全雜湊演算法)進行區塊加密,這種演算法可以將長短不一的資料明文統一輸出為32個位元組的程式碼。

區塊鏈透過雜湊演算法對每個區塊中的交易資訊加密,雜湊演算法是一種單向密碼體制,也就是加密和解密是兩套方法,用加密的方法不能進行逆向解密,加密方法稱為“公鑰”,解密方法稱為“私鑰”。每段資料的雜湊值是唯一的,哪怕只更改原資料的一個字母,都會隨之產生不同的雜湊值。就這樣,每個交易資料對應一個加密的雜湊值,N個交易資料就有N個雜湊值,然後一層一層算上去,就形成一個Merkle樹,最終得到的雜湊值就是Merkle根(見圖)。

#FormatImgID_2#

區塊鏈資料結構示意圖

當兩個節點的區塊的資料進行同一性校驗時,只需從Merkle根開始對照就行,Merkle根一致了,下面的資料不用再看了;Merkle根如果不一致,可以一層一層對照,最終會找到不同的交易資料在哪裡。

當前,區塊鏈根據開放程度不同,主要分為公有鏈、私有鏈和聯盟鏈。公有鏈向全球開放,世界上任何一個節點都可以參與進來,傳送、讀取和確認交易資訊,並建立區塊;私有鏈比公有鏈的開放範圍小得多,也不向所有人開放,只有某些特定的節點才能應用,通常是由一個組織擁有建立和維護的許可權;聯盟鏈的開放範圍是介於公有鏈和私有鏈之間,是由多個組織或機構透過聯盟的形式組建的區塊鏈,聯盟成員之間透過某種形式(如契約)建立信任和共識機制,構造區塊和連結功能僅限於聯盟內部,訪問許可權對外採取限制性開放。

小結

供應鏈金融與P2P網際網路金融的最大區別,在於供應鏈金融的資金融通是和資產綁在一起的,相對於網際網路金融的縹緲,供應鏈金融更加實際。依託於物流和貿易的供應鏈金融,需要大資料為每個業務環節提供參照依據。大資料能夠反映企業各方面的真實面貌,分析物件主要是涉及供應鏈交易活動中的參與主體,分析目的是全面辨識融資企業的顯效能力、隱效能力和潛在風險,資料要具有準確性、一致性、及時性和完整性,資料可以從直接渠道或間接渠道獲取,但很多領域的資料獲取方法可以是多樣化的。物聯網是採集大資料最重要的技術之一,從技術上可分為感知層、網路層和應用層。企業對大資料的分析計算往往需要用到雲計算技術,雲計算其實是一種依託網際網路的計算方式,是在雲平臺的支援下讓大資料得以儲存和處理的組織形式。區塊鏈技術具有分散式、去中心化的特點,可以在大資料的應用方面降低資訊不對稱,提升中小企業的融資信用。來源‘讀懂供應鏈金融’張鍾允,更多幹貨,關注e票通!

相關文章