資料中臺、標籤、資料資產相關的15個名詞解釋

作者:任寅姿季樂樂

資料中臺、標籤、資料資產相關的15個名詞解釋

01資料

資料是指對客觀事件進行記錄並可以鑑別的符號,是對客觀事物的性質、狀態及相互關係等進行記載的物理符號或這些物理符號的組合。資料可以是連續的,比如聲音、影象,稱為模擬資料;也可以是離散的,如符號、文字,稱為數字資料。在計算機系統中,資料以二進位制資訊單元0和1的形式表示。

在《標籤類目體系》一書所論述的方法論中,“資料類目體系”概念中的“資料”是狹義的定義,單指企業原始擁有的、未經整理的資訊載體。

02資料資產

在傳統概念中,企業認為其所擁有的所有資料資源都是資料資產,例如存放了好幾十年的紙質檔案、光碟、影片、音訊等。這些資源還停留在原始資料階段,必須從中整理和提煉出可用的資訊項,才能真正為企業產生價值。

因此當前對資料資產主要關注其精準定義(狹義):由企業擁有或控制的,能夠直接為企業帶來經濟利益的資料資源。通常需要有較好的組織形式,資料資產才可以被編目、被管理、被高效使用。

03資料中臺

資料中臺是一套可持續“讓企業資料用起來”的機制。資料中臺是依據企業特有的業務模式和組織架構,以有形的產品和實施方法論為支撐,構建的一套持續不斷把資料變成資產並服務於業務的機制。

04標籤

標籤指從原資料加工而來,能夠直接為業務所用併產生業務價值的資料載體。從本質上講,標籤本身也是一種資料(或對映指向資料),它是對物理層資料資訊項的業務化封裝,是資料資產的一種良好組織形式,是一種概念、邏輯定義,因此標籤必須是可閱讀、易理解的。

從粒度上來講,標籤往往對映為某一物件的屬性,包括固有屬性和動態屬性,一般都需要結構化到欄位粒度,保障可被後續資料服務便捷使用。它面向資料應用的業務端,核心解答的是資料怎麼用、資產價值在哪裡的問題。根據加工方式的不同,標籤可以分成基礎類標籤、統計類標籤和演算法類標籤。

資料中臺、標籤、資料資產相關的15個名詞解釋

05元標籤

元標籤是標籤的標籤,即對標籤的屬性資訊(特別是業務化屬性資訊)梳理。透過元標籤,業務人員可以快速理解標籤定義,獲取標籤設計、加工、管理、使用等相關資訊。

06類目體系

類目體系指的是對某一類item(事物)的分類、架構、組織方法。類目體系結構可以用樹狀結構來類比,第一級分支稱為一級類目,從第一級分支中長出的第二級分支稱為二級類目,從第二級分支中長出的第三級分支稱為三級類目,以此類推。

沒有上一級類目的叫一級類目,沒有下一級分類的類目叫葉子類目,掛在葉子類目上的具體葉子就是item。有下級細分類目的類目是下一級類目的父類目,有上級類目的類目是上一級類目的子類目。圖2-17所示為標籤體系類目。

資料中臺、標籤、資料資產相關的15個名詞解釋

▲圖2-17標籤體系類目

類目體系設計好之後,可以將item分入合適的類目中。例如對商品的組織梳理可以形成商品類目體系,對標籤的組織梳理可以形成標籤類目體系。

07資料類目體系

資料類目體系是將企業原始擁有的資料欄位,採用類目體系的方式進行梳理所形成的目錄結構。

08標籤類目體系

標籤類目體系是將企業業務上所需的標籤,採用類目體系的方式進行梳理所形成的目錄結構。

09物件

標籤類目體系方法論中的物件指現實世界中所需要研究的目標。結合資料庫理論,實體(Entity)和關係(Relationship)在標籤類目體系方法論中都屬於物件,因此從物件型別上可以分為實體物件和關係物件,其中實體物件還可以細分為“人”和“物”。

資料世界中的物件可以和現實世界中的事物相對映,“人”“物”“關係”是對現實世界所有事物的資料抽象。

10人

標籤類目體系方法論中的“人”指會主動發起行為動作的物件。人包括自然人、自然人群體、法人、法人群體等,例如消費者、消費者協會、電商企業、電商企業聯合會等。

11物

標籤類目體系方法論中的“物”指行為動作中的被動物件。物包括物品、物體、物品集合等,例如商品、倉庫等。

12關係

標籤類目體系方法論中的“關係”指人和物、人和人、物和物等兩個物件間發生的某種連線。關係包括行為關係、歸屬關係、社交關係、同好關係等各種強、弱關係。

資料中臺、標籤、資料資產相關的15個名詞解釋

13場景

標籤類目體系方法論中的場景指某環境下,具體物件(人、物、關係)在時空中的表現。在某場景內,物件可能是某個人或某群人,可能是某個物或某群物,也有可能是發生著的某種關係或某系列關係集合。

因此任何一個事件,無論簡單還是複雜,都可以用場景來表達。例如,“午後我在發呆”“機器裝置異常執行”“消費記錄源源不斷產生”等都是場景。

前臺標籤類目體系中的場景往往指的是前臺業務使用資料資產服務解決自身業務問題、提升業務效率的資料應用場景。

14後臺類目體系

標籤類目體系在企業實際應用過程中可以拆分為後臺類目體系和前臺類目體系。後臺類目體系面向資料資產管理人員,是企業資料資產的全集,較為穩定,按照統一的分類方式進行標籤的掛載、檢視、管理。

資產設計師或管理員可以建立、維護後臺類目體系,業務人員只能檢視使用,無法修改後臺類目體系的類目格式。只有擁有一定許可權的資料資產管理員才可以在經過審批的情況下低頻修改後臺類目體系。

15前臺類目體系

業務人員通過後臺類目體系選擇並獲得標籤使用權後,可以根據場景需要,將標籤按照前臺場景組織新類目,形成前臺類目體系。

例如在後臺類目體系中,“性別”屬於【基本屬性】分類,“消費力”屬於【能力價值】分類,但前臺業務想透過“性別”“消費力”等維度對會員進行客戶洞察分析,那麼可以在前臺建立一個【客戶洞察】的分類,將“性別”“消費力”等標籤掛入這個前臺分類中。

前臺類目與後臺類目僅存在對映關聯,並不直接挪動標籤的物理位置,因而前後臺是相互隔離的。因此前臺類目可以靈活多變,並不影響後臺類目的穩定統一。

季樂樂(花名:寒泉),政法行業資深專家、產品專家擁有超過6年的政法行業產品經驗,原南京通達海區域負責人,專注於研究數字檢務、智慧法院等領域。

本文摘編自《標籤類目體系:面向業務的資料資產設計方法論》,經出版方授權釋出。

資料中臺、標籤、資料資產相關的15個名詞解釋

延伸閱讀《標籤類目體系》

推薦語:標籤類目體系是資料中臺理念落地的核心組成部分,是實現資料資產可複用、柔性組合使用、降低資料應用試錯門檻的強力支撐。本書旨在培養資深的資料資產架構師及資料運營專家,以方法教育而非工具實施的方式助力企業建立自身的資料資產化能力,將資料能力最大限度地轉化為商業價值。

相關文章