取消
搜索歷史
熱搜詞
原創
活動
產業創新
轉型理念
ENI專訪
當前位置:首頁 >文章發布 > 正文
談談數據建模和設計成功的三大能力
來源:數據驅動智能  作者: 王建峰 2023-11-06 09:39:24
數據建??梢詭椭鷺藴驶M織定義和描述其數據的方式,健全的數據模型能夠加速數據目錄的實施和數據質量計劃的啟動。

數據建??梢詭椭鷺藴驶M織定義和描述其數據的方式,健全的數據模型能夠加速數據目錄的實施和數據質量計劃的啟動。根據數據建模經驗,我們探討組織如何通過關注三個關鍵子功能來增強其數據建模能力:元建模、概念和邏輯數據建模以及物理數據建模。對于每項子功能,它將描述高度成熟度是什么樣子,并將以整體最佳實踐和成功因素作為結尾。

一 數據建模的三個能力

讓我們從數據建模的基本組件開始:

元建模——元建模是數據建模的一項子功能,涉及創建定義其他模型的結構、概念和關系的模型。元模型提供了一種定義和描述模型及其組件的標準化方法,這有助于確保這些模型的開發和使用的一致性和清晰度。元模型涵蓋概念、邏輯和物理模型,并定義各個組件如何一致地鏈接在一起。

概念和邏輯數據建模——概念和邏輯數據建模是數據建模的子功能,包括創建面向業務的數據視圖,捕獲特定領域(例如客戶、員工和產品)涉及的主要實體、關系和屬性。邏輯數據建模通過添加更多細節(例如指定數據類型、鍵和實體之間的關系)以及將概念域分解為邏輯屬性(例如客戶名稱、員工名稱和產品 SKU)來細化概念模型。

概念模型在最高層次上解釋了各自的領域或概念是什么,以及它們之間的關系。在以上示例中,可以看到交易形成了一個關鍵概念,其中每筆交易都可以鏈接到已售產品、購買產品的客戶、付款方式以及購買所在的商店。其中每一項構成了自己的概念。此外,關系顯示每個單獨的交易最多可以有一個與之關聯的客戶、商店或員工,但這些反過來又可以與許多交易相關聯。

在邏輯模型中,概念或域被分解為邏輯屬性。這樣的邏輯模型與底層元模型一致,現在可以轉換為物理模型,其中添加了有關這些數據屬性存在的確切位置,例如,在什么表中以及以什么格式存在的詳細信息。

在物理模型中,進一步的技術細節被添加到邏輯模型中,例如澄清表名稱、列名稱和數據類型。

二 數據建模需要考慮的內容

數據建模的高度成熟需要考慮幾個維度:

策略——組織的整體數據建模策略,包括數據建模工作與業務目標的一致性。

人員——明確特定角色及其職責,以及所需的專業知識、技能和培訓。

流程——流程和工作流程,包括數據建模方法的文檔、數據建模模板和標準的開發以及質量控制和審核流程的建立。

技術——支持數據建模工作所需的工具,例如數據建模軟件和工具,以及數據建模工具與其他系統和應用程序的集成。

應用——在組織內部和整個組織內應用和使用數據建模實踐。這可能包括應用計劃、解決應用障礙以及衡量數據建模工作的有效性和影響的跟蹤指標。

讓我們將其應用到三個子能力中。

元模型

元建模的高度成熟是擁有一個定義明確且廣泛采用的元模型,并在整個組織中一致使用。為了確認需要一個,而且只需要一個。如果沒有適當的元模型(比方說,通用語言的基本語法和詞匯),各種數據模型可能會涌現,導致跨領域、流程和系統的可解釋性和互操作性問題。

需要了解元模型并且能夠維護和解釋元模型的人。建議由一個人對元模型擁有最終權力。他可以接受反饋并收集變更請求,以確保其符合并保持符合目的。

定義的過程應該描述如何在建?;顒又惺褂迷P?。它的采用應該在數據建模者、數據架構師和數據工程師中廣泛采用。

數據目錄或元數據管理系統等工具可以提供用于存儲和管理元模型的集中存儲庫,并且可以支持協作和版本控制。

概念和邏輯數據建模

高成熟度是對概念和邏輯數據建模采用定義明確且一致的方法,并嚴格遵守元模型。概念域應該有一個所有者,并且應該有一個結構化的過程來創建新的邏輯屬性,然后對其進行審查、批準和發布。

對域和邏輯屬性進行建模是一項技能,而且是一項罕見的技能。它既需要核心數據建模專業知識,又需要能夠將其映射到現實業務領域,以對業務和技術組織都有意義的邏輯屬性進行描述。

概念數據模型應該明確與企業或業務架構保持一致,并與分配數據所有權的數據域保持一致。

數據建模軟件可用于大規模創建和維護概念和邏輯數據模型。這些工具可以提供模型的可視化表示,并且可以支持協作、版本控制以及與其他系統(例如數據目錄或元數據管理系統)的集成。業務術語表可用于定義和標準化模型中使用的業務概念和術語。

物理數據建模

物理數據建模的高成熟度級別通常包括擁有精心設計且高效的數據庫模式,以滿足適用的性能和可擴展性要求。這需要擁有能夠設計和實現模式的人員、定義明確的模式開發和維護流程以及支持模式設計和實現的適當技術工具。

數據庫設計軟件可用于創建和維護物理數據模型。這些工具可以從邏輯數據模型生成數據庫模式,并且可以支持協作、版本控制以及與其他系統(例如數據目錄或元數據管理系統)的集成。數據字典還可用于定義和標準化技術細節,例如數據類型、約束和其他數據庫對象。

三 最佳實踐和成功因素

為了增強數據建模能力,組織可以遵循一些最佳實踐和成功因素:

首先獲得正確的元模型。元模型驅動整個企業的可重用性和一致性。它確保所有后續建模工作逐步構建整體模型。如果這些沒有到位,那么面臨一項艱巨的任務,即在未來調整和橋接現有的、不兼容的模型。

考慮預制的工業或通用模型。根據所處的階段,可以考慮采用預先存在的數據模型。這可以推動與國際最佳實踐和標準的一致,節省從頭開始構建模型的時間和精力,并實現與外部各方高效、可靠的數據交換。例如,BIAN提供了標準化的銀行服務參考模型,為銀行業定義了通用語言、分類法和業務流程框架。

在概念、邏輯和物理之間進行迭代。數據建模需要時間,這項工作永遠無法完成。建議對域進行優先級排序(客戶和產品等參考域是很好的候選域),并從 1 或 2 開始,在進入下一個域之前,首先完成邏輯模型,然后是物理模型的指南。

不要過于復雜。數據建??赡芎軓碗s、耗時,因此成本高昂。完成基本的概念和邏輯模型幾乎總是絕對值得付出努力,但一旦進入物理領域,可能不需要集中指導和捕獲所有物理模型??赡苓€想在這里確定優先級,例如,確定“關鍵任務”系統并記錄這些系統的物理模型,但對于其他系統,確保本地應用程序所有者遵守特定的建模規范和標準可能就足夠了。

戰略性地實施技術。它們可能很昂貴,并且可能不需要它們用于第一個域,但最終數據模型的大小和復雜性將呈指數級增長??紤]數據目錄、業務術語表和數據字典,或者可以充當所有這些的東西。沒有它,數據價值創造將會很差。

四 小結

數據建模是一項關鍵能力,可幫助組織確保其數據設計良好、一致且有效支持業務需求。通過專注于元建模、概念和邏輯數據建模以及物理數據建模等子能力,組織可以提高其成熟度,并使業務用戶和數據科學家能夠始終如一地為各自的用例找到正確的數據。

編輯:喬帥臣
關鍵詞:   數據建模  元模型  王建峰 
活動 直播間  | CIO智行社

分享到微信 ×

打開微信,點擊底部的“發現”,
使用“掃一掃”即可將網頁分享至朋友圈。

2021国内精品久久久久精免费,18国产精品白浆在线观看免费,三人一起玩弄娇妻高潮,国内精品久久