支持快速搜索定位,找到企業中各種數據資産,形成有效的數據交彙,來支持應用分析。
提供各種數據資産快速展現(xiàn)的個性化形式,方便使用者獲取所需要的關鍵信息。
積累過去(qù)所有進行過的數據加工知(zhī)識,在相(xiàng)似場景下可以更好的推送或重複使用這些數據。
在數據的搜索結果上,直接配備方便的分析工具,讓數據使用的更加得心應手。
建立數據資産分布及綜合評估的入口,更好的了解數據資産使用的各個方面。
數據是(shì)什麽:需要知(zhī)道數據形式是(shì)怎麽樣的,比如結構化或非結構化;數據定義是(shì)什麽,比如技術、業務、管理等;數據的使用特性如何,比如頻(pín)度、評價、質量、安全級别等;數據包含什麽信息,比如時間周期、業務分類、信息密度。
數據在哪裏:需要知(zhī)道數據存放(fàng)的位置,與業務相(xiàng)關的數據還有過去(qù)曾今用過且值得參考的數據有哪些,與數據使用相(xiàng)關的輔助性工具在哪裏,等等。
數據如何取:需要提供一系列工具及輔助信息,幫助實現(xiàn)數據采樣、數據查詢、數據下載、數據安全沙箱建立各種使用數據的方式。
數據怎麽用:需要幫助使用者更快速便捷地獲取數據内在信息,例如,數據摘要信息、數據快速分析、數據報表工具、數據分析模型、知(zhī)識幫助指導等。
獨立于數據地圖的數據資産開發者:數據地圖作爲一種對數據資産分布及運行情況的反饋的工具,用于幫助開發工作的有序進行。例如,對于業務部門提出的新增指标需求的開發,如果缺少數據地圖對整個企業數據資産的全盤映射,則研發人員(yuán)無法準确知(zhī)道該指标是(shì)否已經存在,以及重複開發的可能,長期這樣的話(huà),會導緻企業數據資産冗餘低效,但(dàn)依托數據地圖,則可以通過指标注冊、存在分析、鏈路比較等功能對指标的新增需求、加工流程進行一個統一的管理。
以數據地圖爲入口的數據資産開發者:可以參考框計算,數據地圖可以實現(xiàn)對各種數據工具的集成,從而變成一個全新的入口整合平台。比如,原來搜索出來的報表,隻知(zhī)道名稱和位置,要獲取加工和所處位置,要獲取信息或者做拆分加工,還需要啓動開發流程,但(dàn)借助數據地圖,提供的工具集成,可以在搜索完之後,立刻進行簡單的數據摘要信息展現(xiàn)、初步加工分析或者通過鏈接去(qù)調用其他系統的核心服務功能,這樣便能讓數據地圖的功能更好豐富。
數據體檢:提供對數據在設計、加工、運行、管理等不同的環節關鍵指标的采集,基于預設算法進行健康評估,從而爲解決數據健康問題提供參考。數據體檢是(shì)驅動數據治理不斷完善的内生驅動力,它是(shì)高品質數據資産環境可持續發展的有力保障。
運維監控:配合運維日常管理制度和人員(yuán),基于各種技術監控、預警、問題診斷、幹預等手段,并且依托數據地圖來統一展現(xiàn)和管理交互,因此保障數據質量的可靠性。
安全評估:從數據安全角度提供評估分析能力,例如,數據敏感度、客戶隐私信息和各環節審計日志記錄管理等。
數據平台爲數據使用者回答,數據是(shì)什麽,數據在哪裏,數據如何獲取,數據怎麽用這四個問題
數據是(shì)什麽:需要知(zhī)道數據形式是(shì)什麽,eg:結構化,非結構化;數據定義是(shì)什麽,eg:技術,業務,管理等;數據的使用特性如何,如頻(pín)度,評價,質量,安全級别; 數據包含什麽信息,如時間周期,業務分類,信息密度等。
數據在哪裏:數據存放(fàng)的位置,與業務相(xiàng)關的數據還有過去(qù)曾經使用且值得參考的數據有哪些,與數據使用相(xiàng)關的輔助性工具在哪裏等,eg:記錄數據相(xiàng)關的所做的處理過程名稱,上下遊關聯表
數據如何獲取:需要提供一系列的工具及輔助信息,幫助實現(xiàn)數據采樣,數據查詢,數據分發推送,等各種使用數據的方式。eg:記錄數據的獲取方式,是(shì)否需要走流程開權限,是(shì)否需要支持某些開放(fàng)的接口,還是(shì)已經有一些現(xiàn)成的查詢工具
數據怎麽用:需要幫助使用者更快速,便捷地獲取數據内在信息,eg:數據摘要信息,數據快速分析,數據報表工具,數據分析模型,知(zhī)識幫助指導等
數據地圖作爲對數據分布和運行情況的反饋能力,用于能夠幫助開發工作的有序進行。例如,一企業業務指标一般都是(shì)成百上千。如果沒有通盤了解以前做的工作,或者對業務有足夠的理解,很可能重複指标開發。造成功能冗餘,産能低效。但(dàn)數據平台具備的功能,則可以通過指标注冊,存在分析,鏈路比較等功能對指标的新增需求,加工流程進行統一管理,減少重複開發,也加深了每個數據開發者對業務的立體化理解。
數據平台,可以輸出各類數據 API,功能 API,對各類數據工具的集成,形成一個開發的數據中心和開發的計算平台。eg:例如分析企業擔保圈,擔保圈算法開發人員(yuán),針對數據平台提供數據輸出接口,計算平台的輸入格式,輸出格式,甚至兼容自定義輸出格式,開發自己的算法。
對于數據管理者來說,需要了解數據的全局情況,以及通過工具手段來評估數據資産在配置合理性,應用充分性,質量可靠性,風險可控性等方面的清苦啊,從而針對性地進行決策分析,并落實管理工作,具體表現(xiàn)在三個方面的能力
數據體檢:通過對數據在設計,加工,運行,管理等不同環節關鍵指标的采集,基于預設算法進行健康度評估,從而爲解決數據健康問題提供參考。數據體檢是(shì)驅動數據治理不斷完善的内,生驅動力,他是(shì)高品質數據資産環境可持續發展的有力保障。
運維監控:配合運維日常管理制度和人員(yuán),基于各種技術監控,預警,問題診斷,幹預等手段,且依托數據平台來統一戰線(xiàn)和管理交互,從而對确保數據質量可靠。
安全評估:從數據安全角度提供評估分析能力,例如,數據敏感度,客戶隐私信息和各環節審計日志管理等
數據體檢是(shì)保障數據質量的一個關鍵手段,可以及早發現(xiàn)問題隐患并預計及金額,放(fàng)緩數據質量問題引起不良後果的重要手段。可以考慮從三個方面進行思考和研究:系統資源,數據流轉,使用,存儲狀态,管控
系統資源
系統資源的充足健康,是(shì)數據産生價值的基礎。