如何克服擴展數據科學專案時的挑戰

Engage in the Latest Data forum for valuable lead-generation strategies
Post Reply
urrifat77
Posts: 34
Joined: Tue Dec 03, 2024 8:07 am

如何克服擴展數據科學專案時的挑戰

Post by urrifat77 »

但在 1920 世紀 00 年代中期,資訊時代吞併了工業時代,農業和工業並沒有消失。同樣,資訊時代將——已經——融入我們現在所處的激動人心的新時代:體驗時代。

如果資訊時代的重點是收集大量數據,那麼體驗時代的重點就是分析數據並發現它能為我們做什麼——讓它為我們服務。

這就是像您這樣的資料科學家的用武之地。美國勞工統計局估計,到 2033 年,數據科學職位將增加 35%。

與全國所有行業平均就業成長率 3% 相比。

這項統計數據令人興奮,但對數據科學家職位的高需求意味著對數據驅動的見解的巨大需求,每個組織都希望分得一杯羹。

壓力會讓人感到崩潰。您的團隊如何滿足組織對數據驅動洞察的需求?如何在不使用多餘資源的情況下擴大團隊可以完成的數據科學專案的數量?

這一切都取決於組織。借助運作良好的資料治理和衝刺規劃系統,您可以做比您夢想的更多的事情。

什麼是資料治理,為什麼它很重要?
資料治理是團隊用來管理其收集的資料生命週期的系統。透過有效的資料治理計劃,您的團隊可以保持組織有序並遵循重要的州、聯邦和全球法規。

您可能會問自己,“數據治理與數據管理之間有什麼區別?”可以這樣想:

資料治理制定了管理您如何取得、使用和保護資料的策略和程序。
資料管理是收集、處理、儲存、分析和解釋資料的方式。
換句話說,資料治理建立了資料管理框架並監督這些流程。您可以透過 DataCamp 了解有關資料治理概念的更多資訊。

大多數組織都有微觀層面的預設治理計畫──一個針對特定業務工具,另一個針對單獨的功能。身為資料科學家,您的工作是將資料治理簡化為一台高度組織化、嚴格控制的機器。

前期需要做很多工作嗎?是的。但一旦完成設置,您就可以管理更大的資料集並承擔更多專案。要快速掌握這些概念,請查看 DataCamp 的資料治理基礎備忘單,這是一份參考關鍵概念和最佳實踐的便捷指南。

建立資料治理框架
資料治理流程從組建團隊開始。

您和組織中的其他資料科學家需要共同努力實施資料 玻利維亞電話號碼列表 治理計劃。確切的頭銜和職責將根據您的組織而有所不同,但一般來說,您的組織需要任命四個角色:

資料管理員:管理治理計劃、確保安全並在業務和 IT 團隊之間進行聯絡
資料架構師:設計處理和儲存資料的系統,並幫助資料管理員遵循治理策略
資料保管人:移動、儲存、保護和監督資料的使用
數據分析師:解釋數據並將其轉化為業務的可行見解
根據公司的規模,每個角色可能需要多個人。有些組織也會有資料管理員或委員會來監督資料治理策略的創建。

建立全面的策略至關重要,DataCamp 的建立資料治理策略模組可以為您提供用於此流程的結構化方法。

概述資料治理政策
組建團隊後,您可以協作定義每個人都將遵循的資料治理策略。

思考這些問題:

貴公司將如何根據資料治理最佳實務使用和管理資料?
隨著技術的快速發展,誰將就數據的使用做出決策?
組織希望最終用戶如何從數據中受益?
探索答案並使用它們來創建總體資料治理策略。將其視為保護您圍繞標準、資料文化和安全性構建的子策略的保護傘。

弄清楚您的標準、安全措施和數據文化需求
現在,您需要考慮資料標準。如果數據不是一流的質量,那麼它對您沒有多大作用。數據應該符合什麼標準?您的團隊將如何過濾掉不符合他們要求的數據?了解並確保數據品質至關重要。透過 DataCamp 的資料品質簡介課程深入探討此主題。

議程上的下一個項目是安全。弄清楚:

如何對資料進行分類 - 公共、私有、機密、受限等
誰將有權存取每個分類
如何加密資料以確保其從儲存到傳輸再返回的安全
警報系統可通知您的團隊發生安全違規行為
關於如何處理任何違規行為的政策
測試和審核計劃,以確保您的程式按預期運行
最後,資料治理團隊可以做的最重要的事情之一就是讓整個組織了解資料如何幫助他們。讓人們了解情況有助於創造一種文化,讓數據像資產一樣受到重視和關心。

那麼,如何讓數據這樣看似乏味的東西吸引整個組織呢?

你讓它活起來,就是這樣。

向您的組織準確展示數據如何讓他們的工作變得更輕鬆。每季舉辦一次演示,以圖表和視覺效果展示數據如何影響公司決策。以同樣的方式發送訊息簡報或每月通訊。提供全公司性的課程,幫助員工提升數據素養。

關心數據的組織將幫助維護您制定的政策、程序和標準。這種標準和結構將使您的資料科學團隊能夠更輕鬆地承擔更多項目,而無需犧牲資料品質或安全性。

現在你已經準備好衝刺了。

數據科學團隊的衝刺計劃
您已經建立了資料框架,可以安全有效地在您的組織中移動。現在是時候看看類似衝刺的計劃如何為您服務。當然,衝刺計畫是軟體開發中使用的Scrum 專案管理系統的一部分。但它也適用於資料治理和管理。

這是因為,與軟體開發一樣,資料管理涉及數百萬個活動部件。字面上地。

首先,我們來談談什麼是衝刺。

衝刺是一個預先定義的時間範圍,在此期間您的團隊將完成任務以實現關鍵目標。儘管衝刺的長度可以根據您的需求而定,但通常為一到四週。通常,這足以讓您的數據科學團隊完成中小型專案。

其他時候,您的團隊需要運行多個衝刺才能完成一個巨大的專案。您知道,您必須產生巨大的資料集並將其貫穿從收集到解釋的整個生命週期。

在衝刺開始之前,您的團隊將開會制定計劃。

這樣,當衝刺正式開始時,每個人都清楚知道工作日要做什麼。根據 Scrum 方法,衝刺每週的衝刺規劃會議不應超過兩個小時。

假設您的醫療機構交給您一個較小的專案。您的團隊需要找出公司主頁上的號召性用語 (CTA) 按鈕效果不佳的原因。 CTA 按鈕敦促患者安排一次重要的癌症篩檢。

要解決這個問題,您需要:

分析歷史數據,了解 CTA 按鈕的目標受眾
提出一到兩個 CTA 按鈕的新變體
A/B 測試變體彼此之間以及原始版本
收集、處理和分析特定時期內的數據
提供可行的見解,幫助行銷團隊選擇正確的 CTA 按鈕
行銷團隊希望在三週內得到結果。

對於 A/B 測試來說,這是一個緊迫的時間表,但您的團隊正在努力。您將為為期三週的衝刺舉行三小時的衝刺規劃會議。

我們將使用此場景向您展示資料科學團隊的衝刺計劃。

1. 確定你的衝刺目標和時間框架
您的團隊在衝刺計畫期間應該問的前兩個問題是:

我們希望這次衝刺取得什麼結果?
我們實現這成果的現實時間表是多少?
行銷團隊為您提供了理想的結果,即 CTA 按鈕的點擊次數是目前按鈕的兩倍。

而且您已經知道您有三週的時間來完成衝刺。

Image

您已準備好進入下一步。

2. 寫下你的使用者故事
在軟體開發中,使用者故事是從使用者的角度對最終產品的描述。這是一項用簡單、自然的語言編寫的創意任務。目標是讓開發團隊站在最終用戶的立場上,並將故事點與衝刺中的具體任務相關聯。

您也可以為您的資料科學專案做類似的事情。

讓我們回到我們的模擬 CTA 按鈕專案。行銷部門希望用戶願意點擊 CTA 按鈕進行免費癌症篩檢。這意味著您需要設身處地為在醫療機構網站上遇到該按鈕的人著想。

在編寫使用者故事時回答以下問題:

誰會點擊新的 CTA 按鈕?
哪些與健康相關的擔憂讓他們徹夜難眠?
為什麼他們會從癌症篩檢中受益?
這個按鈕如何清晰簡潔地傳達這些好處?
按鈕周圍的文字和圖形讓他們感覺如何?
按鈕顏色、字體和文案是什麼促使他們點擊?
為什麼這個人會點擊 CTA 按鈕?
您可以根據您的專案調整這些問題。專注於結果並逆向工作,直到您了解它如何與用戶互動並使用戶受益。

如果您可以將故事中的特定點與衝刺中的任務相匹配,那就更好了。它將幫助您完成衝刺式規劃之旅的第三步。

3. 為每個團隊成員分配衝刺任務
現在,您應該知道需要執行哪些任務以及為什麼需要執行這些任務。

是時候為資料科學團隊的每個成員分配一項任務,讓他們在衝刺時間範圍內完成。您可能需要將一些任務分解成更小的部分。您還需要查明依賴關係。例如,您的資料科學團隊在建立新的 CTA 按鈕變體之前無法測試它們。

考慮使用任務管理軟體來追蹤每項任務的負責人,並確保明確識別和管理依賴關係。

勾勒出每個子任務和任務應該花費多長時間的輪廓。為每個人分配衝刺時間。與您的團隊核實,確保工作時間合理且可行。

請記住,這些時間是估計值,事情可能而且將會改變。如果您擔心時間表,請與請求該專案的部門溝通。如果需要的話,協商更長的時間估計。用額外的時間來充實一個專案總是一個好主意。您的團隊可以使用它來評估進度並針對任何問題進行調整。

匆忙完成一個專案可能會花費更多的時間和金錢——而這正是衝刺計劃旨在幫助您避免的問題。

資料治理與衝刺計畫:完美匹配
隨著數據科學在這個令人興奮的體驗時代變得越來越流行,您的團隊將同時處理數十個專案。

保持冷靜並繼續衝刺。

我們的意思是:

確定每個項目的預計截止日期
將每個項目分為一個或多個衝刺
將不同的衝刺分配給部門內的不同子團隊或根據首先到期的專案安排衝刺
為每個衝刺/專案舉行衝刺規劃會議
現在,您可以看到您和您的團隊在實現目標後實現目標。資料治理架構就位後,管理持續資料流將會是一個平穩、安全的過程。

如果旅途中出現任何問題,您將有適當的政策和程序來毫不費力地處理它們。

最後的想法
Post Reply