編輯導讀:數據分析師作為互聯網行業背景下誕生的崗位,聽上去非常高大上,也有不錯的職業發展前景。本文作者針對數據分析這個崗位進行了分析,與你分享。
本文來自知乎問答。
問題:想做一名數據分析師,自學了《統計學》、R、SQL等。入門級別的,現在有點迷茫了,下步學什麼才是合適的?
我目前自學了《統計學》、JAVA、R、SQL、SPSS。但都是學到學門級別的,現在有點迷茫了,數據分析有那麼多工具,不知道學哪些才是最正確的,不知道怎麼規劃了(問題重點)。我目前考慮的問題主要有兩個:
短期希望找到一份相關的工作(目前事業編混日子)。長期規劃是做一名數據科學家不想走偏了。正文:
同樣是因為喜愛而轉行踏上數據科學之路。
畢業工作后,業余時間我一直在關注人工智能的新聞,出于興趣開始在晚上自學相關的理論知識、工具例如統計學、python。突然有一天,我心血來潮,忽然想通了,為何不投身喜愛的行業,要不然也只是空有一腔熱血。
于是我便馬不停蹄地開始學習Python,并決定從人工智能時代通用基礎能力——數據分析入手。
但因為是零基礎轉行,所以剛入職很多都不會,挨罵最多的就是做的計劃不落地、提的方案脫離業務場景……經歷了許多項目、積累了經驗后,我總結了以下能幫到你的經驗。
一、工具篇——硬實力從題主學習了這麼多工具的經歷,想必跟我一樣是個“工具控”,接觸到有趣又強大的工具會忍不住去學習。
現在我作為數據分析師,題主說的工具我都有在用,目前我在用的一些相關工具的應用場景:
1. Python常用的數據分析工具,數據科學界的明星產品。幾乎是萬能的工具,尤其是在解決重復性工作、大數據分析等場景方面特別好用。在Python列入小學課程的時代里,它絕對是值回票價的編程語言。
2. SQL通用的數據庫語言,對于數據分析師而言,可以完成取數、分析工作。所謂巧婦難為無米之炊,SQL可以從源頭上解決無數據的問題,要不然你是無法想象IT是如何拒絕或延后你的提數需求的。
3. SPSS“傻瓜式”的數據分析圖形軟件,可以像操作Excel那樣點點點,很簡單地完成復雜的數據分析工作,例如相關性分析、回歸建模等。
(如圖為我在實戰中使用SPSS進行特征挖掘的PPT)
目前我工作中,很喜歡用它的可視化決策樹。在實際的數據挖掘工作中,可解釋性是很重要的一環,它很多時候決定了模型的邏輯及結論是否被業務所認可。眾多模型中,線性/邏輯回歸在這方面絕對是老大,而在我發現了SPSS中將決策樹模型可視化這個逆天功能后,它就成為了我分析的最愛之一,得益于易懂的可視化圖形,它的邏輯與結論往往也很能被業務所接受。
4. R數據科學界的老大之一,統治著專業的統計學、生物、醫學等領域。目前我在用它,是因為公司的銷售預測模型是其他同事用R語言寫的。
R與Python的差異在于:R是統計語言,有很多優秀的框架,例如Python里最常用的Pandas庫就是從R移植過去的,再例如可視化圖表的庫的表現一騎絕塵。但是在自動化辦公、應用領域卻沒有Python廣。
所以,建議剛入行的童鞋先學Python這個性價比高的語言,等有進一步明確的需求后,再按需學習R即可。
5. Power BI非常優秀的可視化分析工具。在用Python做數據分析時,很多時候只能將分析結論可視化后黏貼到PPT里,對業務來說,他們更想要有可互動、動態更新的可視化分析結果。而這,就是我應用PowerBI的場景:數據導入后,建模分析,形成的分析報表業務直接點點點就可以感受到數據變化與特點。
但是PowerBI的建模思維有一定的門檻,而對于大多數分析師來說,Excel的圖表已經可以滿足。所以建議初學者先學習靈活應用Excel的可視化能力。
6. JAVA是使用最廣的開發語言,與數據分析關系不大。我之所以學它,是因為我負責的數據產品幾乎都是用Java開發的數據接口,所以才需要懂一些基礎。
想要從事數據分析工作的同學,不建議學習Java
7. 分析工具的優勢以上的提及的工具,建議挑選1-2個,如SQL+Python,進階學習。最重要的是進行項目實戰,可作為短期找工作的敲門磚。
掌握分析工具可以更快地在業務公司搶得眼球,可以應對復雜的業務需求。
工具無法解決的問題——對業務場景的理解
工具可以解決很多深度分析需求,但是重要核心還是用工具的人,分析思維還是要回歸業務場景。
二、思維篇——軟實力職場里真正重要的是:解決問題的能力,而它由定義問題、找到原因、落地建議三部分組成。
業務需求的提出,簡單地說,便是業務在運營過程中,發現了問題,故想通過數據分析找出問題原因所在,進而解決它。
1. 定義問題的能力只有正確的問題才能指引數據分析工作往正確的方向進行。
從一個模糊的問題說起:今天領導提出,最近老客表現差了。
下面對領導提的問題進行剖析:
【觀點與事實】
“最近老客表現差了”,首先這是一個觀點,不是事實。
【還原事實真相】
作為專業的數據分析師拿到這樣的觀點之后,第一件事是要還原事實的全部:
最近:最近是多長時間周期,這周?近三周?還是上個月?老客:如何定義老客?以往注冊過、但并未消費的客戶?還是說一定是有歷史消費的客戶?表現:哪個指標?重購金額?回柜人數?差了:是同比下降,還是環比下降,還是說增長幅度不及預期?面對領導的業務觀點,我們還原的事實是:上個月(2020年12月1日-12月31日),以往消費過的老客,在回柜消費時產生的消費金額,環比(與2020年11月1日-11月30日)下降了30%。
【事實與觀點】
組建好事實集合后,要利用信度效度思維,重新審視領導的觀點是否客觀、合理。
信度:
代表的是數據的可靠性程度和一致性程度,反映數據的穩定性和集中程度
也就是說,數據計算結果之前的取數邏輯、數據清洗工作是否合理,是否符合業務場景邏輯?
效度:
指測量工具能夠準確測量出事物真實情況的能力,反映數據的準確性。
簡單地說,這樣環比的比較是否有意義?例如品牌或行業屬性是節日敏感的,上上個月有雙十一大促,而12月是淡季沒有活動,不論是橫向與行業內其他公司,還是縱向按往年的經驗,12月重購金額比11月下降20-30%是合理的波動區間。
所以,這樣的事實似乎無法支撐領導的觀點。
2. 尋找原因的能力實際工作中,找到問題,并將它明確之后,就要抽絲剝繭般找到問題背后的原因,而這一定要回歸業務場景本身,才能在理解業務的背景下,通過數據分析,找到原因所在。
【了解業務】——梳理業務流程
了解業務的過程,實際上就是在不斷溝通的過程,這也引申出數據分析師職業特性:溝通、溝通與溝通!對此暫不展開講。在與業務溝通的過程中,要盡可能多且深入地了解目前業務的動態,盡可以還原業務的全貌。
這個例子里,因為是在單品價格高的行業里,客戶購買產品后,因為產品價值高,所以一般都會存在護理需求,所以售后政策是在質保期內可以免費護理1次。
而業務也正是找到了這個切入點,針對已享受過護理次數的客戶,贈送免費的護理次數,以吸引他們到店來護理,而有了面對顧客的機會,自然也就有進一步銷售的可能。所以現場還會準備新品、活動宣傳等材料,處處精心營造成沖動消費的心理暗示。
【建立公式】——數據思維+業務流程
從業務流程中抽象出來:圈選目標客戶 → 通過護理吸引到店 → 營銷促銷 → 消費。
應用數據思維,進一步抽象成公式:老客重購金額 = 目標老客數 * 到店率 * 轉化率 * 客單價。
抑或用“人貨場”業務思維進行討論。
【理解業務】——搭建業務模型
基于公式,將流程建成立體的網狀結構,形成針對某個具體場景的業務模型。
【數據分析】—— 找到問題所在
通過在業務模型的框架內進行分析比較,我們才能看到某一個業務的全貌,才能發現背后是哪個模塊引出的問題。例如案例中,數據分析發現觸達客戶中,回柜率很低,問題可能在“老客”、“回柜”。
從歷史數據上看,此次采取的吸引到店玩法都是很成熟的策略,有很好的成功案例,數據表現良好,所以問題可能就是出在“客戶池”——運營維護部分,如沒有分群營銷。
3. 落地建議的能力【KPI相關】
分析項目是否可推動實現很大程度上取決于是否切合業務KPI。
根據多次和業務合作的經驗,尤其是對數字化決策不那麼敏感的公司, 甚至是由上至下的數據分析項目,分析結論很容易淪為一紙報告,而不了了之。很大程度上,是因為分析建議與實際業務動態偏離,即并不是業務的考核重點。在資源有限的情況下,也就難以執行。
所以,在最后給落地建議的階段,還是要回歸業務,了解業務的運營計劃,在現有的項目下,去試驗、實踐分析建議。
【符合實際操作】
不要嘗試去改變業務習慣。
問題在于用戶分群的問題,應用RFM模型進行精細化運營。一般來說,RFM模型分為八大人群,根據不同人群特點進行精細化管理,例如案例中,針對重要價值人群進行新品發布會邀請等差異化體驗,針對重要喚回人群進行節日關懷策略等。
但是如果了解實際業務操作的話,對于零售企業來說,并不會按八個人群去實踐,而是選其中的幾個重要人群,或者進行二次組合,以減少客服部門的觸達量。
知道這樣的背景后,就不要再去建議說分成八個人群給不同的建議,而是有優先級地劃出人群優先級,或者配合給人群合并運營建議等。這樣考慮到實際操作情況,業務自然也能感受。
【分析深度】
另一個落地建議,就是一定要具體可行。
在已知數據分析結論不容易落地的情況下,將結論建議盡可能地具體,給出“令人驚喜的”發現,才能更容易去推動項目。
但是不要忘記數據分析與業務執行之間的邊界,在大部分情況下不要嘗試去給具體的落地計劃,否則很可能會引起反效果。
如何做到具體可行?則需要縱向的分析深度:
分析模型的深度理解:
如圖RFM分析案例中,但在我看來,RFM模型的’KPI’在于良性人群的占比提升。所以將門店RFM人群結構及關鍵數據進行同期對比,可以達到進一步分析的目的。
杜邦分析與指標拆解:
這部分內容可以參考:數據分析的結果該如何落地? | 人人都是產品經理 (woshipm.com)
本文由 @餅干哥哥 原創發布于人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議
本文來自:解夢佬,原地址:https://www.jiemenglao.com/suanming/350883.html