[TWDS 線上版聚] 一個普通資料科學家的學習歷程與PayPal職涯體驗
[2021/08/06] Taiwan Data Science Meetup — 沈辰禧
講者介紹
沈辰禧,目前在上海的PayPal擔任資料科學家,提供風控領域的數據產品與服務;同時也在Hahow上面開了三門商業分析及產品數據分析相關的課程。辰禧畢業於企管系,在研究所時因其對資料分析濃烈的興趣開始大量自學關於資料分析的一切,目前於 PayPal 擔任資料科學家。

學歷
國立台灣大學商業研究所、 國立政治大學企業管理系
工作經歷
PayPal 數據科學家、 Synergies Intelligence System 數據科學家
分享主題:一個普通資料科學家的學習歷程與職涯體驗
從個人的學習歷程和職涯發展出發,可以先開宗明義地講,我的背景並不特別,也沒有做過很縝密的規劃,可能比較接近大多數人的狀態。這個分享分為兩個部分:
- 回溯性地說明身為一個沒有資工、統計相關背景的學生,做了哪些選擇,最後心態良好地進入資料科學領域工作
- 簡單介紹PayPal上海site的工作體驗,包含文化、支付產業以及風控體系,支付、網路產品和我們的生活息息相關,但我相信大家對於整個產業以及網路產品的風險控制應該沒有太多認識。
- 期待透過這個分享讓大家做好資料科學工作的預期管理,以及對於支付和風控領域有更多了解。
資料科學&資料分析學習歷程
畢業前開始上線上各種資料科學線上課程,畢業後開始程式自己教學。碩士一上在政大管理統計資料分析學習R語言,碩士下資料視覺化統計計算。其中有在鼎泰豐擔任實習了解銷售預測跟庫存策略,碩二上參加資料科學與計算台積電資學院資料競賽,碩士下開始寫自然語言處理的論文,並在Synergies Intelligence System 致力於開發自然語言智慧企業決策平台,透過洞察數據、預測行為與流程自動化,協助企業解決日常運營、產銷供應鏈、產品生產製造流程等問題,並藉由增強分析與數據賦能,實現智能化管理,是該領域上全球領先的公司擔任實習生。累積了一定的數據科學實力,畢業後服役嘗試Side Project和實習公司合作,拿到Synergies Data Scientist 正職的聘書,主要研究中文自然語言問答的BI 系統,做的是製造業產能異常檢測跟製造業物料採購分群,之後轉到PayPal 做風險管理,協助企業利用資料科學解決複雜的商業問題,也喜歡分享知識給對資料科學有興趣的朋友。
在職場的幾個選擇
選擇一: 善用槓桿
在還是學生( Junior)時可以善用槓桿不用怕失敗丟臉,儘量保持專業即可,還沒有很會分析的時候做分析,還沒有學會機器學習實作機器學習,程式寫不好時就開始練習多項技能。
選擇二:跳槽
跳槽不是跳更好,是跳更適合的從新創跳到大公司的幾點考量,以analytics 方向為目標
Package: 薪資差距值得放棄新創的槓桿
Data:更完整的基礎建設,更豐富的題目
Skill: 更專注在分析以及分析相關的工程
Career: 更完整的mentor制度,較清晰的成長路徑
Culture:公司的文化及名譽
選擇三:知識共享
把別人教會才算是真的學會,也能將自己學習和知識變現
在資料分析學習歷程期間辰禧在Hahow上面開了三門商業分析及產品數據分析相關的課程,繼《R語言和商業分析-洞悉商業世界中的資料科學》及 《R語言和文字探勘 — 洞悉巨量文字的商業價值》兩門課後,大維與辰禧又攜手帶來兼具策略性思考的《產品數據分析 — 打造網路產品的決策引擎》至今每一堂課都有千多位學生。教材內容相當豐富,不僅有個案可以練習,對於每個演算法講解的很清楚,也讓學生更了解資料科學以及R語言的應用。
淺談PayPal的工作經驗與風險體系
支付平台最重要的是什麼?
PayPal簡介 PayPal(在中國大陸的品牌為貝寶),是一個總部在美國加利福尼亞州聖荷西市的網際網路服務商,PayPal是eBay旗下的一家公司,致力於讓個人或企業通過電子郵件,安全、簡單、便捷地實現線上付款和收款。 PayPal賬戶是PayPal公司推出的最安全的網路電子賬戶,使用它可有效降低網路欺詐的發生。買家透過 PayPal 支付購物款項,包括在 eBay、網路商店或透過手機應用程式進行的購物交易。扣除適用的交易手續費後,款項存入賣家的 PayPal 帳戶。PayPal將會通知買賣雙方款項處理情況和交易詳細資料。PayPal拉近買賣雙方的距離,為你省去不必要的交易步驟、降低成本與麻煩。買家與賣家之間除了快遞專員之外,不需要再有中間人介入。在演講中講者淺談PayPal的經驗跟風險管理系統,也就是了解系統會在哪受到攻擊跟系統怎麼應付。這些風險又分為單獨帳戶的異常、帳戶跟帳戶間的異常、行爲上的異常,因應不同領域產生的風險延伸出風控體系。包含使用者行為(轉帳、加卡、註冊、登陸、提款、存錢)到行為矩陣(次數有關、金錢有關、帳號程度、特別領矩陣)衍生的異常偵測決策分析,影響最後交易失敗或是成功。
Solution: Model-based or Rule-based?
「Model-Based」通常被翻譯成「基於模型」通常有風險管理的模型去分析銀行所面臨的風險,特性是需要花大量的時間而且高人口覆蓋率更通用。「規則主導」模式(Rule-Based Model),或稱專家模式。這種規則容易建立、不需要大量資料,反應更快且高損失保險而且更精確。
換到PayPal 工作的雖然比較沒有彈性然後工作步調比較快,但是有很好的薪水跟福利,工作跟生活平衡可以更好。希望你聽完這個分享,能夠至少記住這些。
做好選擇與保持專注,遠比努力重要
目標決定你的發展方向,發展方向決定你現在該做什麼
往更商業的方向發展:選好domain 練好SQL和Excel
往更技術的方向發展:做好心理建設
找資料分析/資料科學工作的注意事項
薪資- 說明你和老闆分別多重視這份工作
使用大小domain的領域交集,了解公司/團隊位在data science life cycle 的哪個階段:
大domain 小 domain與分析方向的組合
大domain: 零售 供應鏈 電商 金融 旅遊 運輸
小domain: 行銷 成長 運營 風控
分析方向:分析(Analytics) 商業智慧(BI)因果推論(Inference)機器學習(ML)
