周二上午,德匯咨詢的開放式辦公區(qū)。陽(yáng)光透過巨大的落地窗,在地板上投出明亮的幾何光影。陳默坐在自己的工位上,面前是兩臺(tái)顯示器。左邊屏幕上運(yùn)行著python腳本,正在對(duì)零售品牌項(xiàng)目的用戶分層數(shù)據(jù)進(jìn)行聚類分析;右邊屏幕是打開的ppt,他正在將初步的分析結(jié)果可視化,準(zhǔn)備下午項(xiàng)目小組討論的材料。
他的手指在鍵盤上穩(wěn)定地敲擊,偶爾停下來,查看一下腳本輸出的中間結(jié)果,眉頭微蹙,似乎在思考某個(gè)異常值是否需要處理。旁邊的同事小王探過頭來:“陳默,你那個(gè)聚類用的是什么算法?k-means還是dbscan?我這塊兒的數(shù)據(jù)分布有點(diǎn)散。”
“我用的譜聚類(spectralclustering)試了一下,結(jié)合了行為序列的相似性,效果還可以。你數(shù)據(jù)維度高嗎?如果噪聲多,dbscan可能更魯棒,但參數(shù)要調(diào)好。”陳默轉(zhuǎn)過椅子,語(yǔ)氣平和地解答,隨手在草稿紙上畫了個(gè)簡(jiǎn)單的示意圖,“關(guān)鍵是要先做好特征工程,把那些無關(guān)的、方差異常的維度處理掉。”
“有道理,我再看看。謝啦!”小王點(diǎn)點(diǎn)頭,轉(zhuǎn)回自己的座位。
陳默重新看向屏幕。他的解答專業(yè)、清晰,符合一個(gè)數(shù)據(jù)分析助理的定位。沒有人知道,就在昨晚,他剛剛審閱了一份關(guān)于離岸投資架構(gòu)下稅務(wù)透明度的法律備忘錄,并給“默然資本”下達(dá)了第一筆涉及海外etf的小額投資指令。也沒有人知道,他的大腦在處理零售用戶分群的同時(shí),還有一個(gè)并行線程,正在評(píng)估李成提交的關(guān)于半導(dǎo)體設(shè)備供應(yīng)鏈風(fēng)險(xiǎn)的最新周報(bào)摘要。
這就是他現(xiàn)在的日常。多重身份,多層偽裝,精密地嵌套、運(yùn)行,互不干擾,如同一個(gè)高度模塊化的操作系統(tǒng)。