
(Center for Interdisciplinary Scholarship)
“对于跨专业的同学来说,这其实是一个很好的机会——从零开始,也能学到真东西。”
——栗同学
对于一名商科生而言,处理和分析数据的能力在当下看来,并不是一个可选项,而是在这数字化洪流中站稳脚跟所必备的能力,也是就业市场早已明确的需求。
本期专访的主人公栗同学,就做了一番大胆的尝试,她跟着南加州大学C.A.教授做“商业分析与数据科学”课题,从Python零基础到独立负责树模型搭建,用三四个月完成了银行客户流失预测的完整研究,也最终找到了自己的差异化优势。今天,就让我们一起走进她的成长故事。

栗同学
就读院校:
北京理工大学
录取院校:
康奈尔大学、约翰霍普金斯大学、
伦敦大学学院、南加州大学、加州大学圣地亚哥分校
指导教授:
南加州大学C.A.教授
参与课题:
商业分析与数据科学:数字化转型时代的智能洞察、优化与决策
01
一次跨专业的“好奇心实验”
“我本身是学会计的,但一直对数据分析在商业决策中的应用挺感兴趣,尤其是金融行业的场景。”

栗同学生活照
说起为什么会加入CIS的数据科学课题,栗同学的理由很简单——好奇。这个项目是学院老师推荐的,她最初的想法很朴素:就是想系统学一些统计和建模的知识,看看数据科学到底能和自己的专业擦出什么火花。真正打动她的,是项目的“交叉属性”。
“它不是纯讲机器学习算法的那种课,而是聚焦商业业务场景。比如我们最后做的银行客户流失预测,就是机器学习在商业里非常经典的一个应用。这种‘技术 + 业务’的交叉性,是最吸引我的。”
关于这个课题,栗同学有过担忧和顾虑。纯英文授课倒还好,她的英语基础不错,加上线上课堂配备的实时翻译功能,听不懂的地方可以看文字辅助理解。真正让她心里没底的,是代码。
不过事实证明,这份担心有些多余。教授从最基础的内容讲起,RA的答疑环节也很有针对性,正式进入学习后,栗同学觉得“掌握这些工具其实也没有很难”。

C.A.
南加州大学商学院教授
“有些学生第一节课就来问我,教授,我对编程一无所知。我告诉他,不用担心,你会学会的,我真的会从最基础的开始,比如下载软件到你的电脑上。“
与此同时这位南加州大学马歇尔商学院的数据科学教授,本身就是一个“跨界”的先锋——他拥有能源与环境工程博士、生物医学工程博士,还有MBA 学位,研究方向横跨工程、医学与商业。

C.A.教授课堂
C.A.教授还说,“我深刻地相信,只有在经历了各种事情后,你才能真正知道自己想做什么。你需要尝试。”对栗同学来说,加入这个课题就像是一次 “好奇心实验”—— 她不知道自己能不能做好,也不确定这会不会对未来有帮助,但她想试试。
02
零基础到跑通十一种模型
从听课到真正动手做课题研究,是两种完全不同的体验。
线上课程阶段,教授从零讲起——分类与回归、决策树、随机森林,再到XGBoost、LightGBM、CatBoost这些集成学习算法,把机器学习的基础框架系统地过了一遍。栗同学说,“我们选择的课题最后是用了十一种模型去预测银行客户的流失率,课上讲过的模型,在最后的论文中全覆盖到了。”
栗同学所在的小组研究聚焦两个核心问题:
第一,LightGBM、XGBoost这些集成模型,比起逻辑回归、决策树等传统模型,在预测客户流失上,召回率和准确率到底高多少?
第二,不同的数据划分比例(7:3、8:2、9:1),以及过采样、欠采样这些数据处理方法,会如何影响模型表现?
这是商业分析领域的经典问题:
银行客户流失率通常只有20%左右,数据严重不平衡,模型很容易“偷懒”只预测多数类。SMOTE过采样就是解决这类问题的经典方法。
栗同学在小组里主要负责树模型部分。对会计专业的她来说,从数据清洗到参数调优,几乎每一步都是新的尝试。

我们犹豫了一段时间要不要用SMOTE过采样这个方法,并且具体写代码实现的时候也遇到了不少问题。在我们卡壳的时候,教授提供了不少建议,然后助教在代码方面也给了一些支持。
这时候,教授和助教的“分层指导”就体现出价值了:教授把握大方向,建议他们用SMOTE来处理数据不平衡问题;助教则负责解决具体的代码细节,还会帮他们检查实验结果是否合理、给论文写作提建议。


栗同学生活照
C.A.教授的风格也让她印象深刻。“他不是那种很严肃的教授,课堂氛围挺chill的。理论讲得多,但到了课题阶段,会针对每个组的情况补充实操内容,理论和应用都能覆盖到。”教授还会给每个阶段定好详细的deadline,从文献综述到建模再到论文撰写,一步步推着大家往前走。

小组的氛围也特别好,大家都很配合很努力。我记得有个男同学,调代码熬了两个通宵。后来在群里他还开玩笑说,代码跑的时候就定个几分钟的闹钟见缝插觉,醒了看看跑没跑完、报没报错,改完继续跑继续睡。
这大概就是真实科研的样子——没有电影里那么酷炫,更多的是等待、调试、再等待的循环。但当十一种模型的结果全部跑出来,当看到集成模型确实在召回率上显著优于传统模型,那种实打实的成就感,是什么都换不来的。
03
当会计思维遇上数据科学
申请季,栗同学拿到了许多名校offer,包括康奈尔、杜克、JHU、南加大、UCL等学校。最终,她决定去康奈尔大学读管理学硕士(会计方向)。

图源康奈尔大学官网
“这段科研经历对申请很有帮助。因为我本身是会计专业,我的实习其实跟BA、信管都不相关,但我有这段跟科研有关的成果。面试的时候,招生官也确实问到了这段经历,会具体问我在这个课题中做了什么。”
“但如果只把这段经历的价值归结为就帮我拿到了 offer,那就太小看它了,也太小看我了。”
栗同学说,最大的收获其实有两个层面。
一是知识与技能——从零开始系统学习机器学习,掌握十一种模型的应用,学会数据清洗、特征工程、模型调参,这些都是实打实的硬技能。和她之前参加的经济类实证科研不同,这个项目有完整的 ”课程+研究“流程,对跨专业的人特别友好。
二是团队协作——”我之前没有跟其他人一起做过科研课题,并在最后拿到学术上的产出。这种跨专业、线上协作的经历,对今后个人发展也是有益的。“

栗同学的康奈尔大学录取Offer
会计学训练出来的思维,是精确的、严谨的、讲究凭证与逻辑的。而机器学习的思维,是概率的、迭代的、讲究优化与权衡的。当这两种思维碰撞在一起,栗同学在看问题时就多了一个维度——当别人只看到财务报表上的数字,她会想:这些数据能不能用来预测什么?能不能用模型挖掘出更深层的规律?
这段机器学习的科研经历,也成为她区别于其他会计学生的独特标签。在数据驱动决策的时代,懂会计又懂数据科学的人,永远有自己的位置。
采访最后,我们问她对还在犹豫的学弟学妹有什么建议。她想了想说:

对于跨专业的同学来说,这其实是一个很好的机会。通过这个项目,你可以从零开始学到很多知识和技能。申请的角度来说,还是要根据自己的背景,选一些更贴合的项目。
很实在的回答,就像她这个人一样——细心、踏实、逻辑性强,不怎么说漂亮话,但每一句都有分量。
栗同学的故事,就是一次关于“尝试”的故事。
从会计到机器学习,她没有因为跨专业退缩,也没有把这段经历仅仅当成申请的敲门砖。她认真地学,踏实地做,在数据与模型的世界里,找到属于自己的交叉点。
名校offer当然是好结果,但比offer更珍贵的,是那份 ”我能行“的底气,和一双能看见更多可能性的眼睛。而这,就是科研给一路向前的人最大的礼物。
文字|基于栗同学采访整理
延伸阅读:

CIS往期优秀录取专访
牛津本科 | 剑桥本科 | 宾大(6所录取) | 康奈尔 | CMU
普林斯顿(6所全奖直博) | MIT | 哈佛(7所录取)
关注CIS视频号
#
教授访谈、学员采访、学术讲座、留学干货
#



戳下方👇“阅读原文”收获一份颠覆性学术履历