
“对于跨专业的同学而言,这其实是一个难得的机会——即便从零起步,也能学到实实在在的知识与技能。”栗同学说道。
对于商科学生而言,数据处理与分析能力在当下早已不是“可选项”,而是在数字化浪潮中站稳脚跟的必备技能,更是就业市场明确的核心需求。
本期专访的主人公栗同学,便进行了一次大胆尝试:她跟随南加州大学C.A.教授参与“商业分析与数据科学”课题研究,从Python零基础起步,到独立负责树模型搭建,仅用三四个月就完成了银行客户流失预测的完整研究,最终也找到了自己的差异化优势。今天,就让我们一同走进她的成长故事。

栗同学
就读院校:
北京理工大学
录取院校:
康奈尔大学、约翰霍普金斯大学、伦敦大学学院、南加州大学、加州大学圣地亚哥分校
课题教授:
南加州大学C.A.教授
参与课题:
商业分析与数据科学:数字化转型时代的智能洞察、优化与决策
01
一次跨专业的“好奇心实验”
“我本科主修会计学,但一直对数据分析在商业决策中的应用很感兴趣,尤其是金融领域的相关场景。”栗同学说道。

栗同学生活照
说起加入拔尖计划数据科学课题的原因,栗同学的答案很简单——源于好奇。这个项目是学院老师推荐的,她最初的想法很朴素:就是想系统学习统计与建模知识,看看数据科学能和自己的专业碰撞出怎样的火花。而真正打动她的,是项目的“交叉属性”。

“它并非单纯讲解机器学习算法,而是聚焦商业业务场景。比如我们最终完成的银行客户流失预测项目,就是机器学习在商业领域的经典应用之一。这种‘技术+业务’的交叉属性,正是最吸引我的地方。”
对于这个课题,栗同学起初并非毫无顾虑。她的英语基础尚可,再加上线上课堂配备了实时翻译功能,听不懂的地方还能借助文字辅助理解。真正让她心里没底的,其实是代码相关的学习。
不过事实证明,这份担心有些多余。教授从最基础的内容讲起,RA的答疑环节也极具针对性,正式开始学习后,栗同学发现“掌握这些工具其实并不难”。

C.A.
南加州大学商学院教授
“有些学生第一节课就来问我:‘教授,我完全不懂编程怎么办?’我总会告诉他们:‘别担心,你们一定能学会。我会从最基础的内容教起,甚至会从如何把软件下载到电脑上开始讲起’。”
与此同时,这位南加州大学马歇尔商学院的数据科学教授本身就是“跨界”领域的先锋——他不仅拥有能源与环境工程、生物医学工程双博士学位,还持有MBA学位,研究方向横跨工程、医学与商业三大领域。

C.A.教授课堂
C.A.教授亦言:“我始终坚信,唯有在尝试过不同的事物后,你才能真正明晰自己的内心所向。”于栗同学而言,参与这一课题恰似一场“好奇心的实验”——她既不确定自己能否胜任,也未知这是否会对未来有所助益,但她仍想放手一试。
02
从零基础到独立跑通十一种模型
听课与真正动手开展课题研究,完全是两种截然不同的体验。
在线上课程阶段,教授从机器学习的基础概念讲起,系统梳理了分类与回归、决策树、随机森林等基础模型,以及XGBoost、LightGBM、CatBoost等集成学习算法,为后续研究搭建了完整的知识框架。栗同学提到:“我们的研究方向是用十一种模型预测银行客户流失率,课程中涉及的模型,最终都在论文中得到了应用。”
栗同学所在的小组研究聚焦两个核心问题:
• 第一,与逻辑回归、决策树等传统模型相比,LightGBM、XGBoost这类集成模型在预测客户流失时,召回率和准确率究竟能高出多少?
• 第二,不同的数据划分比例(7:3、8:2、9:1)以及过采样、欠采样等数据处理方法,会对模型表现产生怎样的影响?
这是商业分析领域的经典问题:
银行客户流失率通常仅为20%左右,数据存在严重不平衡现象,导致模型很容易“偷懒”,只预测占比更高的多数类。而SMOTE过采样正是解决这类问题的经典方法。
栗同学在小组中主要负责树模型相关工作。作为会计专业的学生,从数据清洗到参数调优,她几乎每一步都在进行全新的尝试。

“我们当时犹豫了很久要不要采用SMOTE过采样方法,而且在实际写代码实现的过程中也遇到了不少问题。就在我们卡壳的时候,教授给了很多建议,助教也在代码方面提供了一些支持。”
这时,教授与助教的“分层指导”便彰显出价值:教授负责把握大方向,建议他们采用SMOTE方法解决数据不平衡问题;助教则专注于解决具体的代码细节,还会协助检查实验结果是否合理,并为论文写作提供建议。
C.A.教授的教学风格也让她印象深刻。“他不是那种严肃刻板的教授,课堂氛围总是很活跃。虽然理论知识讲得很深入,但到了课题实践阶段,会针对每个小组的具体情况补充实操内容,做到理论与应用兼顾。”教授还会为研究的每个阶段设定详细的截止时间,从文献综述、模型构建到论文撰写,一步步引导大家推进项目。

“小组氛围特别好,大家配合度高且都很努力。我记得有位男同学为了调试代码熬了两个通宵。后来他在群里还开玩笑说,代码运行时就定个几分钟的闹钟抓紧补觉,醒了就看看代码跑完没,有没有报错,改完继续跑再接着睡。”
这大概就是真实科研的模样——没有电影里那般酷炫,更多的是等待、调试、再等待的循环往复。但当十一种模型的结果全部成功跑出,当看到集成模型在召回率上确实显著优于传统模型时,那种实打实的成就感,是任何事物都无法替代的。
03
当会计思维遇上数据科学
申请季,栗同学收获了康奈尔大学、杜克大学、约翰霍普金斯大学、南加州大学、伦敦大学学院(UCL)等多所顶尖院校的Offer。经过慎重考虑,她最终选择前往康奈尔大学攻读管理学硕士(会计方向)学位。
“这段科研经历对我的申请帮助很大。我本科是会计专业,实习经历和商业分析、信息管理并不相关,但这段科研成果成了我的亮点。面试时,招生官专门问到了这段经历,还详细询问了我在课题中具体负责的工作。”

“但如果仅仅将这段经历的价值归结为帮我拿到了offer,那就太小看它的意义,也低估了我在这段经历中的投入。”
栗同学表示,这段经历带给她的最大收获可以分为两个层面。
一是知识与技能的提升——从零开始系统学习机器学习,掌握11种模型的应用方法,熟练掌握数据清洗、特征工程与模型调参等实打实的硬技能。与她此前参与的经济类实证科研不同,这个项目采用“课程学习+研究实践”的完整流程,对跨专业背景的参与者尤为友好。
二是团队协作能力的锻炼——“我之前从未与他人合作开展过科研课题并最终取得学术成果。这段跨专业线上协作的经历,对我未来的个人发展也大有益处。”

栗同学的康奈尔大学录取Offer
会计学训练出的思维,是精确、严谨且注重凭证与逻辑的;而机器学习的思维,则是概率性、迭代式且聚焦优化与权衡的。当这两种思维碰撞交融,栗同学看待问题便多了一个独特维度——当他人只关注财务报表上的数字时,她会进一步思考:这些数据能否用于预测?能否通过模型挖掘出更底层的规律?
这段机器学习的科研经历,也成了她区别于其他会计专业学生的独特标签。在数据驱动决策的时代,既懂会计又懂数据科学的人,永远能找到属于自己的立足之地。
采访的最后,我们问她对仍在犹豫的学弟学妹有什么建议。她思索片刻后说:“对跨专业的同学而言,这其实是个很好的机会。通过这个项目,你能从零开始掌握不少知识与技能。从申请的角度来看,也可以结合自身发展方向,选择更贴合的项目。”
很实在的回答,恰如她本人——细心、踏实、逻辑性强,从不说漂亮话,却字字掷地有声。
栗同学的故事,正是一段关于“尝试”的故事。
从会计跨界机器学习,她既没有因跨专业的挑战而退缩,也没有将这段经历仅仅当作申请的敲门砖。她始终沉下心学习、踏实地实践,最终在数据与模型交织的世界里,找到了属于自己的学科交叉点。
名校offer固然是令人欣喜的成果,但比这份offer更珍贵的,是那份“我能行”的坚定底气,以及一双能洞察更多可能性的眼睛。而这,正是科研赠予每一位不懈前行者的最珍贵礼物。
文字|基于栗同学采访整理
关注「拔尖计划」视频号
课题预告、教授访谈、学生采访


