《大数据计算基础:基于Python、PostgreSQL和AI辅助编程》
线下课程公告
(授课时间:2026年5月1日-5日)
按:
我们将在明天晚上(2026年4月21日)20点安排一次腾讯会议(会议号:124-887-485,2026年4月21日20:00开始),向大家介绍本次课程的具体信息。
同时,我们也创建了一个微信群,感兴趣的道友可入群咨询课程信息:

目录
1. 课程目标与内容
2. 主讲人及助教团队
3. 教学辅助系统
4. 授课时间、地点
5. 考核办法、奖励及帮扶条款
6. 学费标准及支付方式
7. 报名时间与方式
8. 课前准备建议

1. 课程目标与内容
1.1 课程目标
1.1.1 课程背景:浪潮之下,个体如沙
分钟乃至三秒级股票交易数据、千万笔贷款数据、全量工商注册数据、过亿份裁判文书数据、数千万职位或简历数据、千万条专利及交叉引用数据,这是当前金融、经济及管理方向的实践及研究中需面对和分析的数据。
传统的金融学、经济学、管理学培养方案中并不包含对这类“500G到10T规模大数据”分析能力的培养,近年来认识到培养方案与现实需求差异的各个高校逐渐开设了很多冠之以“大数据”三字的专业,甚至创建了诸多冠之以“大数据”三字的院系。
然而,究竟如何才能在有限的培养时间内,让学生既学会专业知识,又掌握跟“大数据”有关的整个知识链,并让二者相互契合、共同汇聚成“学以致用、学以致研”的真实能力?
对该问题答案加以追寻的需求,并不因以“大数据”三字给专业或院系冠名而消失不见。尤其是在基于神经网络的大语言模型应用日趋广泛且高速迭代之际,对该问题答案的追寻将显得尤为迫切。
由技术推动的浪潮浩浩荡荡一往无前,院系、企业、个人,每一个个体都是浪潮裹挟下向前涌动的沙粒,无法选择进退,只能选择应对姿态,以求在浪潮淘洗之后还能被剩下。
1.1.2 整体目标
浪潮之下,个体如沙,无法选择进退,却能选择能否被“剩下”。
本课程的整体目标,就是助你“剩下”并“融入浪潮”:我们提供一套精简但足够的课程方案,让你能以尽可能低的时间和财务成本高效、轻松地掌握大数据计算基础,并为你提供进一步学习和探索的空间和融入同道群体的机会。
我们的目标不仅仅是提供课程,而是通过课程助你真正掌握进行大数据计算的基础能力。
1.1.3 具体目标
具体而言,我们将通过以下几点,来实现整体目标:
(1)提供相互衔接的课程内容,让学员在尽可能短的时间内掌握能调用单台计算机乃至多台计算机集群的全部CPU资源对10T以内的大数据进行并行计算的能力;
(2)通过自行创建和开发的“课程代码展示站点”和“自动测试系统”,以技术手段为学习和测试提供便利,提高学员的学习效率;
(3)将授课地点设在周边景点众多的江西婺源,让学习的艰辛在美景中缓解。
(4)授课现场每天进行两次测评且配有2名助教答疑,授课结束后提供持续3个月的后续测评和答疑;
(5)提供奖励和帮扶条款:为测评结果优异的学员提供第4届“面向实证研究的大数据计算”深度研习班的学习名额(向本轮学员提供20个名额),为学习缓慢的学员提供免费参与本课程下一轮授课的机会(预计在十一期间举行);
(6)将学费设定为远低于同类课程的水平,同时与合作酒店协定了一个极具竞争力的食宿价格,在保证课程和食宿品质的同时,尽可能降低学习的总财务成本(交通+ 学费+ 食宿),降低学员的经济负担。
1.2 课程内容
课程内容包括三个模块:《大数据计算基础:基于Python和PostgreSQL》、《编程理念》和《AI辅助编程》。
通过本课程,我们希望为学员提供以下知识和技能:
(1)大数据计算基础:基于Python和PostgreSQL,调用单台计算机乃至多台计算机集群的全部CPU资源,对10T以内规模的数据进行并行大数据计算;
(2)编程理念:理解由交互调用的多个模块构成的大规模代码所应遵循的原则规范,以及大规模代码对代码编写者的人格特质需求,并将该理解内化为自身信念;
(3)AI辅助编程:部署AI辅助编程环境,通过AI大模型辅助编程写大数据分析代码,以及应对AI辅助编程的诸多问题和陷阱。
1.3 授课活动安排
1.3.1 现场活动安排
上午
08:30 - 09:15 第1节课
09:25 - 10:10 第2节课
10:30 - 11:15 第3节课
11:25 - 12:10 第4 节课
下午
14:30 - 15:15 第5节课
15:25 - 16:10 第6节课
16:30 - 17:15 第7节课
17:25 - 18:10 第8节课
晚上
19:30 - 20:15 第 9节课
20:25 - 21:10 第10节课
授课由主讲人执行,助教在现场提供答疑。
其中:5月1日-4日,白天、晚上均上课;
5月5日,仅白天上课。
1.3.2 后续活动安排
线下课结束后,提供持续3个月(截止到2026年7月31日)的后续活动,包括答疑和测评。
(1)答疑
答疑时间安排:
2026年5月10日-2026年7月31日,每周通过腾讯会议在线答疑两次,每次1小时。
其中,主讲人每周答疑1次,助教每周答疑1次。
答疑时发现的典型问题,会每周汇总更新到学员专用的“课程代码展示站点”。
(2)测评
在后续活动期间(2026年5月10日-2026年7月31日),每两周1次,通过“自动测试系统”对学员进行测评。

2. 主讲人及助教团队
2.1 主讲人
汪建雄,北京第二外国语学院经济学院金融系副教授,中央财经大学中国经济与管理研究院(CEMA)金融学博士。研究方向为资产定价、经济史、国家演化、应用计量等,目前正与多位合作者基于裁判文书、工商数据、股票论坛数据等500G以上的超大规模数据集展开分析与合作研究。
论文发表于《China Economic Review》、《Technological Forecasting and Social Change》、《世界经济》、《投资研究》等期刊,主持完成国家自科基金项目、教育部人文社科项目各一项,译有《金融经济学原理》、《已经发生的未来》、《谁绑架了上市公司》、《蜘蛛战略》等译著。
正在撰写关于大数据计算的系列图书,其中的第一本书名暂定为《大数据计算基础:基于Docker、Python、PostgreSQL与MinIO》,预计于2026年由机械工业出版社出版,部分配套课程视频已免费上传至B站(账号:山人一枚也)。
曾于2023年8月、2024年7月、2025年8月举办第1、2、3届“面向实证研究的大数据计算”深度研习班。曾于2021年7月举行的第4届香樟青苗计划及2022年8月举行的第2届香樟西部计划中就“实证研究中的大数据处理与分析”做讲座。曾于2021、2022、2023年在中央财经大学中国经济与管理研究院(CEMA)讲授暑假小学期课程《Python金融大数据分析》。
也曾于2021年1月、2022年1月、2023年3月举行的第10、11、12届PostgreSQL中国技术大会作分享,并于2022年1月、2022年10月举行第14、15届中国系统架构师大会上作分享。
此外,也正与团队成员一起进行多个项目的开发,具体包括:
(1)Bright,一个用于加速大型Python项目开发的代码库,该代码库预计将实现Python代码的自动化分析、调整、测试等功能,主要涉及代码风格、交互调用、执行性能、逻辑错误探测等主题,目前已实现大部分功能,包括类似于Black包但更为完备的代码格式自动化调整;
(2)代码文档自动生成工具,一个秉承“代码即文档”的理念,基于Bright将项目代码中的注释转为以网页形式呈现的项目文档的库,功能类似于Sphinx,但可与Confluence、Wiki.js等知识库搭配使用;
(3)自动在线测试系统,该系统针对“大数据计算”系列课程,能实现测试题的动态抽选、在线测试、自动批改、统计信息生成与自动输出等功能,后期还会添加学员知识水平和认知技能画像、后续学习方案规划与个性化学习材料生成等功能。
2.2 助教团队
赵世杰,北京第二外国语学院金融学本科生(2026年9月起读研),第二届研习班学员,第三届研习班唯一助教,第一轮基础班课程助教,自动测试系统开发人员;
贾友,上海交通大学管理学博士,第一届研习班学员,上海外国语大学贤达经济人文学院讲师,第一轮基础班课程助教,自动测试系统开发人员。

3. 教学辅助系统
3.1 课程代码展示站点
基于Wiki.js,我们创建了供学员使用的课程代码展示站点。该站点以网页形式展示课程中用到的py、ipynb、conf等格式的代码或配置文件,每个文件对应一个页面,文件隶属关系对应于页面隶属关系,并且可在相应文件修改后自动更新。
登录该站点后,学员可在各个代码或配置文件(页面)间随意切换,也可在同一个文件(页面)内部快速定位所需查看的代码,并且以精准的格式复制所需代码,远比打开文件直接操作更方便。
3.2 自动测试系统
我们还开发了一个自动测试系统,实现了本次课程内容相关测试的试卷生成、在线测试、自动批改、测试结果输出、统计信息生成等功能。其中,除了“在线测试”环节需测试人员参与,其它环节均由系统自动实时完成。
在技术上,该系统以Python、JavaScript、TypeScript、SQL作为编程语言,以PostgreSQL作为后端数据库,以Confluence、Wiki.js、Vue.js3、RestAPI、GraphQL、FastAPI作为前端工具。
该系统在开发时采用Gitlab进行代码仓库管理,并秉承“代码即文档”的理念基于自行开发工具包Bright实现了项目文档的自动生成和实时更新。
借助该系统,我们可以随时了解学员的学习进度,并进而调整教学方案,或根据测试排名确定奖励和帮扶对象。而学员也可通过自行发起的测试了解自己的掌握情况,并进而明确后续学习方向。

4. 授课时间、地点
4.1 授课时间
报到时间:2026年4月30日全天(早上8:00-晚上23:00)
授课时间:2026年5月1日-5日
4.2 授课地点
报到与授课地点:江西省婺源县天舍庄园
交通提示:坐高铁到婺源站,而后打滴滴即可到达天舍庄园,时长1小时,车费在150元左右。
4.3 食宿安排
食宿地点:婺源天舍庄园
已与酒店谈妥协议价(两人一间房,含食宿,160元/人每天,可开发票)。
学员福利:如果学员想早点到,或结课后再玩几天,在天舍庄园停留期间,均可享受协议价。

5. 考核办法、奖励及帮扶条款
5.1 考核办法
奖励条款对应的考核项目包括:
(1)学员的现场到课情况;
(2)学员对课程内容的掌握程度;
(3)学员对其他学员的互助力度。
上述项目的考核结果全部由“自动测试系统”生成、记录、统计、聚合和排序,具体考核规则和系统使用方法于授课现场公布。
5.2 奖励条款
为激励学员认真学习,特设定奖励条款,为考核优异学员提供总计20个“第4届深度研习班”学员资格。
关于第4届“面向实证研究的大数据计算”深度研习班,具体参见:
前3届“面向实证研究的大数据计算”深度研习班回顾暨第4届研习班规划
注意:通过奖励条款获得的研习班学员资格不可转让,如前20名学员中有人放弃,则按排名顺序依次向前递补。
5.3 帮扶条款
注意:通过帮扶条款获得的学习机会不可转让。

6. 学费标准及支付方式
6.1 学费标准
本次共开设5天课程,学费为2500元/人。
如果报名时间在4月28日之后(含当天),需加收200元/人的资料加急准备费(因为需加急准备课程资料,成本上升)。
6.2 付款方式及课程通知、发票事宜
付款方式:
(1)报名后,经联系,向助教(赵老师)支付200元订金;
(2)现场报到时(2026年4月30日),退还订金,并交纳学费。
课程通知:我们将为学员提供由合作公司出具的纸质课程通知。
发票事宜:学员交纳的学费将由合作公司出具培训费发票(普票)。

7. 报名时间与方式
7.1 报名时间
2026年4月30日晚上20:00之前。
7.2 报名方式
(1)发邮件至邮箱BigDataCourse@126.com报名(请注意邮箱中字母的大小写,别打错了,不然邮件白发了),也可直接在学员群中加群主(助教赵世杰老师)微信报名。
(2)如通过邮件报名,报名邮件的标题设为“大数据计算基础线下班报名+姓名”,同时请在邮件中提供你的微信号和手机号。
(3)收到邮件后,助教(赵老师)会通过微信或手机联系你。
7.3 特别注意事项
(1)授课场所空间有限,最多接受30名学员,如报名人数提前到达上限,则以报名邮件发送时间的先后确定是否可以参与课程;
(2)对因报名人数已满而未能参与课程的报名人员,会第一时间邮件告知。

8. 课前准备建议
良好的准备,不仅能提高学习的效率,也能让你在竞争奖励待遇时占尽先机。故而,建议学员参加上课前做如下准备:
(1)准备一台配置较高的电脑:8G以上内存,4核以上CPU,500G以上的SSD固态磁盘(最好是16G以上内存,8核以上的CPU);
***********「全 文 完」***********

往 期 内 容
(点击标题,可跳转至相应内容)
主题一: 课程
“大数据计算”研习班
第四届:
公 告: 规划公告|
第三届:
研习班动态: 开营首日|第二天|第三天|第四天|第五天|第六天
学员 心得 :谷世广|罗熙茗|邓万里|田相辉 |单浩然 |郑康
第二届:
举办地实景:天舍山庄
研习班总结:第二届“面向实证研究的大数据计算”深度研习班总结
学员 心得 :高明|张博夫|魏龙| 周柏旭|梅海龙|吴杰|于海静|李力驰|赵世杰
第一届:
《并行大数据处理:基于Python、PostgreSQL及其他》:
1. 课程信息:
系列课程:《基于Python和PostgreSQL的并行大数据处理》
预备课程:《经济学和金融学实证研究中的大数据处理:基于Python和PostgreSQL》
2. 前期讲座:
2.1 《经济学及金融学实证研究中的大数据处理:基于Python和PostgreSQL》
2.1.1 香樟青苗版(录于2021年7月,约3小时):第1部分|第2部分|第3部分
2.1.2 架构师大会版(录于2022年1月,约2小时):讲座回放
2.2 《“大规模数据分析”项目开发中的编程理念——以Python为例》
2.3 《经济学及金融学中的大数据处理与分析:基于Python和PostgreSQL》(2022年8月“香樟西部计划”讲座)
3.免费课程视频:
3.1 《Python及其在数据分析中的应用》: 系列课程及本门课程安排|Python编程环境介绍:Anaconda、Jupyter Notebook与Spyder|Python语法结构概述|Python中的代码、注释、保留字和对象层级
3.2《PostgreSQL及其Python应用》: PostgreSQL数据库的现状及优势|PostgreSQL的基本原理和整体架构
3.3《并行大数据处理:基于Python和PG》: 基于Python和PostgreSQL的分布式并行计算原理
4. 参考资料:《并行大数据处理:基于Python与PostgreSQL》在线课程参考资料
长按下图,识别二维码,关注本号

声明: 1.本号所发图片,除非特别说明,皆作者亲拍,保留一切权利; 2.本号所发文章,保留一切权利,未经允许,不得转载。
择青山,筑别院,煮香茗,阅经卷,倚林泉,度流年,斯吾愿......
