《大数据计算基础:基于Python、PostgreSQL和AI辅助编程》
线下课程公告
按:抱歉,过了预告时间好几天才发公告。有兴趣的道友赶紧报名,不但价格优惠,还能提前准备,为赢取奖励抢得先机。
目录
1.课程目标与内容
2.主讲人及助教团队
3.教学辅助系统
4.授课时间、地点
5.考核办法及奖励条款
6.奋进者帮扶条款
7.学费标准、优惠条款及支付方式
8.报名时间与方式
9. 课前准备建议

1.课程目标与内容
1.1课程目标
1.1.1课程背景:浪潮之下,个体如沙
分钟乃至三秒级股票交易数据、千万笔贷款数据、全量工商注册数据、过亿份裁判文书数据、数千万职位或简历数据、千万条专利及交叉引用数据,这是当前金融、经济及管理方向的实践及研究中需面对和分析的数据。
传统的金融学、经济学、管理学培养方案中并不包含对这类“500G到10T规模大数据”分析能力的培养,近年来认识到培养方案与现实需求差异的各个高校逐渐开设了很多冠之以“大数据”三字的专业,甚至创建了诸多冠之以“大数据”三字的院系。
然而,究竟如何才能在有限的培养时间内,让学生既学会专业知识,又掌握跟“大数据”有关的整个知识链,并让二者相互契合、共同汇聚成“学以致用、学以致研”的真实能力?
对该问题答案加以追寻的需求,并不因以“大数据”三字给专业或院系冠名而消失不见。尤其是在基于神经网络的大语言模型应用日趋广泛且高速迭代之际,对该问题答案的追寻将显得尤为迫切。
由技术推动的浪潮浩浩荡荡一往无前,院系、企业、个人,每一个个体都是浪潮裹挟下向前涌动的沙粒,无法选择进退,只能选择应对姿态,以求在浪潮淘洗之后还能被剩下。
1.1.2整体目标
浪潮之下,个体如沙,无法选择进退,却能选择能否被“剩下”。
本课程的整体目标,就是助你“剩下”并“融入浪潮”:我们提供一套精简但足够的课程方案,让你能以尽可能低的时间和财务成本高效、轻松地掌握大数据计算基础,并为你提供进一步学习和探索的空间和融入同道群体的机会。
我们的目标不仅仅是提供课程,而是通过课程助你真正掌握进行大数据计算的基础能力。
1.1.3具体目标
具体而言,我们将通过以下几点,来实现整体目标:
(1)提供相互衔接的课程内容,让学员在尽可能短的时间内掌握能调用单台计算机乃至多台计算机集群的全部CPU资源对10T以内的大数据进行并行计算的能力;
(2)通过自行创建和开发的“课程代码展示站点”和“自动测试系统”,以技术手段为学习和测试提供便利,提高学员的学习效率;
(3)将授课地点设在周边景点众多的江西婺源,让学习的艰辛在美景中缓解:上课期间可到酒店附近婺女洲、弦高古城夜游,也可在课程开始前或结束后到周边的篁岭、望仙谷、三清山、黄山、齐云山、宏村等地游玩(点击以下链接,可转入对应景区公众号的活动介绍:弦高古城|婺女洲|篁岭|望仙谷|三清山);
(4)授课现场每天进行两次测评且配有5名助教答疑,授课结束后提供持续3个月的后续测评和答疑,为学员评估自身状况和迎头赶上提供充分且持久的协助与便利;与此同时,通过将“对其他学员的互助力度”作为测评的重要考量,在同期学员间形成一个协同互助的人际网络,使彼此成为各自持续成长的有力支撑;
(5)提供奖励和帮扶条款,为学有余力的学员提供进一步学习(为本次课程中测评优异的学员提供8个免费参加第4届“面向实证研究的大数据计算”深度研习班的名额,占全部名额的1/3)和实践的空间,为学习缓慢但努力拼搏的学员提供免费再次学习的机会;
(6)将学费设定为远低于同类课程的水平,同时与合作酒店协定了一个极具竞争力的食宿价格,在保证课程和食宿品质的同时,极尽所能的降低学习的总财务成本(交通+ 学费+ 食宿),降低学员的经济负担。
1.2课程内容
课程内容包括三个模块:《大数据计算基础:基于Python和PostgreSQL》、《编程理念》和《AI辅助编程》。
通过本课程,我们希望为学员提供以下知识和技能:
(1)大数据计算基础:基于Python和PostgreSQL,调用单台计算机乃至多台计算机集群的全部CPU资源,对10T以内规模的数据进行并行大数据计算;
下图为“大数据计算基础”模块中Python部分的课程安排
(实际授课时可能略有调整)

下图为“大数据计算基础”模块中PostgreSQL部分的课程安排
(实际授课时可能略有调整)

下图为“大数据计算基础”模块中并行大数据计算部分的课程安排
(实际授课时可能略有调整)

(2)编程理念:理解由交互调用的多个模块构成的大规模代码所应遵循的原则规范,以及大规模代码对代码编写者的人格特质需求,并将该理解内化为自身信念;
下图为“大数据计算基础”模块中并行计算部分的课程安排
(实际授课时可能略有调整)

(3)AI辅助编程:部署AI辅助编程环境,通过AI大模型辅助编程写大数据分析代码,以及应对AI辅助编程的诸多问题和陷阱(该部分课程以我们团队的AI辅助编程经验介绍为主,课程安排暂不公开,以实际授课内容为准)。
1.3授课活动安排
1.3.1现场活动安排
(1)测评与授课
上午
08:00 - 08:30 测评
08:40 - 09:25 第1节课
09:35 - 10:20 第2节课
10:40 - 11:25 第3节课
11:35 - 12:20 第4 节课
下午
14:00 - 14:30 测评
14:40 - 15:25 第5节课
15:35 - 16:20 第6节课
16:40 - 17:25 第7节课
17:35 - 18:20 第8节课
测评通过我们自行开发的“自动测试系统”实现;授课主要由主讲人执行,偶尔由助教执行。
(2)答疑
早上7:00 –晚上24:00之间的所有非授课、非测评时段(含课间休息时段)。
授课期间的答疑均由助教执行。
1.3.2后续活动安排
线下课结束后,提供持续3个月(截止到2026年4月30日)的后续活动,包括测评和答疑。
(1)测评
在后续活动期间(2026年2月10日-2026年4月30日),每周1次,通过“自动测试系统”对学员进行测评。
(2)答疑
答疑时间安排:
2026年2月10日-2026年4月30日,每晚20:30 - 21:30,通过腾讯会议在线答疑1小时(放假安排:2026年2月14-20日因春节放假1周,2026年4月5日因清明节放假1天)。
其中,主讲人每周答疑1次,其他时间由助教轮流答疑。
答疑时发现的典型问题,会每周汇总更新到学员专用的“课程代码展示站点”。

2.主讲人及助教团队
2.1主讲人
汪建雄,北京第二外国语学院经济学院金融系副教授,中央财经大学中国经济与管理研究院(CEMA)金融学博士。研究方向为资产定价、经济史、国家演化、应用计量等,目前正与多位合作者基于裁判文书、工商数据、股票论坛数据等500G以上的超大规模数据集展开分析与合作研究。
论文发表于《China Economic Review》、《Technological Forecasting and Social Change》、《世界经济》、《投资研究》等期刊,主持完成国家自科基金项目、教育部人文社科项目各一项,译有《金融经济学原理》、《已经发生的未来》、《谁绑架了上市公司》、《蜘蛛战略》等译著。
正在撰写关于大数据计算的系列图书,其中的第一本书名暂定为《大数据计算基础:基于Docker、Python、PostgreSQL与MinIO》,预计于2026年由机械工业出版社出版,部分配套课程视频已免费上传至B站(账号:山人一枚也)。
此外,也正与团队成员一起进行多个项目的开发,具体包括:
(1)Bright,一个用于加速大型Python项目开发的代码库,该代码库预计将实现Python代码的自动化分析、调整、测试等功能,主要涉及代码风格、交互调用、执行性能、逻辑错误探测等主题,目前已实现大部分功能,包括类似于Black包但更为完备的代码格式自动化调整;
(2)一个秉承“代码即文档”的理念,基于Bright将项目代码中的注释转为以网页形式呈现的项目文档的库,功能类似于Sphinx,但可与Confluence、Wiki.js等知识库搭配使用;
(3)一个用于当前展开的“大数据计算”系列课程的“自动在线测试系统”,能实现测试题的动态抽选、在线测试、自动批改、统计信息生成与自动输出等功能,后期还会添加学员知识水平和认知技能画像、后续学习方案规划与个性化学习材料生成等功能。
曾于2023年8月、2024年7月、2025年8月举办第1、2、3届“面向实证研究的大数据计算”深度研习班。曾于2021年7月举行的第4届香樟青苗计划及2022年8月举行的第2届香樟西部计划中就“实证研究中的大数据处理与分析”做讲座。曾于2021、2022、2023年在中央财经大学中国经济与管理研究院(CEMA)讲授暑假小学期课程《Python金融大数据分析》。
此外,也曾于2021年1月、2022年1月、2023年3月举行的第10、11、12届PostgreSQL中国技术大会作分享,并于2022年1月、2022年10月举行第14、15届中国系统架构师大会上作分享。
2.2助教团队
赵世杰,北京第二外国语学院金融学本科生,第二届研习班学员,第三届研习班唯一助教,自动测试系统开发人员;
贾友,上海交通大学管理学博士,第一届研习班学员,上海外国语大学贤达经济人文学院讲师,自动测试系统开发人员;
魏龙,江西财经大学金融学博士生,第二届研习班学员,自动测试系统开发人员;
谷世广,贵州财经大学经济学博士生,第三届研习班学员,自动测试系统开发人员;
田相辉,武汉大学经济学博士,青岛农业大学教授,第三届研习班学员,自动测试系统开发人员。

3. 教学辅助系统
3.1课程代码展示站点
基于Wiki.js,我们创建了供学员使用的课程代码展示站点。该站点以网页形式展示课程中用到的py、ipynb、conf等格式的代码或配置文件,每个文件对应一个页面,文件隶属关系对应于页面隶属关系,并且可在相应文件修改后自动更新。
登录该站点后,学员可在各个代码或配置文件(页面)间随意切换,也可在同一个文件(页面)内部快速定位所需查看的代码,并且以精准的格式复制所需代码,远比打开文件直接操作更方便。

上图为团队为第3届“大数据计算”深度研习班创建的“课程代码展示站点”的登录页面
本次课程的“课程代码展示站点”登录页面与之相似

上图为团队为第3届“大数据计算”深度研习班创建的“课程代码展示站点”的登录后主页面
本次课程的“课程代码展示站点”登录后主页面与之相似

上图为团队为第3届“大数据计算”深度研习班创建的“课程代码展示站点”的代码展示页面
本次课程的“课程代码展示站点”的代码展示页面与之相似
3.2自动测试系统
我们还开发了一个自动测试系统,实现了本次课程内容相关测试的试卷生成、在线测试、自动批改、测试结果输出、统计信息生成等功能。其中,除了“在线测试”环节需测试人员参与,其它环节均由系统自动实时完成。
在技术上,该系统以Python、JavaScript、TypeScript、SQL作为编程语言,以PostgreSQL作为后端数据库,以Confluence、Wiki.js、Vue.js3、RestAPI、GraphQL、FastAPI作为前端工具。
该系统在开发时采用Gitlab进行代码仓库管理,并秉承“代码即文档”的理念基于自行开发工具包Bright实现了项目文档的自动生成和实时更新。
借助该系统,我们可以随时了解学员的学习进度,并进而调整教学方案,或根据测试排名确定奖励和帮扶对象。而学员也可通过自行发起的测试了解自己的掌握情况,并进而明确后续学习方向。

上图为“自动测试系统”的登录页面

上图为“自动测试系统”的答题页面

4.授课时间、地点
4.1授课时间
报到时间:2026年2月4日全天(早上8:00-晚上23:00)
授课时间:2026年2月5日-9日,每天上午8:00-12:20,下午14:00-18:20
答疑时间:2026年2月5日-9日,每天早上7:00-晚上24:00之间的所有非上课时段。
4.2授课地点
报到与授课地点:江西省婺源县婺源宝婺大酒店(五星级酒店)
交通提示:坐高铁到婺源站,而后打滴滴即可到达宝婺大酒店,时长应在15分钟以内,车费在15元左右。
4.3食宿安排
食宿地点:婺源宝婺大酒店
(点击右侧链接可转到其他公众号对该酒店的介绍:宝婺大酒店;此外,也可在携程网查看该酒店信息)
已与酒店谈妥协议价(标间按200元每间,不含餐;早餐15元每人每餐,午餐和晚餐40元每人每餐,餐费可打入房费开发票)。
学员福利:
(1)学员可两人合住一间,退房时按各自实际分担的金额开发票;
(2)如果学员想早点到,或结课后再玩几天(学习、旅游两不误嘛,理解),只要通过主讲人及助教团队提前告知酒店,在酒店停留期间,住宿均可享受协议价。

5.考核办法及奖励条款
5.1考核办法
奖励条款对应的考核项目包括:
(1)学员的现场到课情况;
(2)学员对课程内容的掌握程度;
(3)学员对其他学员的互助力度。
上述项目的考核结果全部由“自动测试系统”生成、记录、统计、聚合和排序,具体考核规则和系统使用方法于授课现场公布。
5.2奖励条款
为激励学员认真学习,特设定奖励条款,以“奖学金”、“第4届深度研习班学员资格”、“团队后续项目参与资格”、“课程助教团队成员资格”等作为对考核优异学员的奖励。
5.2.1奖学金
本次课程考核排名前3%的学员(四舍五入,不超过3人),可获得其缴纳的全部费用作为奖学金。
如排名前3%的学员人数超过3人,则仅取前3名学员。
5.2.2第4届“面向实证研究的大数据计算”深度研习班学员资格
本次课程考核的前8名学员自动获得免费参加第4届“面向实证研究的大数据计算”深度研习班的资格,占研习班全部名额的1/3。
关于第4届“面向实证研究的大数据计算”深度研习班,具体参见:
前3届“面向实证研究的大数据计算”深度研习班回顾暨第4届研习班规划
该研习班学员资格不可转让,如前8名学员中有人放弃,则按排名顺序依次向前递补。
5.2.3团队项目参与资格
经邀请,测评优秀学员可参与我们团队后续开展的基于大数据和人工智能的探索性项目,包括:“自动测评系统”和“在线学习系统”的进一步开发和完善,Bright等项目的进一步开发。
5.2.4课程助教团队成员资格
经邀请,测评优秀学员可参与本门课程及其他课程的助教团队,参与课程内容优化,并作为助教参与后续课程的教学。

6.奋进者帮扶条款
课程效果是教、学双方共同努力的结果,既需要教得尽心尽力,也需要学得努力拼搏。
如果你确实肯努力拼搏,学得慢点也没关系,我们有“奋进者帮扶条款”:
如果学员在现场听完全部课程,且参加了授课现场和后续答疑期间的全部测评,但在参加全部测评的学员中累计排名位居后5位,我们将在本课程的下一轮授课中(预计于2026年5月份举办)为其提供一次免费学习机会(仅减免学费,交通食宿自理)。
同时,为了保护隐私和确保公平,约定如下:
(1)对于通过“奋进者帮扶条款”免费参与下一轮授课的学员,我们仅私下通知,并在下一轮课程中就其身份向其他学员保密;
(2)为确保公平,在下一轮课程测评中,通过“奋进者帮扶条款”免费参与下一轮授课的学员不被计入单次测评和累计测评排名前30%学员名单,也不参与奖励待遇的评选。

7.学费标准、优惠条款及支付方式
7.1学费标准
本次共开设5天课程,学费为3200元/人。
如果报名时间在2月1日之后(含当天),需加收100元/人的资料加急准备费(因为需要加急准备课程资料、学员证件等物料)。
7.2优惠条款
如满足以下条件,可享受对应优惠:
(1)如获得前3届“面向实证研究的大数据计算”深度研习班学员推荐,则调整为2780元/人;
(2)如有3人以上(含)一起报名参加,则调整为2480元/人;
(3)如有6人以上(含)一起报名参加,则调整为1980元/人。
其中,前3届“面向实证研究的大数据计算”深度研习班学员推荐需同时满足两个条件:
(1)报名学员在报名邮件中写明推荐人信息(推荐人姓名,推荐人参与研习班的年度);
(2)推荐人在研习班的微信群里发消息给出推荐信息(被推荐人的姓名,所在单位)。
此外,于1月27日(含)之前报名(以邮件发送时间为准),无需前3届“面向实证研究的大数据计算”深度研习班学员推荐,即可享受同等优惠。
7.3付款方式及课程通知、发票事宜
付款方式:
(1)报名后,经联系,向助教支付200元订金;
(2)现场报到时(2026年2月4日),退还订金,并按适用的优惠条款交纳学费。
课程通知:我们将为学员提供由合作公司出具的纸质课程通知。
发票事宜:学员交纳的学费将由合作公司出具培训费发票(普票)。

8.报名时间与方式
8.1报名时间
2026年2月4日晚上20:00之前。
8.2报名方式
(1)发邮件至邮箱BigDataCourse@126.com报名(请注意邮箱中字母的大小写,别打错了,不然邮件白发了)。
(2)报名邮件的标题设为“大数据计算基础线下班报名+姓名”,同时请在邮件中提供你的微信号和手机号。
(3)收到邮件后,助教(赵老师、贾老师和田老师)会通过微信或手机联系你。
8.3特别注意事项
(1)授课场所空间有限,如报名人数提前到达承载上限,则以报名邮件发送时间的先后确定是否可以参与课程;
(2)对因报名人数已满而未能参与课程的报名人员,会第一时间邮件告知。

9.课前准备建议
良好的准备,不仅能提高学习的效率,也能让你在竞争奖励待遇时占尽先机。故而,建议学员参加上课前做如下准备:
(1)准备一台配置较高的电脑:8G以上内存,4核以上CPU,500G以上的SSD固态磁盘(最好是16G以上内存,8核以上的CPU);
***********「全 文 完」***********

往 期 内 容
(点击标题,可跳转至相应内容)
主题一: 课程
“大数据计算”研习班
第四届:
公 告: 规划公告|
第三届:
研习班动态: 开营首日|第二天|第三天|第四天|第五天|第六天
学员 心得 :谷世广|罗熙茗|邓万里|田相辉 |单浩然 |郑康
第二届:
举办地实景:天舍山庄
研习班总结:第二届“面向实证研究的大数据计算”深度研习班总结
学员 心得 :高明|张博夫|魏龙| 周柏旭|梅海龙|吴杰|于海静|李力驰|赵世杰
第一届:
《并行大数据处理:基于Python、PostgreSQL及其他》:
1. 课程信息:
系列课程:《基于Python和PostgreSQL的并行大数据处理》
预备课程:《经济学和金融学实证研究中的大数据处理:基于Python和PostgreSQL》
2. 前期讲座:
2.1 《经济学及金融学实证研究中的大数据处理:基于Python和PostgreSQL》
2.1.1 香樟青苗版(录于2021年7月,约3小时):第1部分|第2部分|第3部分
2.1.2 架构师大会版(录于2022年1月,约2小时):讲座回放
2.2 《“大规模数据分析”项目开发中的编程理念——以Python为例》
2.3 《经济学及金融学中的大数据处理与分析:基于Python和PostgreSQL》(2022年8月“香樟西部计划”讲座)
3.免费课程视频:
3.1 《Python及其在数据分析中的应用》: 系列课程及本门课程安排|Python编程环境介绍:Anaconda、Jupyter Notebook与Spyder|Python语法结构概述|Python中的代码、注释、保留字和对象层级
3.2《PostgreSQL及其Python应用》: PostgreSQL数据库的现状及优势|PostgreSQL的基本原理和整体架构
3.3《并行大数据处理:基于Python和PG》: 基于Python和PostgreSQL的分布式并行计算原理
4. 参考资料:《并行大数据处理:基于Python与PostgreSQL》在线课程参考资料
主题二: 讲座
量化投资:
第一讲:《量化投资的基本概念》 Part1 |Part2 | Part3
代码分析:
Quantaxis开源量化系统:QAData模块 |QAEngine模块
大数据分析中的基本工具:
PostgreSQL: PostgreSQL数据库的安装与启动 |
Citus: Citus简介、安装与基本应用|Citus中的基本概念 | Citus性能测试
TimescaleDB: TimescaleDB简介、安装与基本应用 | TimescaleDB中的超表与分块_第1部分|
主题三: 笔记
史景迁作品系列:《王氏之死》 |《曹寅与康熙》 |《康熙》 |《雍正王朝之大义觉迷》 |《前朝梦忆:张岱的浮华与苍凉》|《利玛窦的记忆宫殿》 | 《胡若望的疑问》 | 《太平天国》 |《改变中国》
历史: 闲谈读史|《大宋之变,1063-1086》|《重铸大英帝国:从美国独立到第二次世界大战》|《宋史纪事本末》| 《西欧中世纪史》|《叫魂》与《中国现代国家的起源》|《万古江河》|《史记》的可信度高吗,怎么看待这本书?|一时一世|
军事理论与军事史: 《战争指导》| 《海权对历史的影响》| 《坎尼的幽灵》|
传记:Alex Honnold|齐白石 | 岳飞 | 莫奈 |褚时健 |特斯拉 | 李鸿章 | 张之洞 | Alfred Sloan | 爱因斯坦 | 亚历山大 | 达芬奇与富兰克林|赵佶|杨立昆|比尔.盖茨1|Eric Kandel |
社科泛海:《文明与缺憾》|《枪炮、病菌与钢铁》| 《世界秩序》 |
经济管理:从NOKIA到iPhone |《How Google Works》| 两个人的布雷顿森林 |《稻盛和夫:阿米巴经营》| 《小米创业思考》 | 范式转换下的历史分析 |
人工智能、机器学习与算法:《Swarm Intelligence》|
文艺生活:《皮囊》|《从你的全世界路过》| 何伟与他眼中的世界 | 木心与陈丹青|
山人闲语:开号小记 | 进化之路 | 职业之外,还有意义 | 除却被毁灭,无法被击败| 有时候,我们该离开已经不属于自己的战场 | 杂谈一则| 涤生真言| The Beginning of a New Era
主题四: 摄影
照片
家乡湖山:三眼桥 | 水库二座 | 晨雾 | 段莘水库 | 裔村源头的山 | 山居晨昏_1 | 山居晨昏_2 | 山间春夏_1 | 官坑的烟花 | 开花的树 |大汜之夏 |山中一日 | 山中又一日 | 雨天茶园|湖山晨暮| 山狗子 |废园春光|千嵯|见之限|渔乐|
视频
主题五: 道友们的世界
道友们的爱:我在澳洲喝咖啡 | 在天河南喝咖啡 | JNU奶茶地图 |
道友们的生活:
道友们的思想:
长按下图,识别二维码,关注本号

声明: 1.本号所发图片,除非特别说明,皆作者亲拍,保留一切权利; 2.本号所发文章,保留一切权利,未经允许,不得转载。
择青山,筑别院,煮香茗,阅经卷,倚林泉,度流年,斯吾愿......
