
关于我们
ABOUT US
北京ESG研究院是以中国宏观经济研究院(国家发展和改革委员会宏观经济研究院)、国家发展和改革委员会价格成本和认证中心作为双指导单位,北京市通州区人民政府作为主管单位,由清华大学、中国人民大学、厦门大学、剑桥大学、斯坦福大学、北卡罗来纳大学等高校学者共同发起设立的ESG研究机构。以“高举中国特色,兼蓄国际视野,强调成本内化,重视社会贡献”为核心研究宗旨,推进京津冀、北京市、副中心区域及重点行业ESG标准建设,形成可复制、可推广的首都示范样本。

岗位职责
一、 数据抓取与处理
设计并开发分布式爬虫系统,实现多平台(电商、新闻、社交平台等)数据的自动化抓取、清洗、去重及结构化存储,支撑AI模型训练的数据需求;
解析动态/静态网页内容,运用XPath、CSS选择器、正则表达式等技术提取目标字段,处理反爬机制(如IP封禁、验证码、JavaScript动态加载),优化爬虫架构提升抓取效率;
监控爬虫运行状态,实时处理异常数据,确保数据质量(完整性、一致性、时效性),并配合团队完成数据管道的维护与优化。
二、AI大模型技术落地
参与大语言模型(LLM)的微调、RAG(检索增强生成)、Function Call、Agents等关键技术研发,优化模型在垂直场景(如金融、医疗、教育)的应用效果;
负责数据工程(数据清洗、标注、增强)、模型设计(Transformer架构优化)、算法训练与推理加速(模型蒸馏、量化、分布式训练);
探索多模态大模型(文本-图像-语音)的融合应用,推动模型在私有化部署、边缘计算场景的落地。

应聘要求
统招本科、硕士、博士在读,计算机/软件工程/人工智能/数学相关专业优先;
熟练掌握Python及常用库(requests、Scrapy、BeautifulSoup、aiohttp、PyTorch、TensorFlow),具备爬虫项目或AI大模型项目经验或相关实习经历;
深入理解HTTP协议、HTTP状态码、Cookies机制,熟悉Linux环境开发,掌握MySQL/MongoDB/Redis等数据库基础操作;
深入理解Transformer架构、自注意力机制,掌握预训练、微调、提示工程(Prompt Engineering)、RLHF(人类反馈强化学习)等核心技术。

工作方式
工作地点:北京
实习时长:3-6个月(可延长),每周至少5天到岗

投递方式
请发送以下材料至邮箱:hr@bjesg.com
PDF 简历
简短自我介绍(100–200 字)
可投入实习时间
邮件标题:【Python爬虫与AI大模型算法实习生】-姓名-学校-专业
期待你的加入,让我们共同推动绿色科技的发展!
北京ESG研究院主编的全国首部ESG信息披露指南手册——《环境、社会、治理(ESG)信息披露操作手册》现已正式发售。

点击链接 即可购买
