2015年,党的十八届五中全会正式提出实施国家大数据战略,大数据从此上升为国家战略。2016年,教育部审批通过北京大学、对外经济贸易大学、中南大学三所高校首批开设“数据科学与大数据技术”专业。短短十年间,全国已有800多所学校开设大数据相关专业。
专业蓬勃发展的背后,一个现实问题摆在眼前:数据科学导论这门课,该怎么教?学生该怎么学?
今天要推荐的这本《数据科学导论——基于Python》(高等教育出版社),正是为回答这个问题而生。主编陈华,副主编严晓东、郭政,编写团队来自山东省大数据研究会数据科学与大数据技术专业建设教学指导委员会。
▍这本书讲什么?
全书共8章,从概念到实践,层层递进:
第一章绪论(陈华编写):数据相关概念、数据科学的发展历史、研究内容与应用场景——让学生先搞清楚“数据科学到底是什么”。
第二章数据科学编程基础(严晓东编写):Python基础编程——工具入手,迈出实践第一步。
第三章数据科学数学基础(赵姣姣编写):微积分、线性代数、数理统计的基本概念及Python实现——数学不抽象,代码来落地。
第四章数据预处理(赵烜编写):数据获取、数据清洗、数据规范——真实世界中,80%的时间都在做这件事。
第五章探索性数据分析(姜雪松编写):统计量计算、可视化展示——让数据“开口说话”。
第六章数据管理、安全与技术(陈华编写):数据库、数据安全、大数据技术——数据不仅有价值,还有风险。
第七章数据建模(郭政编写):各类建模方法与实现——从数据到洞察的关键一跃。
第八章综合案例(陈华编写):针对经典数据集,完成数据处理、特征工程、数据建模全流程——把前面学的全部用起来。
▍这本书最大的特点:问题驱动,培养数据思维
市面上讲Python的书很多,讲数据科学的书也不少。但这本书的独特之处在于——它不是“教工具”,而是“教思维”。
全书以问题为驱动,每一章都围绕实际问题展开,让学生在解决问题的过程中逐步建立数据思维方式。习题也是以实际问题为主线。它不追求对某个方法的深度学习(那些留待后续专业课),而是帮助学生建立对数据处理全流程的基本认知——从数据获取到预处理,从探索性分析到建模,一整套完整的方法论。
▍不同专业怎么用?编者已经帮你想好了
这本书最贴心的地方在于,编者针对三类不同专业给出了具体的教学建议:
数据科学与大数据技术等本科专业:建议大一下学期开设,以32学时为宜。如果大一上学期已开设Python课程,第二章只需一次复习课;数学基础课若已开设,第三章可以跳过。
非数据类本科专业:建议大三上学期或下学期开设。未开设Python课程的专业需安排第二章;数学基础薄弱(尤其缺少统计知识)的专业需安排第三章。
大数据技术专科专业:建议大一下学期或大二上学期开设,更偏向实践过程。以32学时为宜。
一本教材,适配三种培养方案——这在同类教材中实属少见。
▍谁适合读这本书?
·数据科学与大数据技术、大数据管理与应用、数据计算与应用等专业的本科生
·非数据类专业但希望培养数据思维、用数据方法解决本专业问题的本科生
·大数据技术相关专科专业的学生
·任何对数据科学感兴趣、希望系统入门的学习者
▍写在最后
从“十三五”规划建议提出实施国家大数据战略,到如今800多所高校开设大数据相关专业,数据科学已经从“前沿”变成了“基础设施”。
而这本书要做的,就是帮每一个走进这个领域的人,走好第一步。
它不是一本厚重的百科全书,而是一张精心绘制的地图——告诉你数据科学的世界有多大、有哪些重要的地标、该从哪里出发,以及如何规划自己的学习路线。
《数据科学导论——基于Python》高等教育出版社 | ISBN:978-7-04-067099-8现已出版,欢迎选用。
https://www.hep.com.cn/book/show/c8682c27-6dc4-4c30-b60b-ac89d03ac4fe