这个学期结束,最近比较闲,正好之前向出版社要了本《 Python 财务数据分析与应用》[1] 的书,所以抽空通读一下,看能不能学到点东西。这本顾名思义讲的是用 Python 做财务数据分析的内容,但是内容非常浅显,对于资深读者,没有多大的参考意义。但如果是给大专乃至普通本科的经管类的学生入门 Python 数据分析,还是可以一看的。

该书目录如下:
第 1 章 Python 入门 2 第 2 章 Python 语言基础 12 第 3 章 数据分析基础 40 第 4 章 财务数据获取及分析 58 第 5 章 财务数据可视化 79 第 6 章 财务数据挖掘 103 第 7 章 会计文本分析与词云图绘制 124 第 8 章 上市公司财务数据获取与财务状况分析 140 第 9 章 某行业财务数据可视化与对比分析 159 第 10 章 基于 K 均值聚类的上市公司盈利能力分析 187
这本书的前五章主要是介绍 Python 基础语法和数据分析基础(numpy、Pandas 和 matplotlib),第四章讲如何用 akshare 或 baostock 获取财务数据。这前面几章写的还行,内容上详略得当, 如果你可以很轻松的看完这些内容,说明你具备了一定的 Python 基础,可以进行数据分析了 。
不过如果你是个一无所知的初学者,想要靠这本书的内容入门 Python 数据分析,恐怕不太现实。因为书中忽略了很多细节,初学者很难理解。推荐去看 《Python 极简讲义:一本书入门数据分析与机器学习》 和 《Python 数据科学手册》 这两本书是学习 Python 数据分析方面比较好的入门书籍。
公众号最近有几篇推文,就是这本书的课后实践,大家可以参考一下:
这些也是这本书中比较有价值的部分了,这些案例是比较好的学习材料。
书中最后三章,讲的是从获取数据、数据可视化,到简单的数据分析乃至形成报告的完整流程。这些内容虽然浅显,但对于初学者来说,还是可以认真学习一下,会有所收获。
这本书第六章:财务数据挖掘,讲的是一元回归、多元回归、逻辑回归和聚类。该部分写得比较外行,也缺乏必要的介绍。比如:

首先,这边没有介绍清楚什么是数据标准化,为什么要做数据标准化?所以,作者自己就犯了错误,把数据标准化放在划分训练集和测试集之前了,导致数据泄漏。

这部分也一样,没有介绍清楚什么是数据编码,为什么要做数据编码?此处对数据的编码合不合理也值得商榷。
这一章比较体现水平,因为具备一定的专业性。看介绍本书作者是西安一个民办本科院校数据科学学院的教授,应该对机器学习不至于如此陌生。
虽然无情指出这本书的一些问题。但,总体而言,这本书还是可以一看。比国内很多同类出版物要强,全靠同行衬托,更粗制滥造书比比皆是 🤣。这本书总体内容比较完整,逻辑也比较清晰,案例也比较实用。虽然内容过于浅显,在财务数据分析上专业性并不强,但是对于刚接触这个领域的学生而言,能把这本书讲的内容学好,学以致用,也不错了。
这本书后续会加入到公众号的赠书活动中,感兴趣的读者可以多多关注公众号。
《 Python财务数据分析与应用》: https://www.ryjiaoyu.com/book/details/51983