资料已经打包好了,需要的公众号发送“11”领取
回归分析:用于预测变量之间的关系,最常见的是线性回归模型。
逻辑回归:用于解决分类问题,将输入特征映射到分类概率。
K近邻(KNN):通过距离最近的K个邻居来进行分类或回归。
支持向量机(SVM):通过找到最优超平面来将数据进行分类。
决策树:通过递归地将数据集划分,构建分类或回归树。
随机森林:通过多个决策树集成,提高分类或回归的准确性。
朴素贝叶斯:基于贝叶斯定理进行分类,假设特征之间是条件独立的。
K均值聚类:一种无监督学习算法,通过将数据分配到K个簇中,最小化簇内数据点与簇中心的距离。
主成分分析:用于数据降维,通过保留最大方差的主成分来减少数据特征数量。
描述性统计:用于描述数据的基本特征,如均值、标准差等,帮助我们快速了解数据分布。
相关性分析:用来衡量两个变量之间的线性关系强度,常用皮尔逊相关系数。
T检验:比较两个样本均值,判断它们之间是否存在显著差异。
方差分析:用于检验多个组之间的均值是否存在显著差异,适用于多个组的比较。
时间序列分析:分析数据的时间依赖性,预测未来趋势或值。
卡方检验:用于分析类别数据之间的独立性,适用于分类变量的相关性检验。
生存分析:用于分析事件发生的时间,特别是应用于医学和风险评估。
#数据分析 #数据分析我在行 #数据分析师 #算法 #数据库 #数据分析转行 #Python #数据分析学习 #数据分析求职