✅回归分析:用于预测变量之间的关系,最常见的是线性回归模型。
✅逻辑回归:用于解决分类问题,将输入特征映射到分类概率。
✅K近邻(KNN):通过距离最近的K个邻居来进行分类或回归。
✅支持向量机(SVM):通过找到最优超平面来将数据进行分类。
✅决策树:通过递归地将数据集划分,构建分类或回归树。
✅随机森林:通过多个决策树集成,提高分类或回归的准确性。
✅朴素贝叶斯:基于贝叶斯定理进行分类,假设特征之间是条件独立的。
✅K均值聚类:一种无监督学习算法,通过将数据分配到K个簇中,最小化簇内数据点与簇中心的距离。
主成分分析:用于数据降维,通过保留最大方差的主成分来减少数据特征数量。
✅描述性统计:用于描述数据的基本特征,如均值、标准差等,帮助我们快速了解数据分布。
相关性分析:用来衡量两个变量之间的线性关系强度,常用皮尔逊相关系数。
✅T检验:比较两个样本均值,判断它们之间是否存在显著差异。
✅方差分析:用于检验多个组之间的均值是否存在显著差异,适用于多个组的比较。
✅时间序列分析:分析数据的时间依赖性,预测未来趋势或值。
✅卡方检验:用于分析类别数据之间的独立性,适用于分类变量的相关性检验。
✅生存分析:用于分析事件发生的时间,特别是应用于医学和风险评估。
#python #编程 #python学习 #计算机 #sql #数据分析项目 #数据分析 #机器学习