1.乳腺癌测序数据、临床数据联合数据挖掘:
生信数据下载、数据融合、数据筛选、缺失值处理、变量归一化、结局变量提取、one-hot编码、RFE-SVM特征筛选、分类模型构建、超参数搜索运用。通过案例式学习,掌握数据挖掘的流程、套路。
2.机器学习生存模型框架实战:
生存框架完整分析流程;模型性能评价、生存模型比较的AUC折线图表述,IBF折线图模型比较、特征选择、线性生存回归模型、基于岭回归的线性模型;生存树模型实战。
3.数据分析美图秀秀:
类别比较图表、数据关系图表、数据分布图表;特征分析图、ROC_AUC曲线图等
4.集成学习与非集成学习模型构建与对比分析:
baggingboosting、HistGradientBoosting、CatBoost、XGBRF、XGBRF、LGBMC、DecisionTree,RandomForest、Logistic、SVC、MultiomialNB、BernoulliNB、GaussianNB、KNN等。