首页 > 实验教学 > 1.2.4 Python数据挖掘

1.2.4 Python数据挖掘

Python具有丰富和强大的库,如Numpy、Matplotlib和Pandas。Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来。Pandas最初被作为金融数据分析工具而开发出来,因此,Pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和Python数据分析。
本类实验主要侧重用Python进行数据挖掘的基本方法。本类实验包括:数据探索、数据划分、数据填充、特征选择、建模与调优、测试与评估、线性回归模型、逻辑回归模型、k近邻模型、决策树模型、随机森林模型、神经网络模型、支持向量机模型、k均值聚类模型、DBSCAN聚类模型、AGNES层次聚类模型和关联分析模型。通过本类实验,学生可以掌握用Python进行数据挖掘的常用方法和流程。

虹口校区
中国上海市大连西路550号(200083)
松江校区
中国上海市文翔路1550号(201620)