人工智能与数据科学应用实验教学中心

实验室介绍

中心视频

联系我们

实验室概况

设备与环境

一. 人工智能与数据科学应用实验教学中心实验课程内容

1.1 数据工具使用

1.1.1 R语言数据处理

1.1.2 Python数据处理

1.1.3 Hadoop数据处理

1.1.4 Hive数据处理

1.1.5 Spark数据处理

1.1.6 Excel数据处理

1.1.7 SAS数据处理

1.1.8 MySQL数据处理

1.2 人工智能算法

1.2.1 统计与建模方法演示

1.2.2 数据挖掘方法演示

1.2.3 R语言数据挖掘

1.2.4 Python数据挖掘

1.2.5 Spark数据处理

1.2.6 SAS数据挖掘

1.2.7 RapidMiner数据挖掘

1.3 行业应用案例

1.3.1 R语言和Python实战案例

1.3.2 大数据分析综合应用

1.4 实验列表

实验教学

教学及科研成果

规章制度

首页 > 实验教学 > 1.2.5 Spark数据处理

一. 人工智能与数据科学应用实验教学中心实验课程内容

1.1 数据工具使用

1.1.1 R语言数据处理

1.1.2 Python数据处理

1.1.3 Hadoop数据处理

1.1.4 Hive数据处理

1.1.5 Spark数据处理

1.1.6 Excel数据处理

1.1.7 SAS数据处理

1.1.8 MySQL数据处理

1.2 人工智能算法

1.2.1 统计与建模方法演示

1.2.2 数据挖掘方法演示

1.2.3 R语言数据挖掘

1.2.4 Python数据挖掘

1.2.5 Spark数据处理

1.2.6 SAS数据挖掘

1.2.7 RapidMiner数据挖掘

1.3 行业应用案例

1.3.1 R语言和Python实战案例

1.3.2 大数据分析综合应用

1.4 实验列表

1.2.5 Spark数据处理

Spark MLlib是Spark的机器学习（Machine Learning）库，旨在简化机器学习的工程实践工作，并方便扩展到更大规模。MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。
本类实验主要侧重用Spark进行数据挖掘的基本方法。本类实验包括：回归模型、分类模型、交叉验证和超参数调优和管道。通过本类实验，学生可以掌握用Spark进行数据挖掘的常用方法和流程。

虹口校区

中国上海市大连西路550号（200083）

松江校区

中国上海市文翔路1550号（201620）