人工智能与数据科学应用实验教学中心

实验室介绍

组织架构

中心视频

联系我们

实验室概况

设备与环境

一. 人工智能与数据科学应用实验教学中心实验课程内容

1.1 数据工具使用

1.1.1 R语言数据处理

1.1.2 Python数据处理

1.1.3 Hadoop数据处理

1.1.4 Hive数据处理

1.1.5 Spark数据处理

1.1.6 Excel数据处理

1.1.7 SAS数据处理

1.1.8 MySQL数据处理

1.2 人工智能算法

1.2.1 统计与建模方法演示

1.2.2 数据挖掘方法演示

1.2.3 R语言数据挖掘

1.2.4 Python数据挖掘

1.2.5 Spark数据处理

1.2.6 SAS数据挖掘

1.2.7 RapidMiner数据挖掘

1.3 行业应用案例

1.3.1 R语言和Python实战案例

1.3.2 大数据分析综合应用

1.4 实验列表

实验教学

教学及科研成果

规章制度

首页 > 实验教学 > 1.1.5 Spark数据处理

一. 人工智能与数据科学应用实验教学中心实验课程内容

1.1 数据工具使用

1.1.1 R语言数据处理

1.1.2 Python数据处理

1.1.3 Hadoop数据处理

1.1.4 Hive数据处理

1.1.5 Spark数据处理

1.1.6 Excel数据处理

1.1.7 SAS数据处理

1.1.8 MySQL数据处理

1.2 人工智能算法

1.2.1 统计与建模方法演示

1.2.2 数据挖掘方法演示

1.2.3 R语言数据挖掘

1.2.4 Python数据挖掘

1.2.5 Spark数据处理

1.2.6 SAS数据挖掘

1.2.7 RapidMiner数据挖掘

1.3 行业应用案例

1.3.1 R语言和Python实战案例

1.3.2 大数据分析综合应用

1.4 实验列表

1.1.5 Spark数据处理

Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
本类实验主要侧重用Spark进行大数据处理的基本方法。本类实验包括：Spark环境搭建和配置、数据读入、数据统计、数据清洗、数据相关性和Spark SQL。通过本类实验，学生可以掌握用Spark进行大数据处理的常用方法和流程。

虹口校区

中国上海市大连西路550号（200083）

松江校区

中国上海市文翔路1550号（201620）