1.1 数据工具使用
平台集成常用工具在数据挖掘中的使用教程,包括:
- R语言:通用的统计计算和数据可视化的开源软件环境和编程语言,并且高度可扩展;
- Python:通用、可读性强、支持动态编程的工具语言,包含许多数据处理、机器学习和数据可视化包,如pandas、scikit-learn和matplotlib;
- MySQL:开源关系型数据库,用于存取、处理和查询数据;
- RapidMiner:模块化管道数据挖掘框架,仅需通过拖拽实现算法;
- SAS:历史悠久的统计建模软件,商业应用广泛;
- MS Excel:基于表格的办公自动化软件,“所见即所得”;
- Tensorflow:深度学习和人工智能软件框架;
- Hadoop:通用的分布式大数据存储和处理软件框架;
- HDFS:大数据分布式文件存储系统;
- YARN:集群资源管理和大数据与人工智能作业调度系统;
- MapReduce:大数据分布式处理软件框架;
- Hive:SQL数据仓库,用于大数据的统计、查询和分析;
- Spark:基于内存的数据分析、挖掘和建模框架。
虹口校区
中国上海市大连西路550号(200083)
松江校区
中国上海市文翔路1550号(201620)