首页 > 实验教学 > 1.1 数据工具使用

1.1 数据工具使用

平台集成常用工具在数据挖掘中的使用教程,包括:

  • R语言:通用的统计计算和数据可视化的开源软件环境和编程语言,并且高度可扩展;
  • Python:通用、可读性强、支持动态编程的工具语言,包含许多数据处理、机器学习和数据可视化包,如pandas、scikit-learn和matplotlib;
  • MySQL:开源关系型数据库,用于存取、处理和查询数据;
  • RapidMiner:模块化管道数据挖掘框架,仅需通过拖拽实现算法;
  • SAS:历史悠久的统计建模软件,商业应用广泛;
  • MS Excel:基于表格的办公自动化软件,“所见即所得”;
  • Tensorflow:深度学习和人工智能软件框架;
  • Hadoop:通用的分布式大数据存储和处理软件框架;
  • HDFS:大数据分布式文件存储系统;
  • YARN:集群资源管理和大数据与人工智能作业调度系统;
  • MapReduce:大数据分布式处理软件框架;
  • Hive:SQL数据仓库,用于大数据的统计、查询和分析;
  • Spark:基于内存的数据分析、挖掘和建模框架。
虹口校区
中国上海市大连西路550号(200083)
松江校区
中国上海市文翔路1550号(201620)