«

大数据专业主要学什么

时间:2022-8-21 19:21     作者:!admin     分类:


  大数据专业主要学什么

  大数据技术专业属于交叉学科:以统计学、数学、计算机为三大支撑性学科;生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。大数据专业还需学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等,知识结构是二专多能复合的跨界人才(有专业知识、有数据思维)。

  大数据的学习阶段

  第一阶段:大数据前沿知识及hadoop入门,大数据前言知识的介绍,课程的介绍,Linux和unbuntu系统基础,hadoop的单机和伪分布模式的安装配置。

  第二阶段:hadoop部署进阶。Hadoop集群模式搭建,hadoop分布式文件系统HDFS深入剖析。使用HDFS提供的api进行HDFS文件操作。Mapreduce概念及思想。

  第三阶段:大数据导入与存储。mysql数据库基础知识,hive的基本语法。hive的架构及设计原理。hive部署安装与案例。sqoop安装及使用。sqoop组件导入到hive。

  第四阶段:Hbase理论与实战。Hbase简介。安装与配置。hbase的数据存储。项目实战。

  第五阶段:Spaer配置及使用场景。scala基本语法。spark介绍及发展历史,sparkstantalone模式部署。sparkRDD详解。

  第六阶段:spark大数据分析原理。spark内核,基本定义,spark任务调度。sparkstreaming实时流计算。sparkmllib机器学习。sparksql查询。

标签: 专业知识