Spark大數(shù)據(jù)平臺(tái)

    •  課程目標(biāo)

      本課程首先介紹了Spark生態(tài),Spark基礎(chǔ);深入講了分布式集群的搭建,Spark編程實(shí)戰(zhàn)。最后Spark數(shù)據(jù)分析和數(shù)據(jù)挖掘MLib,綜合項(xiàng)目實(shí)戰(zhàn)。

    •  師資團(tuán)隊(duì)

    • 華清創(chuàng)客企業(yè)內(nèi)訓(xùn)講師,均是來(lái)自各個(gè)領(lǐng)域的資深專(zhuān)家,均擁有6年以上大型項(xiàng)目經(jīng)驗(yàn)。

    •  培養(yǎng)對(duì)象

      學(xué)員學(xué)習(xí)本課程應(yīng)具備下列基礎(chǔ)知識(shí):
      ◆ 具備Python語(yǔ)言的基礎(chǔ);
      ◆ 對(duì)大數(shù)據(jù)Spark開(kāi)發(fā)感興趣的學(xué)員;

    •  培訓(xùn)方式

    第一種:華清創(chuàng)客講師面授
    課時(shí):共3天,每天6學(xué)時(shí),總計(jì)18學(xué)時(shí)
    ◆費(fèi)用(含教材費(fèi)):3600元
    ◆外地學(xué)員:代理安排食宿(需提前預(yù)定)

    第二種:線上直播授課
    直播課時(shí):共6天,每天3學(xué)時(shí),總計(jì)18學(xué)時(shí);
    輔導(dǎo):授課期間,輔導(dǎo)老師每天有1小時(shí)的輔導(dǎo)直播
    ◆費(fèi)用(含教材費(fèi)):3600元

    第三種:企業(yè)訂制培訓(xùn)
    課時(shí):根據(jù)定制的大綱確定課時(shí)
    費(fèi)用:根據(jù)課程難度,每課時(shí)1500~3000元

      •  質(zhì)量保證

        1、培訓(xùn)過(guò)程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在下期培訓(xùn)班中重聽(tīng);

        2、培訓(xùn)結(jié)束后免費(fèi)提供一個(gè)月的技術(shù)支持,充分保證培訓(xùn)后出效果;

        3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會(huì)。

      •  課程大綱


        Spark入門(mén)及生態(tài)體系 概述

        Spark生態(tài)

        Spark(內(nèi)存計(jì)算框架)

        SparkSteaming(流式計(jì)算框架)

        Spark SQLad-hoc

        MllibMachine Learning

        GraphXbagel將被取代)

        彈性分布式數(shù)據(jù)集(RDD


        Python Spark基礎(chǔ)介紹 Spark 編程模型

        RDD緩存策略

        Spark Python編程入門(mén)

        PySpark

        惰性計(jì)算(Lazy Evaluation

        流水線(Pipelines


        分布式集群搭建 SparkHadoopVMware Ubuntu分布式集群搭建全過(guò)程

        Ubuntu基本環(huán)境配置

        集群安裝準(zhǔn)備

        安裝配置Hadoop

        安裝配置Spark


        基于PythonSpark編程實(shí)戰(zhàn) 概述

        連接Spark

        初始化Spark

        使用命令行

        彈性分布式數(shù)據(jù)集(RDD

        RDD操作

        RDD持久化

        在集群上部署

        Python編寫(xiě)的一個(gè)簡(jiǎn)單Spark應(yīng)用


        Spark MLlib的使用 機(jī)器學(xué)習(xí)概念

        Spark MLlib介紹

        Spark MLlib架構(gòu)解析

        MLlib的算法庫(kù)分析

        Spark Python構(gòu)建分類(lèi)模型

        使用 Spark MLlib K-means 聚類(lèi)分析


        Spark案例實(shí)戰(zhàn) "1. 互聯(lián)網(wǎng)金融反欺詐案例分析

        2. Spark RDD編程技巧

        3. 用戶數(shù)據(jù)特征轉(zhuǎn)換解析及Spark實(shí)現(xiàn)

        4,分類(lèi)挖掘算法實(shí)現(xiàn)及應(yīng)用

          1) 使用Spark Decision Tree實(shí)現(xiàn)金融反欺詐模型

          2) 使用Spark Navie Bayes實(shí)現(xiàn)金融反欺詐模型

          3Spark分類(lèi)算法常用場(chǎng)景及開(kāi)發(fā)流程"



the end

評(píng)論(0)