乐虎国际

得数据者得天下

大数据人材告急,薪资高到没对手!

捉住机会 收获高薪!

学大数据技术   固然选择我们

6大优势立造高端大数据人材,4个月让你洗心革面!

  • 500强加持
    甲骨文原厂课
    程、官方教材、认证师资
  • 重实战
    重项目、重PK 、重技
    能,助学员快速取得工作经验
  • 真实环境
    配备Oracle云服务器,真实的
    大数据环境助学员快速掌握工作原理。
  • 保就业
    上万家合作企业,让你的
    就业有保证。
  • 保毕生
    1次培训毕生服务
    云平台老师毕生为您在线解答问题
  • 性价比高
    课程内容全面,学
    费低价,减轻学员生活负担。
选择乐虎国际手机登陆平台最靠谱的方法:先试听,再报名!    

大数据课程优势

打造符合企业实际人材需求

全方位学员服务

名师团队

海文范围和实力俱佳的大数据师资团队

  • 王瑞余
    大数据资深讲师
    多年的资深大数据开发工程师,精通大数据平台HADOOP的技术集合(CDH3、HDFS、MAPREDUCE、HBASE、HIVE、SQOOP、STORM等)和Spark开发,熟习Python机器学习,对数据分析和发掘有比较深的研究。参与过太保的车险大数据模块的开发,电商的搜索引擎索引,建树,分词,搜索等的模块开发。有丰富的教学经验。
  • 陈 勇
    OCM认证大师
    10年以上大型数据库管理经验及4年教育培训经验。精通Unix/Linux操作系统、Oracle数据库体系结构、实例管理、备份恢复、性能调优、SQL调优、闪回、日志发掘、数据仓库、多种ETL工具、数据迁移、故障处理、DataGuard、RAC、Goldengate、Timesten等技术。熟练掌握大数据Hadoop技术平台(Zookeeper、Pig、Hive、Sqop、HBase、MapReduce、HDFS、Avro)设计、部署和保护。前后于2009年通过甲骨文OCP认证考试、2011年通过甲骨文OCM论证考试。
  • 薛广峰
    大数据高级讲师
    有10年的运维和管理经验及2年教学经验,曾参与和主导过酒店、港口运输、加工制造等行业的业务流程与大数据实时分析、可视化展现等项目。曾部署、管理、运维大型网络、服务器等硬件设施及利用管理软件(ERP/BPM等)系统。对Oracle数据库体系结构有独到深入的研究,熟练掌握各种备份与恢复的手段,丰富的性能监控和性能优化的经验。熟习Hadoop/Spark等大数据技术,精通Unix/Linux操作系统。于2014年取得Oracle OCP证书。
  • 陈以仕
    数据库高级讲师
    5年多数据库领域工作经验及2年教学经验,精通Unix/Linux操作系统,Oracle数据库的备份恢复、升级、Dataguard 故障处理、恢复、Symantec备份等灾害防护技术。曾负责全国各个团体5星级酒店数据库及ERP的升级与保护。对Mysql,Sqlserver,WEBLOGIC等相干技术的诊断与保护有丰富工作经验。熟习HADOOP,SPARK,BI 报表开发,HDFS等技术。对JavaEE、Web前端开发、Android开发、嵌入式开发、服务器集群、高并发、虚拟化等高新技术都有研究。取得网络工程师、OCP等IT相干认证。
  • 陈 豪
    Java教学总监
    毕业于上海交通大学,10年软件开发经验及5年以上教育培训经验,熟练Java、web技术,功底扎实、经验丰富,从事过量个大型C/S和B/S项目的开发。曾参与设计开发"上海海事局船员认证考试系统"和“长春市车管所驾培系统”等项目。教学方面耐心细致、口头表达能力强、讲授深入浅出,教授过的学员很多成功入职国内知名企业,且均有不错的口碑。
  • 张 伟
    Java金牌讲师
    10年软件开发经验及5年教育培训经验。精通JavaEE,PHP 等编程语言;精通Java企业级开发框架 spring,mybatis,hibernate,struts2 的利用;精通Linux操作系统服务环境搭建与利用。曾任对台外包Java高级软件工程师,Java软件设计分析师。曾参与设计开发多个企业ERP系统。从事IT教育以来,认真负责,授课能力得到老师与学员的肯定,所带班级的就业率到达100%。
  • 卫志刚
    Python高级讲师
    多年的资深Python开发工程师,对Python利用开发、网络爬虫、基于Python进行数据分析发掘有着非常丰富的实战经验,曾在多家互联网软件公司担当高级软件工程师和项目经理,同时对培养学生的项目实战能力有着自己独特的方式。
海文名师团队 点击了解更多

强大的大数据课程体系 完爆行业

高度契合企业需求的良知课程

大数据、云计算系统顶级架构师课程学习线路图

ORACLE OAEC大数据、云计算系统架构师顶级课程

阶段1、大数据、云计算 - Hadoop大数据开发技术
课程1、大数据运维之Linux基础

乐虎国际Linux系统做为大数据平的企业级操作系统,本部份是基础课程,帮大家打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等众多课程。这是进入大数据领域的必须掌握的基础技术由于企业中的项目基本上都是使用Linux环境下搭建或部署的。

  • 1)Linux系统概述
    2)系统安装及相干配置
    3)Linux网络基础
     
  • 4)OpenSSH实现网络安全连接 
    5)vi文本编辑器
    6)用户和用户组管理
  • 7)磁盘管理 
    8)Linux文件和目录管理 
    9)Linux终端常常使用命令 
  • 10)linux系统监测与保护
课程2、大数据开发核心技术 - Hadoop 2.x从入门到精通

本课程是整套大数据课程的基石:其1,散布式文件系统HDFS用于存储海量数据,不管是Hive、HBase或Spark分析的数据是存储在HDFS里面;其2是散布式资源管理框架YARN是用来在Hadoop 云操作系统(也称数据系统)管理集群资源和散布式数据处理框架MapReduce、Spark利用的资源调度与监控的;散布式并行计算框架MapReduce目前是海量数据并行处理的1个最常常使用的框架。Hadoop 2.x的编译、环境搭建、HDFS Shell使用,YARN 集群资源管理与任务监控,MapReduce编程,散布式集群的部署管理(包括高可用性HA)必须要掌握的。

  • 1、初识Hadoop 2.x
    1)大数据利用发展、前景
    2)Hadoop 2.x概述及生态系统
    3)Hadoop 2.x环境搭建与测试
  • 2、深入Hadoop 2.x
    1)HDFS文件系统的架构、功能、设计
    2)HDFS Java API使用
    3)YARN 架构、集群管理、利用监控
    4)MapReduce编程模型、Shuffle进程、编程调优
  • 3、高级Hadoop 2.x
    1)散布式部署Hadoop 2.x
    2)散布式协作服务框架Zookeeper 
    3)HDFS HA架构、配置、测试
    4)HDFS 2.x中高级特性
    5)YARN HA架构、配置
    6)Hadoop主要发行版本(CDH、HDP、Apache)
  • 4、实战利用
    1)以【CSDN网用户浏览日志】数据进行实际的分析
    2)原数据搜集
    3)数据的预处理(ETL)
    4)数据的分析处理(MapReduce)
课程3、大数据开发核心技术 - 大数据仓库Hive精讲

乐虎国际hive是基于Hadoop的1个数据仓库工具,可以将结构化的数据文件映照为1张数据库表,并提供基本的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习本钱低,可以通类SQL语句快速实现简单的MapReduce统计,没必要开发专门的MapReduce利用,10分合适数据仓库的统计分析。

  • 1、Hive 初识入门
    1)Hive功能、体系结构、使用处景
    2)Hive环境搭建、低级使用 
    3)Hive原数据配置、常见交互方式
  • 2、Hive深入使用
    1)Hive中的内部表、外部表、分区表
    2)Hive 数据迁移
    3)Hive常见查询(select、where、distinct、join、group by)
    4)Hive 内置函数和UDF编程
  • 3、Hive高级进阶
    1)Hive数据的存储和紧缩
    2)Hive常见优化(数据倾斜、紧缩等)
  • 4、结合【CSDN用户浏览日志】实际案例分析
    1)根据业务设计表
    2)数据清洗、导入(ETL)
    3)使用HiveQL,统计常见的网站指标
课程4、大数据协作框架 - Sqoop/Flume/Oozie精讲

乐虎国际Sqoop是1款开源的工具,主要用于在Hadoop(Hive)与传统的数据库mysql、Oracle、SQLServer、postgresql等RDBMS数据间进行数据的传递,可以将1个关系型数据库,例如 : MySQL 、Oracle 、SQLServer、Postgres等RDBMS中的数据导进到关系型数据库中。Sqoop项目开始于2009年,最早是作为Hadoop的1个第3方模块存在,后来为了让使用者能够快速部署,也为了让开发人员能够更快速的迭代开发,Sqoop独立成为1个Apache项目。

  • 1、数据转换工具Sqoop
    1)Sqoop功能、使用原则
    2)将RDBMS数据导入Hive表中(全量、增量) 
    3)将HDFS上文件导出到RDBMS表中
  • 2、文件搜集框架Flume
    1)Flume 设计架构、原理(3大组件)
    2)Flume初步使用,实时搜集数据 
    3)如何使用Flume监控文件夹数据,实时搜集录入HDFS中
    4)任务调度框架Oozie
  • 3、Oozie功能、安装部署
    1)使用Oozie调度MapReduce Job和HiveQL
    2)定时调度任务使用
课程5、大数据Web开发框架 - 大数据WEB 工具Hue精讲

Hue是1个开源的Apache Hadoop UI系统,最早是由Cloudera Desktop演变而来,由Cloudera贡献给开源社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job等等。

  • 1)Hue架构、功能、编译
    5)Hue集成Oozie
  • 2)Hue集成HDFS 
  • 3)Hue集成MapReduce
  • 4)Hue集成Hive、DataBase
课程6、大数据核心开发技术 - 散布式数据库HBase从入门到精通

HBase是1个散布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:1个结构化数据的散布式存储系统”。HBase在Hadoop之上提供了类似于Bigtable的能力,是1个高可靠性、高性能、面向列、可伸缩的散布式存储系统,利用HBase技术可在便宜PC Server上搭建起大范围结构化存储集群;

  • 1、HBase初窥使用
    1)HBase是甚么、发展、与RDBMS相比优势、企业使用
    2)HBase Schema、表的设计
    3)HBase 环境搭建、shell初步使用(CRUD等)
  • 2、HBase 深入使用
    1)HBase 数据存储模型
    2)HBase Java API使用(CRUD、SCAN等)
    3)HBase 架构深入剖析
    4)HBase 与MapReduce集成、数据导入导出
  • 3、HBase 高级使用
    1)如何设计表、表的预分区(根据具体业务分析讲授)
    2)HBase 表的常见属性设置(结合企业实际)
    3)HBase Admin操作(Java API、常见命令)
  • 4、【CSDN用户浏览日志】进行分析
    1)根据需求设计表、创建表、预分区
    2)进行业务查询分析 
    3)对密集型读和密集型写进行HBase参数调优
课程7、大数据核心开发技术 - Storm实时数据处理

Storm是Twitter开源的散布式实时大数据处理框架,被业界称为实时版Hadoop。 随着越来越多的场景对Hadoop的MapReduce高延迟没法容忍,比如网站统计、推荐系统、预警系统、金融系统(高频交易、股票)等等, 大数据实时处理解决方案(流计算)的利用日益广泛,目前已是散布式技术领域最新爆发点,而Storm更是流式计算技术中的佼佼者和主流。 依照storm作者的说法,Storm对实时计算的意义类似于Hadoop对批处理的意义。Hadoop提供了map + reduce的原语,使我们的批处理程序变得简单和高效。 1样,Storm也为实时计算提供了1些简单高效的原语,而且Storm的Trident是基于Storm原语更高级的抽象框架,类似于基于Hadoop的Pig框架, 让开发更加便利和高效。本课程会深入、全面的讲授Storm,并穿插企业场景实战讲述Storm的运用。 淘宝双11的大屏幕实时监控效果冲击了全部IT界,业界为之惊叹的同时更是引发对该技术的探索。 学完本课程你可以自己开发升级版的“淘宝双11”,1起来学习吧!

  • 1)Storm简介和课程介绍
    2)Storm原理和概念详解 
    3)Zookeeper集群搭建及基本使用 
    4)Storm集群搭建及测试 
    5)API简介和入门案例开发 
    6)Spout的Tail特性、storm-starter及maven使用、Grouping策略 
    7)实例讲授Grouping策略及并发 
  • 8)并发度详解、案例开发(高并发运用)
    9)案例开发——计算网站PV,通过2种方式实现汇总型计算。 
    10)案例优化引入Zookeeper锁控制线程操作 
    11)计算网站UV(去重计算模式) 
    12)【运维】集群统1启动和停止shell脚本开发
    13)Storm事务工作原理深入讲授
    14)Storm事务API及案例分析
  • 15)Storm事务案例实战之 ITransactionalSpout 
    16)Storm事务案例升级之按天计算 
    17)Storm分区事务案例实战 
    18)Storm不透明分区事务案例实战 
    19)DRPC精解和案例分析 
    20)Storm Trident 入门
    21)Trident API和概念
  • 22)Storm Trident实战之计算网站PV
    23)ITridentSpout、FirstN(取Top N)实现、流合并和Join
    24)Storm Trident之函数、流聚合及核心概念State
    25)Storm Trident综合实战1(基于HBase的State)
    26)Storm Trident综合实战2
    27)Storm Trident综合实战3
    28)Storm集群和作业监控告警开发
课程8、Spark技术实战之基础篇 -Scala语言从入门到精通

为甚么要学习Scala?源于Spark的流行,Spark是当前最流行的开源大数据内存计算框架,采取Scala语言实现,各大公司都在使用Spark:IBM宣布许诺大力推动Apache Spark项目,并称该项目为:在以数据为主导的,未来10年最为重要的新的开源项目。这1许诺的核心是将Spark嵌入IBM业内领先的分析和商务平台,Scala具有数据处理的天然优势,Scala是未来大数据处理的主流语言;

  • 1)-Spark的前世今生
    2)-课程介绍、特点与价值
    3)-Scala编程详解:基础语法 
    4)-Scala编程详解:条件控制与循环
    5)-Scala编程详解:函数入门 
    6)-Scala编程详解:函数入门之默许参数和带名参数  
  • 7)-Scala编程详解:函数入门之变长参数
    8)-Scala编程详解:函数入门之进程、lazy值和异常
    9)-Scala编程详解:数组操作之Array、ArrayBuffer和遍历数组
    10)-Scala编程详解:数组操作之数组转换
    11)-Scala编程详解:Map与Tuple
  • 12)-Scala编程详解:面向对象编程之类
    13)-Scala编程详解:面向对象编程之对象
    14)-Scala编程详解:面向对象编程之继承
    15)-Scala编程详解:面向对象编程之Trait
    16)-Scala编程详解:函数式编程 
  • 17)-Scala编程详解:函数式编程之集合操作
    18)-Scala编程详解:模式匹配
    19)-Scala编程详解:类型参数
    20)-Scala编程详解:隐式转换与隐式参数
    21)-Scala编程详解:Actor入门
课程9、大数据核心开发技术 - 内存计算框架Spark精讲

乐虎国际Spark是UC Berkeley AMP lab所开源的类,是Hadoop MapReduce的通用并行框架,Spark具有Hadoop MapReduce所具有的优点。启用了内存散布数据集,除能够提供交互式查询外,它还可以优化迭代工作负载。Spark Streaming: 构建在Spark上处理Stream数据的框架,基本的原理是将Stream数据分成小的时间片断(几秒),以类似batch批量处理的方式来处理这小部份数据;

  • 1)Spark 初识入门
    2)Spark概述、生态系统、与MapReduce比较
    3)Spark编译、安装部署(Standalone Mode)及测试
    4)Spark利用提交工具(spark-submit,spark-shell)
    5)Scala基本知识讲授(变量,类,高阶函数) 
  • 6)Spark 核心RDD
    7)RDD特性、常见操作、缓存策略
    8)RDD Dependency、Stage常、源码分析
    9)Spark 核心组件概述
    10)案例分析
  • 11)Spark 高阶利用
    12)Spark on YARN运行原理、运行模式及测试
    13)Spark HistoryServer历史利用监控
    14)Spark Streaming流式计算
  • 15)Spark Streaming 原理、DStream设计
    16)Spark Streaming 常见input、out
    17)Spark Streaming 与Kafka集成
    18)使用Spark对【CSDN网用户浏览日志】进行分析
课程10、大数据核心开发技术 - Spark深入剖析(全案例)

本课程主要讲授目前大数据领域热门、火爆、有前景的技术——Spark。在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲授Spark,并且会包括完全从企业真实复杂业务需求中抽取出的案例实战。课程会涵盖Scala编程详解、Spark核心编程.

  • 1)Scala编程、Hadoop与Spark集群搭建、Spark核心编程、Spark内核源码深度剖析、Spark性能调优;
  • 2)Spark源码剖析;
  • 3)Spark案例分析;
课程101、企业大数据平台高级利用

本阶段主要就之前所学内容完成大数据相干企业场景与解决方案的剖析利用及结合1个电子商务平台进行实战分析,主要包括有: 企业大数据平台概述、搭建企业大数据平台、真实服务器手把手环境部署、使用CM 5.3.x管理CDH 5.3.x集群;

  • 1)企业大数据平台概述
    2)大数据平台基本组件 
    3)Hadoop 发行版本、比较、选择
    4)集群环境的准备(系统、基本配置、计划等) 
  • 5)搭建企业大数据平台 
    6)以实际企业项目需求为根据,搭建平台 
    7)需求分析(主要业务) 
    8)框架选择(Hive\HBase\Spark等)
  • 9)真实服务器手把手环境部署 
    10)安装Cloudera Manager 5.3.x 
    11)使用CM 5.3.x安装CDH 5.3.x 
    12)如何使用CM 5.3.x管理CDH 5.3.x集群
  • 13)基本配置,优化 
    14)基本性能测试 
    15)各个组件如何使用
课程102、项目实战:驴妈妈旅游网大型离线数据电商分析平台

离线数据分析平台是1种利用hadoop集群开发工具的1种方式,主要作用是帮助公司对网站的利用有1个比较好的了解。特别是在电商、旅游、银行、证券、游戏等领域有非常广泛,由于这些领域对数据和用户的特性掌控要求比较高,所以对离线数据的分析就有比较高的要求了。 本课程讲师本人之前在游戏、旅游等公司专门从事离线数据分析平台的搭建和开发等,通过此项目将所有大数据内容贯穿,并前后展现!

  • 1)Flume、Hadoop、Hbase、Hive、Oozie、Sqoop、离线数据分析,SpringMVC,Highchat;
  • 2Flume+Hadoop+Hbase+SpringMV
    C+MyBatis+MySQL+Highcharts实现的电商离线数据分析;
  • 3)日志搜集系统、日志分析、数据展现设计
课程103、项目实战:基于1号店的电商实时数据分析系统

课程基于1号店的业务及数据进行设计和讲授的,主要触及:
1、课程中完全开发3个Storm项目,均为企业实际项目,其中1个是完全由Storm Trident开发。 项目源码都可以直接运行,也可直接用于商用或企业。
2、每1个技术均采取最新稳定版本,学完后会员可以从Kafka到Storm项目开发及HighCharts图表开发1个人弄定!让学员身价剧增;
3、搭建CDH5生态环境完全平台,且采取Cloudera Manager界面化管理CDH5平台。让Hadoop平台环境搭建和保护都变得轻而易举。
乐虎国际 4、分享实际项目的架构设计、优劣分析和取舍、经验技能,陡直提升学员的经验值;

  • 1)全面掌握Storm完全项目开发思路和架构设计
    2)掌握Storm Trident项目开发模式
  • 3)掌握Kafka运维和API开发、与Storm接口开发 
    4)掌握HighCharts各类图表开发和实时无刷新加载数据 
  • 5)熟练搭建CDH5生态环境完全平台 
    6)灵活运用HBase作为外部存储
  • 7)可以做到以1己之力完成从后台开发(Storm、Kafka、Hbase开发) 
    到前台HighCharts图表开发、Jquery运用等,所有工作1个人弄定! 
    可以1个人弄定淘宝双11大屏幕项目!
课程104、大数据高薪面试剖析

本阶段通过对历来大数据公司企业真实面试题的剖析,讲授,让学员真正的1个菜鸟转型为具有1年以上的大数据开发工作经验的专业人士,也是讲师多年来大数据企业开发的经验之谈。

  • 1)大数据项目
    2)企业大数据项目的类型 
    3)技术架构(如何使用各框架处理数据)
  • 4)冲刺高薪面试 
    5)面试简历编写(掌控重点要点) 
    6)面试中的技能
  • 7)常见面试题讲授 
    8)如何快速融入企业进行工作(对大数据公司来讲非常关键)
    9)学员答疑 
  • 10)针对普遍问题进行公共解答  
    11)1对1的交换
阶段2、大数据、云计算 - Java企业级核心利用
课程105、深入Java性能调优

乐虎国际国内关于Java性能调优的课程非常少,如此全面深入介绍Java性能调优; 本套课程系多年工作经验与心得的总结,课程有着很高的含金量和实用价值,本课程专注于java利用程序的优化方法,技能和思想,深入剖析软件设计层面、代码层面、JVM虚拟机层面的优化方法,理论结合实际,使用丰富的示例帮助学员理解理论知识。

课程106、JAVA企业级利用开发必备高级技术(Weblogic 、Tomcat集群、Apach集群)

乐虎国际Java自面世后就非常流行,发展迅速,对C++语言构成有力冲击。在全球云计算和移动互联网的产业环境下,JAVA更具有了显著优势和广阔前景,基于JAVA的项目也越来越多,对JAVA运行环境的要求也越来越高,很多JAVA的程序员只知道对业务的扩大而不知道对java本身的运行环境的调试,例如虚拟机调优,服务器集群等,所以也滋生本门课程的产生。 本课程重点讲授JAVA企业级开发中必须掌握的利用服务器;

阶段3、大数据、云计算 - 散布式集群、PB级别网站性能优化
课程107、大数据高并发系统架构实战方案(LVS负载均衡、Nginx、共享存储、海量数据、队列缓存 )

随着互联网的发展,高并发、大数据量的网站要求越来越高。而这些高要求都是基础的技术和细节组合而成的。本课程就从实际案例动身给大家原景重现高并发架构常常使用技术点及详细演练。通过该课程的学习,普通的技术人员即可以够快速搭建起千万级的高并发大数据网站平台,课程触及内容包括:LVS实现负载均衡、Nginx高级配置实战、共享存储实现动态内容静态化加速实战、缓存平台安装配置使用、mysql主从复制安装配置实战等。

课程108、大数据高并发服务器实战教程

随着Web技术的普及,Internet上的各类网站每天都在爆炸式增长。但这些网站大多在性能上没做过量考虑。固然,各种情况不同。有的是Web技术本身的缘由(主要是程序代码问题),还有就是由于Web服务器未进行优化。不论是哪类情况,1但用户量在短时间内激增,网站就会明显变慢,乃至谢绝放访问。要想有效地解决这些问题,就只有依托不同的优化技术。本课程就是主要用于来解决大型网站性能问题,能够承受大数据、高并发。主要触及 技术有:nginx、tomcat、memcached、redis缓存、负载均衡等高级开发技术;
项目实战:PB级通用电商网站性能优化解决方案
乐虎国际 本部份通过1个通用电约定单支付模块,外加淘宝支付接口的实现(可用于实际项目开发),剖析并分析进程中可能遇到的各种性能瓶颈及相干的解决方案与优化技能。终究目标,让具有PHP基础或JAVA基础的学员迅速掌握Linux下的开发知识,并对触及到nginx、tomcat、memcached、redis缓存、负载均衡等高级开发技术有1个全面的了解;

阶段4、大数据、云计算 - 数据发掘、分析 & 机器学习
课程109、玩转大数据:深入浅出大数据发掘技术(Apriori算法、Tanagra工具、决策树)

本课程名为深入浅出数据发掘技术。所谓“深入”,指得是从数据发掘的原理与经典算法入手。其1是要了解算法,知道甚么场景应当利用甚么样的方法;其2是学习算法的经典思想,可以将它利用到其他的实际项目当中;其3是理解算法,让数据发掘的算法能够利用到您的项目开发当中去。所谓“浅出”,指得是将数据发掘算法的利用落实到实际的利用中。课程会通过3个不同的方面来讲授算法的利用:1是微软公司的SQL Server与Excel等工具实现的数据发掘;2是著名开源算法的数据发掘,如Weka、KNIMA、Tanagra等开源工具;3是利用C#语言做演示来完成数据发掘算法的实现。根据实际的援用处景,数据发掘技术通常分为分类器、关联分析、聚类算法等3大种别。本课程主要介绍这3大算法的经典思想和部份著名的实现情势,并结合1些商业分析工具、开源工具或编程等方式来讲授具体的利用方法;

课程210、Lucene4.X实战类baidu搜索的大型文档海量搜索系统

本课程由浅入深的介绍了Lucene4的发展历史,开发环境搭建,分析lucene4的中文分词原理,深入讲了lucenne4的系统架构,分析lucene4索引实现原理及性能优化,了解关于lucene4的搜索算法优化及利用java结合lucene4实现类百度文库的全文检索功能等相对高端实用的内容,市面上1般很难找到同类具有相同深度与广度的视频,集原理、基础、案例与实战与1身,不可多得的1部高端视频教程;

课程2101、快速上手数据发掘之solr搜索引擎高级教程(Solr集群、KI分词、项目实战)

乐虎国际本教程从最基础的solr语法开始讲授,选择了最新最流行的开源搜索引擎服务框架solr5.3.1,利用Tomcat8搭建了solr的集群服务;本教程可以帮助学员快速上手solr的开发和2次开发,包括在hadoop集群的使用,海量数据的索引和实时检索,通过了解、学习、安装、配置、集成等步骤引导学员如何将solr集成到项目中;

课程2102、项目实战:SPSS Modeler数据发掘项目实战培训

SPSS Modeler是业界极其著名的数据发掘软件,其前身为SPSS Clementine。SPSS Modeler内置丰富的数据发掘模型,以其强大的发掘功能和友好的操作习惯,深受用户的爱好和好评,成为众多知名企业在数据发掘项目上的软件产品选择。本课程以SPSS Modeler为利用软件,以数据发掘项陌生命周期为线索,以实际数据发掘项目为例,讲授了从项目商业理解开始,到最后软件实现的全进程。

课程2103、数据层交换和高性能并发处理(开源ETL大数据治理工具)

ETL是数据的抽取、清洗、转换、加载的进程,是数据进入数据仓库进行大数据分析的载入进程,目前流行的数据进入仓库的进程有两种情势,1种是进入数据库后再进行清洗和转换,另外1条线路是首先进行清洗转换再进入数据库,我们的ETL属于后者。 大数据的利器大家可能普遍说是hadoop,但是大家要知道如果我们不做预先的清洗和转换处理,我们进入hadoop后仅通过mapreduce进行数据清洗转换再进行分析,垃圾数据会导致我们的磁盘占用量会相当大,这样无形中提升了我们的硬件本钱(硬盘大,内存小处理速度会很慢,内存大但CPU性能低速度也会受影响),因此虽然hadoop理论上解决了1堆普通服务器拼起来解决大问题的问题,但是事实上如果我们有更好的节点速度1定是会普遍提升的,因此ETL在大数据环境下依然是必不可少的数据交换工具;

课程2104、零基础数据分析与发掘R语言实战

本课程面向从未接触过数据分析的学员,从最基础的R语法开始讲起,逐渐进入到目前各行业流行的各种分析模型。全部课程分为基础和实战两个单元:基础部份包括R语法和统计思惟两个主题、R语法单元会介绍R语言中的各种特点数据结构,和如何从外部抓取数据,如何使用包和函数,帮助学员快速通过语法关。统计思惟单元会指导如何用统计学的思想快速的发现数据特点或模式,并利用R强大的绘图能力做可视化展现。在实战部份选择了回归、聚类、数据降维、关联规则、决策树这5中最基础的数据分析模型,详细介绍其思想原理,并通过案例讲授R中的实现方案,特别是详细的介绍了对各种参数和输出结果的解读,让学员真正到达融会贯通、举1反3的效果。并利用到自己的工作环境中;

课程2105、深入浅出Hadoop Mahout数据发掘实战(算法分析、项目实战、中文分词技术)

Mahout 是 Apache Software Foundation(ASF) 旗下的1个开源项目,提供1些可扩大的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能利用程序。课程包括:Mahout数据发掘工具,及Hadoop实现推荐系统的综合实战,触及到MapReduce、Pig和Mahout的综合实战;

课程2106、大数据项目实战之Python金融利用编程(数据分析、定价与量化投资)

乐虎国际最近几年来,金融领域的量化分析越来越遭到理论界与实务界的重视,量化分析的技术也取得了较大的进展,成为备受关注的1个热门领域。所谓金融量化,就是将金融分析理论与计算机编程技术相结合,更加有效的利用现代计算技术实现准确的金融资产定价和交易机会的发现。量化分析目前已触及到金融领域的各个方面,包括基础和衍生品金融资产定价、风险管理、量化投资等。随着大数据技术的发展,量化分析还逐渐与大数据结合在1起,对海量金融数据实现有效和快速的运算与处理。在量化金融的时期,选用1种合适的编程语言对金融模型的实现是相当重要的。在这方面,Python语言体现出了不1般的优势,特别是它具有大量的金融计算库,并且可以提供与C++,java等语言的接口以实现高效率的分析,成为金融领域快速开发和利用的1种关键语言,由于它是开源的,着落了金融计算的本钱,而且还通过广泛的社交网络提供大量的利用实例,极大的缩短了金融量化分析的学习路径。本课程在量化分析与Python语言快速发展的背景下介绍2者之间的关联,使学员能够快速掌握如何利用Python语言进行金融数据量化分析的基本方法。

课程2107、项目实战:云计算处理、大数据深度学习、智能发掘技术+地震数据发掘分析

本课程介绍了基于云计算的大数据处理技术,重点介绍了1款高效的、实时分析处理海量数据的强有力工具——数据立方。数据立方是针对大数据处理的散布式数据库,能够可靠地对大数据进行实时处理,具有即时响应多用户并发要求的能力,通过对当前主流的大数据处理系统进行深入剖析,论述了数据立方产生的背景,介绍了数据立方的整体架构和安装和详细开发流程,并给出了4个完全的数据立方综合利用实例。所有实例都经过验证并附有详细的步骤说明,不管是对云计算的初学者还是想进1步深入学习大数据处理技术的研发人员、研究人员都有很好的参考价值。

阶段5、大数据、云计算 - 大数据运维 & 云计算技术篇
课程2108、Zookeeper从入门到精通(开发详解,案例实战,Web界面监控)

ZooKeeper是Hadoop的开源子项目(Google Chubby的开源实现),它是1个针对大型散布式系统的可靠调和系统,提供的功能包括:配置保护、命名服务、散布式同步、组服务等。Zookeeper的Fast Fail 和 Leader选举特性大大增强了散布式集群的稳定和结实性,并且解决了Master/Slave模式的单点故障重大隐患,这是越来越多的散布式产品如HBase、Storm(流计算)、S4(流计算)等强依赖Zookeeper的缘由。Zookeeper在散布式集群(Hadoop生态圈)中的地位越来越突出,对散布式利用的开发也提供了极大便利,这是迫切需要深入学习Zookeeper的缘由。
乐虎国际 本课程主要内容包括Zookeeper深入、客户端开发(Java编程,案例开发)、平常运维、Web界面监控,“1条龙”的实战平台分享给大家;

课程2109、云计算Docker从零基础到专家实战教程

Docker是1种开源的利用容器引擎,使用Docker可以快速地实现虚拟化,并且实现虚拟化的性能相对其他技术来讲较高。并且随着云计算的普及和对虚拟化技术的大量需求,使得云计算人材供不应求,所以1些大型企业对Docker专业技术人材需求较大。本教程从最基础的Dokcer原理开始讲起,深入浅出,并且全套课程均结合实例实战进行讲授,让学员可以不但能了解原理,更能够实际地去使用这门技术;

课程310、项目实战:云计算Docker全面项目实战(Maven+Jenkins、日志管理ELK、WordPress博客)

2013年,云计算领域从此多了1个名词“Docker”。以轻量著称,更好的去解决利用打包和部署。之前我们1直在构建Iaas,但通过Iaas去实现统1功 能还是相当复杂得,并且保护复杂。将特殊性封装到镜像中实现几近1致得部署方法,它就是“Docker”,以容器为技术核心,实现了利用的标准化。企业可以快速生成研发、测试环境,并且可以做到快速部署。实现了从产品研发环境到部署环境的1致化。Docker让研发更加专注于代码的编写,并且以“镜像”作 为交付。极大的缩短了产品的交付周期和实行周期;

课程3101、深入浅出OpenStack云计算管理平台

乐虎国际OpenStack是1个由Rackspace发起、全球开发者共同参与的开源项目,旨在打造易于部署、功能丰富且易于扩大的云计算平台。OpenStack企图成为数据中心的操作系统,即云操作系统。从项目发起之初,OpenStack就几近赢得了所有IT巨头的关注,在各种OpenStack技术会议上人们豪情澎湃,几近所有人都成为OpenStack的信徒。 这个课程重点放在Openstack的部署和网络部份。课程强调实际的动手操作,使用vmware摹拟实际的物理平台,让大家可以自己动手去实际搭建和学习Openstack。课程内容包括云计算的基本知识、虚拟网络基础、Openstack部署和利用、Openstack网络详解等;

阶段6、大数据、云计算 - 深度学习&推荐系统&人工智能
课程3102、深度学习与TensorFlow实战

本课程希望用简单易懂的语言带领大家探索TensorFlow(基于1.0版本API)。课程中讲师主讲TensorFlow的基础原理,TF和其他框架的异同。并用具体的代码完全地实现了各种类型的深度神经网络:AutoEncoder、MLP、CNN(AlexNet,VGGNet,Inception Net,ResNet)、Word2Vec、RNN(LSTM,Bi-RNN)、Deep Reinforcement Learning(Policy Network、Value Network)。另外,还讲授了TensorBoard、多GPU并行、散布式并行、TF.Learn和其他TF.Contrib组件。本课程能帮读者快速入门TensorFlow和深度学习,在工业界或研究中快速地将想法落地为可实践的模型;

  • 1)TensorFlow基础  
    2)TensorFlow和其他深度学习框架的对照
    3)TensorFlow第1步
  • 4)TensorFlow实现自编码器及多层感知机
    5)TensorFlow实现卷积神经网络
  • 6)TensorFlow实现经典卷积神经网络
    7)TensorFlow实现循环神经网络及Word2Vec 
  • 8)TensorFlow实现深度强化学习
    9)TensorBoard、多GPU并行及散布式并行
课程3103、推荐系统

本课程重点讲授开发推荐系统的方法,特别是许多经典算法,重点探讨如何衡量推荐系统的有效性。课程内容分为基本概念和进展两部份:前者触及协同推荐、基于内容的推荐、基于知识的推荐、混合推荐方法,推荐系统的解释、评估推荐系统和实例分析;后者包括针对推荐系统的攻击、在线消费决策、推荐系统和下1代互联网和普通环境中的推荐。课程中包括大量的图、表和示例,有助于学员理解和掌控相干知识等:

  • 1)协同过滤推荐
    2)基于内容的推荐
  • 3)基于知识的推荐
    4)混合推荐方法
  • 5)推荐系统的解释
    6)评估推荐系统 
  • 7)案例研究
课程3104、人工智能(选修)

本课程主要讲授人工智能的基本原理、实现技术及其利用,国内外人工智能研究领域的进展和发展方向。内容主要分为4个部份:
   第1部份是搜索与问题求解,系统地叙述了人工智能中各种搜索方法求解的原理和方法,内容包括状态空间和传统的图搜索算法、和声算法、忌讳搜索算法、遗传算法、免疫算法、粒子群算法、蚁群算法和Agent技术等;
   第2部份为知识与推理,讨论各种知识表示和处理技术、各种典型的推理技术,还包括非经典逻辑推理技术和非调和逻辑推理技术;
   第3部份为学习与发现,讨论传统的机器学习算法、神经网络学习算法、数据发掘和知识发现技术;
   第4部份为领域利用,分别讨论专家系统开发技术和自然语言处理原理和方法。 通过对这些内容的讲授能够使学员对人工智能的基本概念和人工智能系统的构造方法有1个比较清楚的认识,对人工智能研究领域里的成果有所了解;

  • 1)AI的产生及主要学派
    2)人工智能、专家系统和知识工程
    3)实现搜索进程的3大要素
    4)搜索的基本策略 
  • 5)图搜索策略
    6)博弈与搜索
    7)演变搜索算法
    8)群集智能算法
  • 9)记忆型搜索算法
    10)基于Agent的搜索
    11)知识表示与处理方法
    12)谓词逻辑的归结原理及其利用 
  • 13)非经典逻辑的推理
    14)次调和逻辑推理
课程3105、大数据爬虫项目实战

本项目采取Java语言实现,绝对基于真实的爬虫项目进行改进和优化,希望进1步提升大家的大数据项目经验。本项目基本涵盖了爬虫项目的全部流程,包括数据爬虫、全文检索、数据可视化、爬虫项目监控、爬虫项目保护等等。解决了爬虫项目中遇到的辣手问题,包括破解网站反爬策略、网站模板定期变更、网站频繁访问IP被封等等问题; 技术架构:
乐虎国际  Java、HttpClient、Redis、Solr、HBase、Zookeeper、HighChart、HTMLEmail

课程3106、道路交通实时流量监控预测系统项目实战

本项目主要采取目前大数据领域最成熟的实时计算框架Spark,它是目前主流企业在实时计算方向采取的主流框架。本项目使用了Spark技术生态栈中的3个技术框架:Spark Core、Spark Streaming和Spark MLlib,进行道路交通实时流量监控预测系统的开发。业务实现包括数据产生模块、数据实时搜集处理模块、特点数据提取模块、模型预测模块、数据存储模块; 技术架构:
乐虎国际  Spark Core、Spark Streaming和Spark MLlib

了解更多课程详情

学员项目实战

乐虎国际企业真实项目,毕业即积累两年工作经验!

点击查看项目详情

优秀就业案例

用薪资告知你海文的实力!

  • 周* 17500

  • 周*晖 16600

  • 胡* 16600

  • 张*宏 16500

  • 周*涨 15000

  • 何* 14000

  • 刘* 13000

  • 关* 13000

  • 陈* 13000

  • 徐*馨 13000

就业合作企业

为学员提供1个有保障的就业平台

乐虎国际为广大求职者和企业提供更广阔的信息交换、服务平台

知名雇主

乐虎国际超万家企业 信赖和选择我们的学员

想了解自己能去哪些企业就业?

教学环境

匠心打造教学环境 教学面积数万平米 承载数千人同时实训

HWUA10分重视教学品质,因此在各种教学设施上的建设也10分完善。例如多媒体教室、
真机实验室、百万级机房、饭厅等。为了让学员真正与企业无缝接轨,我们在教学上的投入是非常
乐虎国际用心的,不管从学习环境、硬件设施、还是教学配置来看,在国内都处于1流水平。

即刻预约,参观基地

为你解答你最关心的问题

© 版权所有 2017 上海海文信息技术有限公司 | 沪ICP备 13010793号