乐虎国际 > 海文新闻 > 常见的大数据面试题,拿走不谢!

常见的大数据面试题,拿走不谢!

2017年10月26日14:22:22来源:海文国际         951
分享到:

1.HDFS数据存储是由哪个程序负责的?

答:Datanode

2.Hadoop的作者是谁?

答:dougcutting

3.集群最主要的瓶颈是?

答:磁盘

4.Hadoop运行模式是?

答:单机版伪散布式散布式

5.安装CDH的方法由CLOUDERA提供,它的安装方法是?

答:CiouderamanagerTarballYumRpm

6.哪些项目可以作为集群的管理?

答:PuppetPdshZookeeper

常见的大数据面试题,拿走不谢!

7.spark和hadoop的辨别,和各自的优势

答:Spark和hadoop都是大数据利用框架系统。spark速度快,易于使用,是大数据学习时需要使用的系统;hadoop是散布式文件系统,其实就是1种软件库和框架。Spark和hadoop是1种相互共生的关系,hadoop拟补了spark没有的功能性,spark为数据提供了内存整理。

8.String和stringBuffer的辨别是甚么

答:string是对象是不可变的对象,不能修改它的值,stringbuffer是1个可变对象,对他进行修改的时候不会像string那样重新建立对象。

9.Java中,int和integer的辨别

答:int是基本数据类型,integer是1种包装,intrger可存储int并添加int。

10.Arraylist和linkedlist的特性

答:ArrayList采取的是通过数字组合的方式保存对象的,并将对象放在连续的位置中,缺点是插入删除时非常麻烦;

LinkedList采取的是将对象寄存在独立的空间中,而且在寄存中还保存下1个对象的搜索引擎,缺点是查找比较麻烦,要从第1个开始。