全国分站 
400-650-7353
首页 > 热门标签 > 标签:

大数据面试题

总共有 32 条记录
【大数据面试题】Hive相关试题
【大数据面试题】Hive相关试题

你的数据库是不是很大么,有没有分表,分区,你是怎么实现的 hive内部表和外部表的区别 内部表:加载数据到hive所在的hdfs目录,删除时,元数据和数据文件都删除 外部表:不加载数据到hive所...

【大数据面试题】hadoop相关试题(二)
【大数据面试题】hadoop相关试题(二)

Datanode宕机了后,如果是短暂的宕机,可以实现写好脚本监控,将它启动起来。如果是长时间宕机了,那么datanode上的数据应该已经被备份到其他机器了, 那这台datanode就是一台新的datanode了,删除他的所有数据文件和状态...

【大数据面试题】hadoop相关试题(一)
【大数据面试题】hadoop相关试题(一)

最近要准备面试的就要开始提早看些面试、笔试题。以下是优就业整理的一些经常出现、有价值的大数据面试题,包含hadoop、hive、hbase、storm、spark等。答案仅供参考,如有错误,请指出。 hadoop相关试题...

【大数据面试题】十道常见的大数据判断题
【大数据面试题】十道常见的大数据判断题

1、Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。(错误 ) hadoop只能阻止好人犯错,但是不能阻止坏人干坏事 2、 Slave 节点要存储数据,...

【大数据面试题】相关判断题及分析
【大数据面试题】相关判断题及分析

分析:lucene是支持随机读写的,而hdfs只支持随机读。但是HBase可以来补救。HBase提供随机读写,来解决Hadoop不能处理的问题。HBase自底层设计开始即聚焦于各种可伸缩性问题:表可以...

【大数据面试题】hadoop的优化问题
【大数据面试题】hadoop的优化问题

1)优化的思路可以从配置文件和系统以及代码的设计思路来优化 2)配置文件的优化:调节适当的参数,在调参数时要进行测试 3)代码的优化:combiner的个数尽量与reduce的个数相同,数据的类型保持一致,可以减少拆包与封包的...

【大数据面试题】互联网公司常见的大数据面试题
【大数据面试题】互联网公司常见的大数据面试题

大家都知道namenode与secondary namenode 的关系,当他们要进行数据同步时叫做checkpoint时就用到了fsimage与edit,fsimage是保存最新的元数据的信息,当fsimage数据到一定的...

【大数据面试题】NameNode节点启动问题
【大数据面试题】NameNode节点启动问题

hadoop的集群是基于master slave模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,而slave有多个SecondaryNameNode内存需求和NameNode在一...

【大数据面试题】query的频度排序问题
【大数据面试题】query的频度排序问题

在参加工作前最重要的一轮就是大数据的面试,优就业小编分享一道经典的大数据面试题及答案,希望可以帮到准备或者正在参加大数据面试的朋友们。 有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序...

【大数据面试题】Mapper任务的执行过程详解
【大数据面试题】Mapper任务的执行过程详解

在电脑旁奋斗了无数个日夜,代码敲了无数遍,项目整改了无数遍,只为了得到一份自己满意的高薪资高待遇的Offer。但这个收获不仅仅需要你学到娴熟的大数据技术,还需要在面试之前精心准备,了解自己要应聘的企业发展状况、 自己应聘岗位的技术要求等等,除此之外,多...

【大数据面试题】kafka的数据问题
【大数据面试题】kafka的数据问题

有可能造成数据的丢失。由于Kafka consumer默认是自动提交位移的,所以在后台提交位移前一定要保证消息被正常处理了,因此不建议采用很重的处理逻辑,如果处理耗时很长,则建议把逻辑放到另...

推荐阅读

 
 
咨询中心
优就业微信扫一扫
微信扫一扫

400-650-7353

加入官方微博