50个大数据面试题第二篇：10个大数据面试中级问题-职坐标

50个大数据面试题第二篇：10个大数据面试中级问题

小职 2020-12-11 来源：慧都大数据https://blog.csdn.net/qq_27005679/article/det 阅读 568 评论 0

摘要：本篇总结了最重要的大数据面试问题以及具体问题的详细解答，无论是大数据行业的新手还是经验丰富的，都需要大数据基础知识。希望对于大数据的学习或者面试有所帮助。

本篇总结了最重要的大数据面试问题以及具体问题的详细解答，无论是大数据行业的新手还是经验丰富的，都需要大数据基础知识。希望对于大数据的学习或者面试有所帮助。

50个大数据面试题第二篇：10个大数据面试中级问题

在之前的文章中，我们总结了10个大数据面试入门级问题，大家是否有收获呢？如果还没有看的小伙伴，可以在《50个大数据面试题第一篇：10个大数据面试入门级问题》开始学习吧！

依然是10个已经在大数据行业工作的老司机们面试时的问题及建议答案，话不多说，赶紧开始今天的学习。

基于大数据已从业者的面试问题

如果你在大数据世界中有相当丰富的工作经验，那么根据您以前的经验，将在大数据面试中被问到一些问题。这些问题可能与您的经验或基于场景有关。所以，准备好这些最好的大数据面试问题和答案。

11.您有大数据经验吗？如果有，请分享一下

如何处理：问题没有具体答案，因为这是一个主观问题，答案取决于你以前的经验。在大数据面试期间询问这个问题，面试官想要了解您以前的经验，并且还试图评估您是否适合项目要求。

那么，你将如何处理这个问题呢？如果有以前的经验，请在过去的职位上开始履行职责，并慢慢向对话添加详细信息。告诉他们你使项目成功的贡献。一般来说，这个问题是在面试中提出的第二或第三个问题。后面的问题是基于这个问题，所以请仔细回答。你还应该注意不要过度使用以前工作的一个方面。保持简单和重点。

12.您更喜欢好的数据还是好的模型？为什么？

如何处理：这是一个棘手的问题，但通常在大数据面试中被问到。它要求你在好的数据或好的模型之间进行选择。作为候选人，你应该尝试根据自己的经验回答这个问题。许多公司希望遵循严格的数据评估流程，这意味着他们已经选择了数据模型。在这种情况下，拥有良好的数据可能会改变游戏规则。另一种方式也适用于基于良好数据选择的模型。

正如我们已经提到的，请根据你的经验回答。但是，不要说拥有良好的数据和良好的模型很重要，因为在现实生活中很难同时拥有这两个数据。

13.您是否会优化算法或代码以使其运行更快？

如何处理：这个问题的答案应该始终是“是”。真实世界的性能很重要，它不依赖于你在项目中使用的数据或模型。

面试官可能也有兴趣知道你是否有任何以前的代码或算法优化经验。对于初学者来说，这显然取决于他过去从事过哪些项目。有经验的候选人也可以相应地分享他们的经验。但是，请诚实地对待你工作，如果您过去没有优化代码，那就没关系了。只需让面试官了解你的真实体验，就可以破解大数据面试了。

14.您如何处理数据准备？

如何处理：数据准备是大数据项目的关键步骤之一。大数据面试可能涉及至少一个基于数据准备的问题。当面试官问你这个问题时，他想知道你在数据准备过程中采取了哪些步骤或预防措施。

如你所知，需要数据准备才能获得必要的数据，然后可以进一步用于建模目的。你应该把这个消息传达给面试官。还应该强调要使用的模型类型以及选择特定模型的原因。最后，但并非最不重要，你还应该讨论重要的数据准备术语，如转换变量，异常值，非结构化数据，识别差距等。

15.您如何将非结构化数据转换为结构化数据？

如何处理：非结构化数据在大数据中非常常见。应将非结构化数据转换为结构化数据，以确保正确的数据分析。你可以通过简要区分两者来开始回答问题。完成后，你现在可以讨论用于将一个表单转换为另一个表单的方法。你也可以分享你所做的真实情况。

如果你最近刚毕业，那么你可以分享与你的学术项目相关的信息。

通过正确回答这个问题，你发出信号表明你了解结构化和非结构化数据的类型，并且具有使用这些数据的实践经验。如果你具体回答这个问题，你肯定能够破解大数据面试。

16.哪种硬件配置对Hadoop作业最有利？