百度数据挖掘工程师实习生笔试面试题

笔试题:
一、简答题30分
1. extern”C”{}的作用好应用场景;
2.写出两者你熟悉的设计模式,及应用场景,可以给出伪代码;
3.TCP中time_wait是表示那种状态,及应用场景,以及起好处和坏处;

二、算法题40分
1. 有一个任务执行机,任务数N<1000,该机器每次只能执行一个任务,而任务之间存在依赖关系,
但是任务之间没有循环依赖,请给出适当的任务执行顺序。算法、伪代码,并分析其时间复杂度和
空间复杂度。

2. 编写函数,统计在某段英文文本中完整句子的数目,文本中只包括大小写字母,空格,点好(.),逗号(,)。
完整的句子必须包含至少一个字母并以点号,结束。
要求:完整的代码,达到目标;高效;简洁;

三、系统架构30分
有一个监控系统,有大量的数据记录包括{url,用户访问ip,时间},要对这个监控系统进行维护,并提供查询。
设计一个能存储和维护1000亿条记录,实时监控,并支持一下两种查询:
1. 指定任意一个时间段(精确到分钟)和某个url,查处这个时间段内的所有url的访问总量。
2. 指定任意一个时间段(精确到分钟)和某个ip,查询这个时间段内的ip访问总量。

面试一
1.自我介绍;结合自己的简历简单地介绍一下。
2.项目介绍;结合自己做主要的项目,以及带的项目介绍资料,互动式地讲解;面试官关系的是机器学习相关的问题。
3.算法题;二叉树的非递归实现前序遍历;
4. 算法设计题;如何去掉重复页面;

面试二
1. 自我介绍;(同上)
2. 项目介绍;(同上)
3. 算法题;(略)问到了一个TTest;
4. 算法设计题;如何对Query进行分类;

面试三
1. 自我介绍;
2. 项目介绍;
3. 算法题两道;
1>一串首尾相连的珠子(m个),有N种颜色(N《=10),设计一个算法,取出其中一段,要求包含所有N中颜色,并使长度最短。并分析时间复杂度与空间复杂度。
2>从1到1亿,所有出现的数字的和(125=1+2+5),手工计算机出来;

我的感受:
1. 是对这次实习招聘,并无准备,笔试能通过已经很意外了;
2. 自己的算法题的解答能力有待提高,面试的时候遇到的题目其实都很常见,估计在网上多看看就都能答得很好了;
3. 百度笔试+三面的流程,大致和网上讲的差不多,前二次面试是类似的,三面可能是补充,并且往往会问道一些你职业规划上的一些问题;

时间: 2024-07-31 08:26:39

百度数据挖掘工程师实习生笔试面试题的相关文章

2013百度校园招聘数据挖掘工程师

2013百度校园招聘数据挖掘工程师 一.简答题(30分)1.简述数据库操作的步骤(10分) 步骤:建立数据库连接.打开数据库连接.建立数据库命令.运行数据库命令.保存数据库命令.关闭数据库连接. 经萍萍提醒,了解到应该把preparedStatement预处理也考虑在数据库的操作步骤中.此外,对实时性要求不强时,可以使用数据库缓存. 2.TCP/IP的四层结构(10分) 3.什么是MVC结构,简要介绍各层结构的作用(10分) Model.view.control. 我之前有写过一篇<MVC层次的

2013网易实习生数据挖掘工程师

2013网易实习生招聘 岗位:数据挖掘工程师  一.问答题  a) 欠拟合和过拟合的原因分别有哪些?如何避免?  b) 决策树的父节点和子节点的熵的大小?请解释原因. c) 衡量分类算法的准确率,召回率,F1值.  d) 举例序列模式挖掘算法有哪些?以及他们的应用场景.  二.计算题  1) 给你一组向量a,b  a) 计算二者欧氏距离 b) 计算二者曼哈顿距离 2) 给你一组向量a,b,c,d  a) 计算a,b的Jaccard相似系数 b) 计算c,d的向量空间余弦相似度 c) 计算c.d的

程序开发-如何成长为一名优秀的数据挖掘工程师?

问题描述 如何成长为一名优秀的数据挖掘工程师? 想咨询在阿里.百度.腾讯等一些企业工作的前辈们,如何成长为一名数据挖掘工程师?我是研一的新生,想在研究生期间努力学习,将来能找一个好工作.但是学生不知道要往哪方面努力.学生基础比较差,现在在练习编程. 1.前辈们能不能给后辈提点建议.怎么去准备,去学习一些什么知识?最好是提供基本好的教材. 2. 数据挖掘工程师需要哪些基本的能力,会哪些技术. 3.求抱大腿,希望有前辈愿意带带我,学生深知喝水不忘挖井人这个道理,本人懂得感恩,是个人品不错的人. 解决

BAT及各大互联网公司2014前端笔试面试题--JavaScript篇_基础知识

而更多的题目是我一路以来收集的,也有往年的,答案不确保一定正确,如有错误或有更好的解法,还请斧正. 附上第二篇:BAT及各大互联网公司2014前端笔试面试题--Html,Css篇 前面几题是会很基础,越下越有深度. 初级Javascript: 1.JavaScript是一门什么样的语言,它有哪些特点? 没有标准答案. 2.JavaScript的数据类型都有什么? 基本数据类型:String,boolean,Number,Undefined, Null 引用数据类型:Object(Array,Da

BAT及各大互联网公司2014前端笔试面试题--Html,Css篇

很多面试题是我自己面试BAT亲身经历碰到的.整理分享出来希望更多的前端er共同进步吧,不仅适用于求职者,对于巩固复习前端基础更是大有裨益. 而更多的题目是我一路以来收集的,也有往年的,答案不确保一定正确,如有错误或有更好的解法,还请斧正. 前面几题是会很基础,越下越有深度. 附上第一篇:BAT及各大互联网公司2014前端笔试面试题--JavaScript篇   Html篇: 1.你做的页面在哪些流览器测试过?这些浏览器的内核分别是什么?  IE: trident内核   Firefox:geck

经典算法(14) 腾讯2012年实习生笔试加分题

之前参加2012年腾讯实习生笔试时,在考场中遇到一道加分题,当时灵光一闪,直接挥笔就解决这道题目 .今天看到学校论坛上有师弟师妹们在询问这题的解法,就写篇博客来分享我的解法吧,也欢迎大家讨论其 它解法. 首先来看题目描述: 三 .加分题 28)给定一数组a[N],我们希望构造数组b [N],其中b[j]=a[0]*a[1]-a[N-1] / a[j],在构造过程中,不允许使用除法: 要求O(1)空间复杂 度和O(n)的时间复杂度: 除遍历计数器与a[N] b[N]外,不可使用新的变量(包括栈临时

数据挖掘工程师的要求

数据挖掘工程师要求如下: 1.计算机.统计学等相关专业,具有深厚的统计学.数学.数据挖掘知识,熟悉数据仓库和数据挖掘的相关技术; 2.掌握Oracle.SQLServer.DB2.SybaseIQ等一种以上的主流数据仓库产品: 3.熟悉Python.C++.C语言中的一种或以上: 4.熟悉BusinessObjects.Cognos.MicroStratety.Hyperion等主流数据仓库前端展现工具:熟练常用数据挖掘工具SAS,SPSS,熟练掌握常用的数据挖掘算法:有较强的数学功底和扎实的统

一名数据挖掘工程师给新人整理的入门资料

一名数据挖掘工程师给新人整理的入门资料 四年前我一次听说数据挖掘这个词,三年前我学习了数据挖掘理论知识,两年前我做了几个与数据挖掘有关的项目,一年前我成为一名数据挖掘工程师,今天我把数据挖掘入门资料整理了一下,希望能够对新人有帮助. 一.python 推荐粗读<Head First Python>一书,该书浅显易懂,有C语言基础的人只需一天就能读完,并能够使用python进行简单编程."Head First"系列的数都很适合初学者,我还读过<Head First 设计

数据挖掘工程师发展方向浅谈

数据挖掘在国外很好 在国内,还处于起步阶段,真正的数据挖掘运用还比较少,找工作也不是很容易,学这个方向的,基本上出来是做数据处理.数据分析,或是有些干脆做软件开发师. 不过有兴趣的话,这也是不错的方向,毕竟,再过上十来年,应该都能发展得起来的.应该说现状艰辛,但前途还是光明的.  如果找数据挖掘的工作,地点也很重要,国内发展比较好的城市是北京和上海,广东也有少数.一般来说,比较大型的企才有投有数据挖掘工程师这个职位,其它企业如果需要,都是外包给专门的数据挖掘公司来做的. 比较能用得上数据挖掘的行