面试总结-百度(2)

百度数据挖掘部门

     跟一面隔了差不多一个星期,收到了二面的通知,这次不是去百度大厦,是去科技园。第一次来科技园,发现这里还是一片工地,有很多大的IT公司,看到汉王科技、IBM之类的。

     面试官是一个三十五岁左右的一个看似像是部门leader的人。拿着电脑,边面试边处理工作,氛围比一面的时候轻松了许多。先是问了下基本情况,比较感兴趣实验室是做什么的。然后指出了我在一个项目中使用的机器学习的错误,一看就是行家。一直微笑着提各种尖锐的问题。了解大致情况后开始做题。

题目

(1)数据处理题目

       

        已知n个顺序打散的用户行文,ID(qq号),状态(1表示上线,0下线),时间。已知0时刻再现人数是x个,求第1时刻的人数。

答:这道题其实很简单,建立一个数组,每两个时刻区间内,上线就总数加一,下线就减一。

一开始我没完全领会到意图,采用的方法是求得每个用户的上线时间区间,然后再找到1时刻上线的人。经过提示,想到的跟正确答案类似的结,但是因为我没说是用数组存,我说用list,空间复杂度大了一些。

(2)推荐栏

       假设搜索的词是“刘德华”,你该怎样推荐边栏的推荐人物。

答:以下是我的答案,判断重名的可能性,找到是哪个“刘德华”,根据搜索频率可以判断出来。

(1)然后给用户打标签,“歌手”、“演员”等,推荐相关条目下的高热度人物。

(2)接着遍历相关时效性新闻,找到同时出现的关联度高的人物。

(3)遍历此人出现的网页,找到关联人物。(期间问了如何去噪,比如编辑小王这种,我的回答是可以找到网页的第一段内容判断,还有就是根据比例,尽可能多的遍历网页)

(4)根据贴吧、微博信息,个人媒体

(5)根据其它也搜索“刘德华”的人的搜索结果,也就是一种针对用户的协同过滤。(答上这个他很满意)

(6)这条是他加上的,我没想到。根据用户的点击反馈,他搜完刘德华,又点了什么人,就推荐什么人。

经验是,不要装逼,踏实的想怎么实现需求,花哨的代码没用,主要是效率要高。另外就是,脑子要快,顺着提示往上爬。

/********************************

* 本文来自博客  “李博Garvin“

* 转载请标明出处:http://blog.csdn.net/buptgshengod

******************************************/

时间: 2024-10-02 17:02:34

面试总结-百度(2)的相关文章

php程序员面试之百度面试题

据说是一个百度php的面试题,已给定一个数组: $arr = array('b'=>'a', 'c'=>'a', 'e'=>'b', 'd'=>'b', 'f'=>'c', 'g'=>'e', 'h'=>'f'); 写一个算法,完成到以下格式的转换: array (     'a' => array (         'b' => array (             'e' => array (                 [0] =&

阿里、百度、搜狐等公司社招面试记录与总结(转)

这个跳槽季大概面试了近十家公司,也拿到了几个Offer,现在面试告一段落,简单总结下面经,我现在主要的方向是Java服务端开发,把遇到的问题和大家分享一下,也谈谈关于技术人员如何有方向的提高自己,做到有的放矢. 一.面试遇到的问题         1.百度   百度最近真是炙手可热,贴吧事件刚结束,医疗竞价排名又闹得沸沸扬扬,一些论坛上连带程序员都开始招黑了,友谊的小船可是说翻就翻. 说回面试,百度面了两次,分别是百度糯米和金融事业部,百度目前只有这两个部门的招聘岗位和我比较匹配. 面试都在西二

李彦宏有机管理解读:百度多数战略并非一步到位

作为中国创造型和知识型企业的代表,百度在创始人兼CEO李彦宏的带领下,从一家只有7个人的创业型公司,发展成在中国的搜索份额超过7成的全球最大中文搜索引擎.李彦宏在经营管理上有自己的独到之处,他的有机管理模式,在百度发展过程中起了很大作用. 有机管理,指的是企业组织在学长式(君子型)的核心管理者领导下,以使命与文化驱动为组织发展的原动力,管理者制定有中心使命.同时随着环境变化而有所调整的战略,充分调动员工积极性,在开发员工潜能的同时实现组织核心目标. 在实行有机管理模式的企业中,组织与组织成员间是

[C/C++基础知识] 一篇就让你彻底搞懂qsort快速排序的文章

        最近在做LeetCode的题目.面试和笔试后发现经常考察快速排序的知识.通过这篇文章介绍,能让你彻底的了解和学习快排,主要从一下三个部分进行介绍:         一.C语言实现qsort快速排序         二.快速排序的原理及手写快排源码         三.LeetCode关于Two Sum的快排实现 参考文献:        <算法分析与设计>关于分治法那章内容         如何利用C语言中的qsort库函数实现快速排序 - by:stpeace        

"技术型产品"和"前端型产品"的认知

近日在换工作,先后面试了百度云和百度安全的相关岗位,最后因为非常可惜的原因,跟百度安全失之交臂.经过总结,自己认为主要的原因就在于 "技术型产品"和"前端型产品"的认知,特写出来跟互联网的各位产品经理做一下分享. 一.个人介绍: a.毕业四年,互联网工作经验,大于五年. b.客服.技术支持.市场.服务器采购和运维.产品.项目总负责人等等,都干过... c.就产品经理的岗位而言,基本素质和能力没问题,但是没经过专业的训练和磨练(比如写文档,虽然能写,但是不一定有大公司

百度前端笔试面试7个试题

1.    JavaScript包括哪些数据类型? 我回答的是有两种:基本类型和对象,其中基本类型包括数字.字符串.布尔和null:对象(类似对象),包括数组.函数.内置对象.自定义对象.不过按理说字符串也有些对象的特点. 我这个回答是参考的JavaScript权威指南的,有些小问题,第一类中缺少了undefined. 搜索了下,网上还有几种回答: 第一种:共九种类型:1.未定义(undefined) 2.空(null) 3.布尔(boolean) 4.字符串(string) 5.数字(numb

面试经之一道淘汰85%面试者的百度开发者面试题

本文在再次更新,感谢@PhoneGap提供另一中解题思路,,感觉那个方法也挺好的,大家可以看一下第三种解决方案.. 刚在网上看到一篇文章,标题为 一道淘汰85%面试者的百度开发者面试题,感觉好难的样子,就默默的进去看了一下,首先来看一下原题吧. 题目描述: 依序遍历0到100闭区间内所有的正整数,如果该数字能被3整除,则输出该数字及'*'标记:如果该数字能被5整除,则输出该数字及'#'标记:如果该数字既能被3整除又能被5整除,则输出该数字及'*#'标记. 提示: 这道看似非常简单的题目,却潜藏着

百度无人车团队测试开发面试

百度无人车测试开发面试总共分为三轮,前两轮是技术面试,第三面是部门经理面试.前两轮面试一轮一小时,第三轮面试采用电话面试. 第一轮面试:刚开始让写一下基础的数据结构:队列.栈.堆:其次写一个自己最熟悉的排序和查找算法.我写的是快排和二分查找,期间还出现了错误,针对这两个算法优缺点进行对比:接下来问的python里基础的数据结构,dict.list.tupple.set的特点和区别,以及适应场景,python装饰器:OSI七层模型以及对应的协议,强调网络层和数据传输层:对测试的理解,常见的软件测试

一个五年 Android 开发者百度、阿里、聚美、映客的面试心经

花絮 也许会有人感叹某些人的运气比较好,但是他们不曾知道对方吃过多少苦,受过多少委屈.某些时候就是需要我们用心去发现突破点,然后顺势而上,抓住机遇,那么你将会走向另外一条大道,成就另外一个全新的自我. 先简单说说我最近的面试经历吧.面试的公司很多,其中有让我心血沸腾的经历,也有让我感到失望到无助的经历,我将这些体会都记录下来,细想之后很值得,面了这么多公司,要是最后什么也没有留下来,那就太浪费了.至少对于我来说有些东西在整理总结之后才能得到一个肯定的答案.希望这些能对即将换工作或者打算看看机会的