服务器开光师是个什么鬼?TalkingData的研发面试题目

TalkingData是一家对数据有信仰的公司,致力于用数据去改变人们做决定的方式,并帮助人们更加了解周围的环境。

4年坚守大数据的前沿阵地,我们遇到无数的挑战。这里我们也向如下有志之士发出邀请,有意者请发简历至wenfeng.xiao@tendcloud.com:

  • 大数据工程师/架构师
  • Java开发工程师/架构师
  • Html5/web前端开发
  • iOS/安卓SDK开发
  • 机器学习研究员
  • DevOps/运维开发
  • 程序猿鼓励师
  • 服务器开光师

对于这些职位,我们通常有如下的面试题目。

大数据工程师

1. Hadoop集群的namenode上,当meta数据损坏之后如何修复?数据的丢失率是怎样计算?

2. 目前需要对100台服务器做RAID ,有什么方式能够通过自动化的方式实现?

3. 有超过10亿行的数据,每行第一列为唯一ID列,其余列为数值型列,假设数值型列分别为A,B,C,D,请问如何高效的实现一个算法能够完成:

1) 某一列数值符合在某个区间的范围内的记录的条数

2) 某一列数值符合在某个区间同时另一列数值在某个数值区间的记录的条数

4. 某广告主在渠道投放每天有大量点击数据,包含每个点击的IP信息。请基于IP信息设计防止渠道作弊的算法和思路。

5. 一个url文件,每行是一个url地址,可能有重复。

(1)统计每个url的频次,设计函数实现实现。

(2)设有10亿url,平均长度是20,现在机器有8G内存,怎么处理,写出思路。

6. 20个亿整数的两个集合a与b,求a与b的交集,内存为4Gb

7. 在N个无序数中找K个最小值

8. 一个流式输入序列(method_name, latency),其中method_name大约有100万种,latency的取值为1到10亿的正整数,每天的数据量大概100亿条。限制最多 1GB的程序运行内存,设计一种方法,计算一天内每个method_name的50%,95%,99% percentile的latency,误差不超过5%。

Java开发工程师

1. 抽象类和接口有什么区别

2. 请说一下java中的内存回收机制所采用的算法

3. Sleep()和wait()有什么区别?

4. 请列举几种排序算法,并用JAVA实现快速排序算法。

5. 36辆车,6条跑道,无计时器,最少几次比赛可以选出前三

6. 一个未排序的整形序列,比如10,20,3,7,5,9,4,2,90,给出这些数字当中最长连续数的长度,例子中的长度是 4[2,3,4,5]。算法复杂度最好为O(n)

7. 两个线程,一个运行B.m1(),一个运行B.m2(),这个程序可能的行为有哪些?

Class A{
    int f;
    A(){f = 1;}
}

Class B{
    A a;
    void m1(){a = new A();}
    void m2(){if(a != null) System.out.println(a.f);}
}

8. 在N个无序数中找K个最小值

C++开发工程师

1. new 和 malloc 的区别

2. 用C/C++写一个归并排序。

数据结构为struct Node{int v; Node *next};

接口为 Node * merge_sort(Node *);

3. 一个url文件,每行是一个url地址,可能有重复。

1)统计每个url的频次,设计函数实现实现。

2)设有10亿url,平均长度是20,现在机器有8G内存,怎么处理,写出思路。

4. 进程间的通信方式

5. 20个亿整数的两个集合a与b,求a与b的交集,内存为4Gb

6. 在N个无序数中找K个最小值

机器学习研究员

1. 什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。

2. Pca的概念和处理过程(主成分分析)

3. 中文分词技术简介,常用数据结构和算法

4. 如何建立一个智能问答系统,思路

5. 如何建立一个智能商品推荐系统,思路

Html5/web前端开发

1. 实现输出document对象中所有成员的名称和类型。

2. 写一个去掉数组里的重复成员的程序。比如去掉上面题中刚生成数字序列里面的重复项;

3. 请谈一下HTML和XHTML的区别。

4. 你对Web标准的理解?

5. 浏览器兼容性,谈谈你经常使用的浏览器,和各个浏览器兼容的问题?

6. 页面图片加载太多,一般如何处理?如何合并图片,请写出你的代码?如何延迟和预先加载?
大数据程序猿鼓励师

限女,颜值高,大家都理解,不再赘述:


服务器开光师

对于大数据行业来说,开光师的作用日趋凸显,这就是为什么有的服务器服务超期依然运行稳健,有的新买刚上线就存储故障。根据职能开光师分为软件专攻和硬件专攻,通常必须掌握至少一门宗教开光仪式,自备仪式礼服。因为涉及跨界,此类人才目前稀缺,培养不易。

鉴于目前安全形势日益严峻,TalkingData决定在北京卧佛寺和成都青羊宫新建数据中心做异地容灾,因此掌握多项技能者优先。

本文作者:佚名

来源:51CTO

时间: 2024-09-13 13:21:44

服务器开光师是个什么鬼?TalkingData的研发面试题目的相关文章

云架构师:云端的舞者

作者:陈晓炜   链接:http://www.cnw.com.cn/industries/htm2012/20121203_259648.shtml 2012年12月03日 13:32分         作者:高杨      来源:网界网 摘要:以云为基础的各种创新开发和实施的带头人,负责确保系统的可扩展性.可靠性.安全性.可支持性,以及实现业务.IT性能和预算等各项目标.关键字:云架构师   也许你未曾听说过云架构师,但提起云计算相信一定不陌生.灵活配置资源.有效节约成本.提高设备使用率等是云

AppliedMicro展示64位ARM服务器芯片

[天极网服务器频道6月5日消息]近日,ARM服务器芯片制造商AppliedMicro公布了其X-Gene 2和X-Gene 3 ARM服务器芯片细节,AppliedMicro第一代64位X-Gene低功耗ARM芯片将于3721.html">2014年年底用于服务器.AppliedMicro已经证明该服务器芯片支持OpenStack.Memcached和其他的关键Web应用.AppliedMicro主要的ARM服务器对手是AMD,后者已经发布了首款64位ARM处理器Seattle交付用户测试

看上去很美:国产服务器变革初显锋芒

日前,据媒体报道,国产服务器领军企业--浪潮服务器在2007年上半年取得了重大销售突破,已经连续两个季度相较去年同期保持40%以上的增长率.这是浪潮集团一体化运营整合之后的首份成绩单.由此,国产服务器一场由内而外的主动变革,悄然拉开了序幕-- 看上去很美 服务器市场历来是兵家必争之地. 在90年代,这个领域几乎被国外厂商完全垄断:近几年来,国产服务器.特别是PC服务器经过艰难打拼,终于抢下接近半壁江山:以浪潮和联想为首的中国品牌甚至一度挤入全球服务器市场前十名--可以说,国产服务器已经在激烈的市

弹性计算峰会及神龙云服务器深度解析回顾

10月13日上午,云栖大会弹性计算全新企业线峰会主要内容有对弹性计算做了全面的精彩总结和产品细节分享,议程里发布了这个时代的新物种"神龙云服务器",当日在阿里云官网首屏神龙云服务器也同步发布上线,峰会现场研发总监张献涛对神龙云服务器做了深度解析,并在圆桌讨论环节为观众做了解答. 蒋林泉认为:"阿里云ECS是全世界最快的云主机." ECS超级稳定 背后的秘密是强健的IDC基础设施+飞天大规模智能运维能力:飞天自研领先核心虚拟化技术+业界最新的硬件架构,其中计算虚拟化核

信维服务器防氧化解决方案 从容应对金手指氧化难题

随着学校云计算市场蓬勃发展,VDI,HPC,HCI等应用使得服务器在学校场景使用的越来越多.而随着使用的数量的增加,众多校园云解决方案提供商发现在某些省市,或者暑假结束后服务器出现巨大比例不能正常开机现象.为此,信维做了大量调研发现大量二线城市以下学校,教室环境不好(如图1),粉尘,风沙很快积累在服务器内部.(如图2图3) 图1图2图3 对这些服务器在我司实验室进行故障分析发现,导致不能正常开机的大部分症结在于服务器内存/扩展卡出错,无法识别,将不同服务器报错的内存取出进行EDS(Energy

英特尔新款至强7500处理器多路x86服务器应用现状

最近,多路x86服务器颇有看点.随着英特尔新款至强处理器7500(代号Nehalem-EX)的上市,各服务器厂商也陆续跟进,推出了新一代基于x86架构的多路服务器,例如IBM x3850 X5.惠普的DL580 G7和DL 980 G7.戴尔的R910和R810.浪潮8路服务器天梭TS850和4路NF8560等.更高端的多路服务器,如16路.32路的多路服务器由于应用面比较窄,本文不予涉及. 从应用上来看,中国科学院计算http://www.aliyun.com/zixun/aggregatio

摆脱对PC、服务器的依赖,英特尔“悄悄”在人工智能布下两颗棋子

科技公司的年度大会有两种,一种是推出普通消费者日常生活使用的用品,如苹果一年一度或一年两度的iPhone 发布会,另一种则是针对技术开发者发布的SDK.API.开发套件等,一如英特尔的开发者技术大会 IDF. 如果说苹果的发布会讲述的是当下最好的软硬件集成,那么英特尔的发布会则是探讨未来的各种可能. 这其中,最让业界关注的恐怕还是英特尔打算如何切入当下最火的人工智能领域.放眼业界, 人工智能成为当下技术公司发力的方向.AlphaGo 用一场完胜将 Google 深度学习推进人工智能的野心展露无疑

浪潮推出国内首款自主设计大型服务器

近日,浪潮正式推出了国内第一款自主设计的大型服务器---天梭TS850,标志着我国已经具备自行设计.研制和生产大型服务器系统的能力,并实现了与国际先进水平的同步.大型服务器是云计算的核心硬件设备,该产品的成功自主开发为我国自主掌握云计算基础.实现国家信息安全可控将发挥重要作用. 浪潮天梭TS850大量采用紧耦合共享内存.硬件分区等高端服务器技术,按照业界最高标准设计,可以支持8颗64核心处理器,1TB的DDR3内存.同时,该产品还采用多种可靠性设计,如计算链路全冗余.故障自动切换技术以及多种可信

我国首款自主研发大型服务器面世

本报讯(实习生杨婷 记者雷宇)国内第一款自主研发的大型服务器--天梭TS850近日面世.这标志着我国已经具备自主设计.研制和生产大型服务器系统的能力,打破了国际跨国公司的长期垄断. 作为信息产业的核心设备和"云计算"的核心硬件设备,大型服务器研发属于大型高科技系统工程,具有高投入.高风险等特点,目前只有几个国际巨头具备自主研发能力.天梭TS850大量采用紧耦合共享内存.硬件分区等高端服务器技术,各项技术指标达到国际领先水平,能满足金融.电信.能源等国民经济关键行业对信息化7×24小时不