入行十几年了,做了不少分布计算、并行计算、内存计算、海量数据处理的项目,按照现在的分类,这些都属于云计算/大数据范畴。今天说说我做过的其中三个项目,只三个。
第
一个是我们接到的视频分享网站的视频转码的订单,网站名字就不说了,有替人宣传嫌疑。他们情况是这样,视频网站的内容用MP4格式在网页上播放,但是上传
的格式多种多样,我们必须把这些视频统一转换成MP4格式,视频转码的工作想必大家都在自己的电脑上试过,通常一个100M左右的视频转码需要20分钟以
上(CPU是Pentium
IV)。为了提高转码效率,让用户以接近实时得到结果,必须在收完视频后,立即将一个视频拆分成多个单元,分散到多台计算机上进行转码,然后回收所有转码
视频,按照顺序再次组合成一个新视频。我估计现在视频网站都是这个套路。我们这个团队最早是做流媒体起家的,工作没什么难度,轻车熟路,很快就完成了。只
要机器足够多,视频差不多可以以接近实时的状态完成转码。后来又再一次改进,从用户上传视频开始立即进行转码,收到一段转一段,用户的视频上传完毕,我们
的转码工作也完成,用户可以马上看到自己上传的转码后视频,基本上是零延时,并且稳定性、效率都高于对方提出的要求。做完这个,合作方老板很满意,接着又
给了一个CDN的项目。现在我们仍保持着合作的关系。
第二个有点玄乎,
项目可以写一篇论文,题目是《关于空中移动目标运行轨迹和落点的问题》。这个项目是XXX发下来的,实质就是炮弹打导弹,大概是想看看能不能打着,论证技
术可行性。当时人还在某单位,因为研究领域和空气动力学毫不相关,所以这方面的知识基本属于文盲,知道的也就是那么几个有限的名词和数学公式,但是这正好
符合XXX的要求,不需要我们懂这些高深的理论,他们派人和我们合作这个项目。我们的工作就是把很多传感器(他们没明说,但是地球人都明白这东西应该是雷
达)接收的数据,包括当前多少公里范围内的空气的风速、风向、地表的曲面率,还有其它一些指标在收集后(这些瞬间产生的三维数据的数据量非常大),分散到
一大堆计算机上去执行(测试时准备了100个节点),并且要很快计算出结果(必须比空中运动的目标快)。这其实和现在的SPARK、STORM做的工作很
象,要依赖大内存、高性能CPU、和高速网络,跳过硬盘这个瓶颈,才能得以实现快速计算。这个项目花了很长时间,主要是与合作方的沟通改进,然后是再沟通
再改进,循环往复,周而复始。后来终于完成了,据说做了试验,可行性很高,上面领导很满意,还摆了庆功酒。反正我没见着也没喝着。其实他们怎么计算的,我
到最后也没有搞明白,问过一次,说是秘密。
第三个和两桶油的页岩气有关。当
前的背景是在四川涪陵(这个地方还产榨菜)发现了大面积的天然气,按照自然规律,油气是共生的,所以两桶油想通过采集页岩样本,分析这个地区地下有没有石
油资源,如果有,是不是具有开采价值。这套程序原本已经是有的,艾克森.美孚石油公司开发的,跑在CARY-1向量机上。那套机器是上世纪七八十年代的超
级计算机,在当时已经不能满足需要,属于进博物馆之列。有些数据分析理论已经过时,需要调整。两桶油最不满意的还是速度太慢,计算一次要几小时几天才能出
结果。这一次又是合作,两桶油出熟悉采油的技术专家,我们出并行计算的码农,前前后后合作弄了大半年,算是完成了。这次我们用了新的并行算法,效率提高了
一大截。和上次炮弹打导弹一样,整个项目静悄悄开始,静悄悄结束,后面怎么样就不知道了。
说说这些年做的云计算和大数据项目
时间: 2024-12-27 14:34:42
说说这些年做的云计算和大数据项目的相关文章
纯干货!如何做一个成功的大数据项目
1.失败大数据项目的特征 根据在美国做了15年的大数据项目.产品研发和管理,以及其它一些相关的数据分析的工作经验,了解到的其它的做的比较成功的和失败的项目,跟大家做一个经验分享.基本上大数据项目失败的特征主要是五个: 一是大数据项目与企业战略脱节,完全是领导或者是不知道那个部门的决策人突然脑子一热,就说别人在用,我们也做一个,根本没有把该做的项目和企业的商业战略.科技战略等各个方面结合起来.在项目无法与战略协调,无法在战略的指导下做一款产品或者是服务项目的时候,失败的可能性会非常大. 二是大数据
云计算、大数据能为反恐做什么?
文章讲的是云计算.大数据能为反恐做什么,11月25日召开的国家反恐怖工作领导小组专题会议上,公安部部长郭声琨提出,要运用大数据.云计算技术打击恐怖行为."从海量的人流.物流.信息流.资金流中及时发现涉恐线索,做到预警在先.预防在前.敌动我知.先发制敌." 大数据如何反恐呢?全球各国的成功经验值得借鉴.8月底,美国国防部长卡特(Ash Carter)赴硅谷招募顶尖科技人才.近年来的信息大爆炸使得五角大楼不得不将目光聚焦高科技硅谷,以打击反恐.美国中央情报局的CTO Gus Hunt则表示
快速理解云计算与大数据之间的关系
如今一家优秀的互联网公司肯定的是拥有数据运营的公司,反之,不能从数据中获取利益的互联网公司的就不是云计算应用者.互联网.云计算以及大数据,如今成了三个密不可分的词汇.更进一步,挖掘数据价值很多企业都会做,但如果不能用最低成本得到数据价值,企业同样活不下去.把数据以低廉成本变成财富的东西就是云计算.从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分.大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构. 那么,云计算是如何帮助大数据将一堆堆杂乱信息转化成经济效益的呢? 首先,
[阿里研究院]“互联网+”的动力:云计算、大数据与新分工网络
"互联网+"的深刻内涵 普适计算之父马克·韦泽说:最高深的技术是那些令人无法察觉的技术,这些技术不停地把它们自己编织进日常生活,直到你无从发现为止.而互联网正是这样的技术,它正潜移默化地渗透到我们的生活中来.所谓"互联网+"就是指,以互联网为主的一整套信息技术(包括移动互联网.云计算.大数据技术等)在经济.社会生活各部门的扩散.应用过程.互联网作为一种通用目的技术(General Purpose Technology),和100年前的电力技术,200年前的蒸汽机技术
从网格计算、云计算到大数据---这是场进化论
他是IBM IT技术创新者最高荣誉IBM Fellow的获得者;他领导过IBM"网格计算"战略;他是EMC公司院士及杰出工程师评估委员会的创始人和主席;他在EMC设定技术方向上扮演着重要角色.多年来, 他一直走在IT技术变革的最前沿,他就是EMC高级副总裁及CTO Jeff•Nick.近日,Jeff•Nick先生接受了Watchstor独家专访,畅谈了对云计算.大数据等热门技术的看法. 从网格计算.云计算到大数据---这是场进化论 回顾过去十余年的IT发展历程,网格计算.云计算和大数据
中国工程院院士高文:运用好云计算、大数据会为城市发展带来变革
5月19日,由中国电子学会主办,ZD至顶网协办的第八届中国云计算大会进入第二日程,国家自然基金委副主任.中国工程院院士.中国大数据专家委员会副主任委员高文在全体大会上带来了"大数据分析与智慧城市建设"的主题分享. 高文表示,"现在云计算.大数据也好,把数据挖掘出来,实际上会对我们整个的社会也好.城市也好带来很多好处.所以把大数据用好了,实际上对整个城市的生活,会带来很多变化." 以下是高文演讲实录:(以下内容根据现场速记整理,未经发言嘉宾确认,仅供参考,谢绝转载.
王坚:云计算和大数据,你们都理解错了
王坚,阿里巴巴最富争议性的人物之一,爱者极爱,恨者极恨. 5月12日,我和MTC的朋友,在杭州发起并主持了一场关于云计算的沙龙,虾米的思践聊了云音乐,快的打车陈伟星聊了云时代的产品设计,短趣网王强宇聊了云时代的创业,当然少不了王坚聊一聊他对云计算的看法. 当天,青龙老贼发了一段王坚的部分观点,遭遇了他开通微信公众号以来最强烈的退粉,也激起了圈内人的各种讨论,这就是王坚的"影响力". 我把王坚的分享做了个第一人称详细版的梳理,里面涉及了阿里云的定位.对大数据的反思.对APP创新的不看好,
谁掌握云计算和大数据,谁就掌控未来
河南 互联网用户全国排第六,中部排第一 昨日,河南省首届互联网大会在郑州国际会展中心隆重 举行.大会由河南省通信管理局.省互联网协会主办,主题为"信息编织美好中原经济区,网络构筑智慧郑州航空港". 昨日的会议还发布了<河南省互联发展状况报告>.截至2013年7月底,河南省互联网用户总数达到5248万户,全国排名第六位,中部排名第一位.备案网站总数15万个,全国排名第八位,中部排名第一位.互联网呈现出快速发展趋势,用户数和业务量增长迅猛,互联网基础设施建设加快推进,应用日趋广
云计算和大数据行业:了解其中真实的谎言
云计算领域投资中有太多真实的谎言,需要我们建立理性的分析逻辑:现实投资世界是大量的谎言当中包含着极少量真实.全局来看,投资真的与买彩票类似,中奖概率极低,不仅仅是中国A股,其实美股也是如赌场一般,很难轻易实现可观的投资盈利.我们从行业未来的发展趋势出发,是可以提高胜率,分清楚什么是真实,什么是谎言,而后积极参与到谎言破灭之前的阶段,坚定持有真实部分. 我们希望能够梳理云计算和大数据行业发展逻辑,整理行业内技术.市场等各方面问题,从最简单的逻辑出发,找寻投资价值. 横看成岭侧成峰,云计算大数据一体