无痛减肥黑科技:拍照识热量

一直以来,横亘在减肥塑身的志士仁人面前的除了坚定的意志还有一道很难逾越的坎:每天的摄入热量怎么算?

对于统计每天步数和大致热量消耗的设备,我们有手环、watch、手机;但每天的热量摄入,怎么计算呢? 每次就餐带上纸、笔、记算器,不太现实。用热量计算app,需要手动输入每样食品吃了多少克,没有厨房称的帮助下,对大多数人来说,要感知50g和75g的区别比较困难。

当AI作为一个形容词,几乎可以应用在任何领域的时候,减肥这个领域,似乎还没有被充分开垦。

iDST数据实验室的算法同学,正致力于做一个小小的改变:

帮助用户,通过拍一张照片,识别照片里包含的食材和对应的营养成份;通过选择对应的份量,还可以算出大致热量。

到目前为止,已实现对大部分常见的食物:中餐各式菜肴、面点、水果、饮料的识别,覆盖了几千种南北食材。目前,该模型已经上线内测,我们也会努力尝试成为减肥界的一股清流。

ps,如果正在减肥的同学想抢先上手尝试,请直接拉到页面底部试用~

 

让手机镜头,识别面前的每一种食物,输出它们的营养、热量和做法,我们是怎么做的?

一、数据收集和处理:

首先是大量的数据收集和知识库的建设。
我们通过各类网站:搜索引擎、点评和外卖、淘宝商品和用户评价、获取了几千万张食物相关的图片。
根据解析到的实体标签以及映射到后台的知识库,把所有的图片分成对应为后台食材的3000个左右的叶子类。从实拍集和训练效果的角度,保证每一个叶子类有至少2000张以上的训练数据。

二、训练框架和方法:

食材识别的难点在哪里?

与通常的图像分类算法相比,通过拍照识别食材并估算热量是一个异常艰巨的任务。因为烹调食品是一个复杂且漫长的过程,期间各种食材会经历多种物理和化学甚至生物变化。

例如,刀工会使得食材发生物理变化。即使是标准的刀工,也会将原先的食材加工为片、丁、丝、条、茸、段、麦穗型、梳子型、菊花形、米状、末等完全不同的形状。即便是同样的片状,还会细分为指甲片、柳叶片、月牙片、骨牌片、象眼片、马牙片、秋叶片等不同的模样。形状的多变无疑增加了识别的难度。

烹饪中的化学反应进一步增加了识别的难度。例如,随着烹饪过程中化学反应的发生,食材的颜色通常会发生变化,有些食材的颜色会与烹饪之前有很大的反差。

有些食材例如蛋白质会从液态变为固态,有些水溶性的食材会从固态变为液态。涉及到发酵等生物反应的烹饪过程时,食材会进一步变的面目全非。

在实际的识别过程中,有些食材只露出小小的一角,而有些菜,如水煮鱼,看到的是上面的鱼片,用户会希望模型还有对应的知识,即鱼片的下面,其实铺满了豆芽。

由此,食材的识别和通常的图片识别和分类算法相比,有更多的困难。

我们的方法

针对食材识别的问题,我们的方法是:使用深度学习的方法,将黑盒的神经网络与白盒的烹饪领域知识结合起来,同时确保训练数据的数量和质量。

我们综合评估了:GoogleNet, AlexNet, VGG, GoogleNet+BatchNorm 以及Caffe和TensorFlow,从Top5 ACC (输出的前5个结果的准确率)的角度,上述框架没有存在显著的差异性。目前我们采用的是Caffe以及GoogleNet 和 ImageNet,更多的是从工程的可伸缩性,支持并发部署的角度来考虑的。

三、挑战和业界评测:

在饮食领域的图像识别和分类上面,业内一直有关注和研究,比如下面的paper:

Deep Learning Based Food Recognition 
DeepFood: Deep Learning-based Food Image Recognition for Computer-aided Dietary Assessment 
ChineseFoodNet: A large-scale Image Dataset for Chinese Food Recognition 
NutriNet: A Deep Learning Food and Drink Image Recognition System for Dietary Assessment
ChinFood1000: A Large Benchmark Dataset for Chinese Food Recognition
Learning Cross-modal Embeddings for Cooking Recipes and Food Images

对上述paper中的方法进行比较,基本上是 基于AlexNet,Vgg,Gnet,ResNet,今年CVPR的DenseNet做修改,细节有差异。

从数据集和分类目标两个层面,在启动之初,我们就站在比目前业界更高的起点上。 

上面是几个用于做公开测评的通用数据集的数据情况,我们可以看到上述通用测试集的分类较少,每一个分类的样本数量相对均匀。从千万级的数据规模和过千的分类数量上看, 我们的数据规模是比较庞大的。

从分类目标上,我们首先识别食材(而非菜名),进而解析出营养成分和热量,从场景上能够较完整地反映用户健康和饮食习惯。从食材的数量和烹饪方式上看,中餐的识别相较于西餐要困难,识别食材又比菜名更困难。

识别效果评测,目前业内的最好成绩是:


数据集名称


分类数量


数据集大小


准确率


备注


Food-101


101


101,000


88.28%


基于GoogleNet


UEC FOOD 100


100


9,060


81.45%


日餐为主


UEC FOOD 256


256


31,397


76.17%


基于GoogleNet


UNIMIB 2016


65


3616


86.39%


基于AlexNet


Paper作者自有集


520


220,000


86.72%


 


Paper作者实拍集


520


200


55%


 

从目前结果上看,我们的效果远远领先于MIT的CSAIL和业内在食物(中餐)上识别能力。

四、拍食物有什么用 

对大家日常饮食有什么用? 

当食物的营养和热量识别,简化成只需要轻点拍摄这一步之后,我们可以帮助用户记录日常的饮食摄入。

有了日常记录以后,可以从膳食结构角度,帮助用户分析摄入的营养和食材的均衡情况,基于中国居民膳食指南,同时参考美国、日本等居民膳食指南,给出饮食建议。这就是营养师口中的“营养干预”,帮助减肥、增脂、增肌都是这个范畴。

You are what you eat,人的健康除了先天、环境因素之外,最大的影响因子就是饮食习惯。

从模型训练和算法的角度,当学会识别食材以后,后续将学会识别菜谱名称,从而告诉你做法,以及,从千万个淘宝和天猫商品中,根据菜谱为你选出:主料、辅料、佐料。

从此以后,正确的美食打开方式应该是:

输入菜肴名称,看完菜谱做法以后,根据算法为你准备好的:主料、辅料、佐料,轻触点击,一键加入购物车。等着食材送上门以后一显身手吧。

切换成线下,到菜市场买菜也没问题,打开手机,拍一拍面前的生鲜食材,它叫什么,营养元素和热量,有哪些做法,可以搭配哪些食材一起烹饪,即时为你呈现。

 

作为iDST图像识别能力的输出,拍美食是“万物识别”项目的一部分,目标是致力于让AI使我们的生活越来越美好。如果希望体验上述技术,快捷传送门:

亲问app二维码

时间: 2024-10-01 07:40:07

无痛减肥黑科技:拍照识热量的相关文章

阿里NASA黑科技“麒麟”露面 打破能耗对数据中心制约

今年3月,阿里巴巴宣布启动"NASA"的计划,面向未来20年组建强大的独立研发部门,建立新的机制体制,为服务20亿人的新经济体储备核心科技. 4月26日的云栖大会·南京峰会上,NASA计划的最新黑科技,一款低能耗数据中心方案首次露面. 该方案基于全浸没的服务器------麒麟.通过把整台服务器浸在液体里循环冷却,数据中心可以无需使用空调,能源使用率(PUE)逼近了理论极限值1.0. 这是"麒麟"数据中心解决方案首次公开展示,这种耗能极低的技术方案将应用于阿里云服务,

阿里NASA黑科技:将服务器浸入“水”里

说起麒麟,第一反应都是神兽.传统神话.祥瑞--而当有一天,一匹暗含"才能杰出.德才兼备"意味的神兽开始与黑科技结合在一起,你敢想象这画面吗? 对于黑科技大户阿里云来说,"想"只是小菜一碟,毕竟他们不仅敢想还敢做!这不,在4月26日的南京云栖大会上,阿里云就亮出了这匹神兽--"NASA"计划的重要组成部分:"麒麟"! 阿里NASA黑科技:将服务器浸入"水"里 "麒麟"是阿里巴巴推出的全球首

WiFi黑科技? 麻省理工用WiFi穿墙认人

黑科技往往是指超越现今人类科技或知识所能涉及的范畴,同时缺乏当前的科学根据或违反自然原理的科学技术或者产品,但却又让人感到相当炫酷的产物.近日,麻省理工学院(MIT)计算机科学和人工智能实验室就对外发布了一项在一般人看起来有些"黑科技"意味的技术--用WiFi来识别人. 麻省理工学院利用WiFi可以监测人的呼吸频率和心率 据悉,麻省理工学院设计出一套名为"RF-捕获器"的装备,并开发出一种可以识别人体轮廓的软件.通过这种捕获器有目地的收发无线信号,进而分析反射信号,

可穿戴在线展首日巡礼:剖析产业痛点 直击黑科技新品

OFweek可穿戴设备网讯 7月20日,"2016中国可穿戴在线展会"正式拉开帷幕,吸引了欧司朗.赛微微电子.大联大控股.汇顶科技.敦泰.日图科技等产业链上游企业和埃微.握奇.欧德蒙.豚鼠科技等知名整机厂商参展.美女主播.教授演讲.产品在线展示和免费申请等吸引了众多人士观展. 此次在线展不仅为展商切实省下了一笔昂贵的参展费用,无限放大企业的商务视野和交易区域,又为观众和采购商免去舟车劳顿之苦,大大节省商务考察.谈判.交易的时间成本,为供求双方构建一个沟通交流和有效商贸的强大平台.通过提

探秘视频编码黑科技,窄带高清2.0视觉模型及场景实战

"黑科技"这个词已经成为了今年云栖大会的关键词.那么,在我们熟知的视频领域,什么才算是黑科技呢? 我们知道,在通常情况下,视频画质越好带宽费用肯定越高,带宽又是视频服务中占比很高的一项成本,很多开发者都在寻求效果与成本的平衡点.那么,有没有一种技术,能够在保证甚至提高视频画质的同时,降低带宽呢?如果有的话,小编觉得这一点可以算是黑科技了吧. 今天,小编就带大家来了解下刚刚在云栖大会上重磅发布的阿里云窄带高清2.0,看看它是如何超越压缩极限,在视觉效果和带宽成本中找到平衡的. 首先,我们

阿里程序猿用这些黑科技欢迎年会

有人在后台问小编,听说你们要搞一场黑科技年会,敢不敢秀一个看看.当然敢,你们等着. 先来一张小编的黑科技年会现场自拍 现场我们要给现场四万名小伙伴发放IoT手环,现场每人带着手环作为全场的一个像素点,共同协作形成动态大图,橙子有点小傲娇的表示,我们要集体摆拍一张30000平米的.世界上最大的无线大合影. 今天咱们西溪园区也惊现超酷炫的阿里巴巴互动展,程序猿要用黑科技欢迎年会,非常因吹斯汀,小编带你们瞅瞅. 喏,未来试衣镜,镜子可以复制一个"你",你能看到"她"帮你试

如丝般顺滑的2017阿里双11黑科技曝光

2017双11全球狂欢节,阿里再创奇迹,成交金额1682亿,交易峰值32.5万/秒,支付峰值25.6万/秒,数据库处理峰值4200万次/秒. 双11前夕,阿里巴巴集团CTO行癫就给阿里两万多位工程师下了一个很新鲜的KPI--"双11晚上,大家的主要任务是喝茶." 能如此淡定喝茶的背后,除了无数阿里技术小二的才智与努力,还有很多阿里的黑科技支撑着这样世界超级工程.现在我们跟着阿里云云效一起来揭秘下有哪些基础设施黑科技? 蜻蜓--世界领先的大规模文件分发系统 黑科技指数: 解决痛点:大规模

多领域,多角度!隐藏版阿里双11“黑科技”大公开

系列文章陆续发布: 专访阿里巴巴徐盈辉:深度学习和强化学习技术首次在双11中的大规模应用 专访阿里巴巴林伟:三项世界级挑战背后的思考.实践和经验 专访阿里巴巴魏虎:揭秘阿里双11背后的全站个性化&商铺千人千面 价值1207亿的技术分享,你不能错过"2016双11技术创新"的九大理由! 8位阿里技术大V,解密阿里双11背后的黑科技 2016年双11是新零售的一个起点.交易额1207亿,成交额相比于去年增长32.32%(2015年的这一数字为912.17亿):开场30分钟,创造每秒

无人便利店抢人饭碗?这些“黑科技”将创造百万就业

"不用排队,不用付钱,拿起就走."亚马逊为旗下无人便利店Amazon Go拍摄的宣传视频中,人们面带微笑穿梭在超市里,离开的时候,交易已经自动在手机app上完成.在美国消费者眼里,这样的场景或许还有些科幻色彩,但在大洋彼岸的中国,这样的场景早已成了现实.无人便利店,或许是中国今年最火的新事物之一. 亚马逊无人便利店 缤果盒子.天虹无人便利店.淘咖啡.F5未来商店--随着各色无人便利店陆续问世,人们在享受"黑科技"带来的独特购物体验之时,却也开始担心无人便利店是否会抢