深度学习识别10000物种,手机上的@博物杂志

iNaturalist.org 推出了一个 Android 和 iOS 应用程序,可以在物种层面自动识别动物和植物。这个app使用 TensorFlow 进行训练,已经能够识别出超过10000种不同的物种,而且每1.7小时模型增加1个新的物种。

iNaturalist.org 是一个成立已久的受欢迎的网站,其使命是将专家和业余的“公民科学家”连接起来,激发人们对自然界的兴趣并鼓励参与自然世界,同时使用收集的数据帮助科学家检测生物多样性变化,甚至可以帮助发现新物种。网站由加州大学伯克利分校的学生成立于2008年,最近被加州科学馆收购,网站曾经依赖众包。当用户上传一张植物或动物的照片时,由科学家和博物学家进行识别。

iNaturalist 的联合主管斯科特·洛里(Scott Loarie)表示,众包的形式通常效果很好。用户上传的一半左右的神秘观察能在2天内被识别出来,假如上传的帖子就来自加利福尼亚州的话,识别的速度甚至更快,1小时就可以识别出来。这是因为iNaturalist的大量经验丰富的专家是以美国西海岸为基础的。但是,获得识别所需的平均时间是18天,这意味着一些用户需要等待很长时间才能知道自己拍摄的是什么物种。另一个问题是,随着网站越来越受欢迎,观察员(上传照片的用户)数量远远超过了鉴定员(告诉你照片中的生物是什么物种的志愿者专家)数量。

为了缓解志愿者专家的重担,iNaturalist 团队与康奈尔鸟类实验室(Cornell Lab of Ornithology),Merlin鸟类识别app的开发人员,以及Visipedia图像识别研究项目合作,使用机器学习技术更快地提供高质量的物种识别。

Visipedia 是 Visual Encyclopedia 的缩写,这是加州理工学院与康奈尔科技学院合作的一个项目,是一个人与机器联合的网络,旨在收集和处理视觉信息,并使任何人均可访问。

使用 TensorFlow 深度学习框架,Visipedia 团队对 iNaturalist 数据库上的专家社区标记过的图像训练神经网络模型。目前,iNaturalist拥有大约4,000,000可验证的观察结果,即具有所有必要的数据质量属性(例如照片,位置,非宠物,等等),并且已被专家审查,可以被认为是“研究级”的观察结果。这些观察结果代表了约100000的物种。

iNaturalist 的设计是,至少要有20个研究级的观察结果才能在其模型中包含1个物种。虽然上图显示有13730个物种,但这个数字可能是接近但还不到10000种,这是为了避免观察者的影响,必须确保每个物种有20个不同的观察者。

这个新的应用程序使用研究级的观察结果来对动物的物种给出自信的回答,并给出前10个可能的选项作为不确定建议。其最初给出的结果正确率是86%,在前10个建议项给出的结果正确率是77%。随着模型继续得到训练,这些正确率数字应该能提高,当然,这个应用程序本身对新的观察和新物种的识别也有帮助,平均每1.7小时能为模型增加1个新物种。

在demo中,app几秒内识别出牛科动物家族,虽然其识别的结果从濒危的蛮羊到大角羊都有。它给出的其他选项如下图:

右下方的是艾贝克斯山羊拉丁美洲亚种,西班牙东南部的北山羊,这似乎是完美契合的。App也会给出关于动物来源的信息,在上面的demo则是西班牙特有的野山羊。

iNaturalis 应用程序提供了一种快速简单的方式来以照片和GPS位置的方式记录用户观察到的动物和植物,并能够让世界各地的人访问其他人的观察,成为公民科学运动的一部分。

原文发布时间为: 2017-06-20

本文作者:Sue Gee 

时间: 2024-10-13 19:48:04

深度学习识别10000物种,手机上的@博物杂志的相关文章

《中国人工智能学会通讯》——1.31 深度学习 在自然语言处理研究上的进展

1.31 深度学习 在自然语言处理研究上的进展 近年来,深度学习在人工智能的多个子领域都取得了显著的进展.在自然语言处理领域,虽然深度学习方法也收到越来越多的关注,在很多任务上也取得了一定效果,但是并没有其他领域那么显著.传统的主流自然语言处理方法是基于统计机器学习的方法,所使用的特征大多数是基于 onehot 向量表示的各种组合特征.这个特征表示方式会导致特征空间非常大,但也带来一个优点.就是在非常高维的特征空间中,很多任务上都是近似线性可分的.因此,在很多任务上,使用线性分类器就是可以取得比

极限元算法专家:深度学习在语音生成问题上的典型应用

深度学习在2006年崭露头角后,近几年取得了快速发展,在学术界和工业界均呈现出指数级增长的趋势:伴随着这项技术的不断成熟,深度学习在智能语音领域率先发力,取得了一系列成功的应用. 这次分享会中,雷锋网(公众号:雷锋网)邀请到了中科院自动化所的刘斌博士.刘斌,中科院自动化所博士,极限元资深智能语音算法专家,中科院-极限元智能交互联合实验室核心技术人员,曾多次在国际顶级会议上发表论文,获得多项关于语音及音频领域的专利,具有丰富的工程经验.刘斌博士会与大家分享近年来深度学习在语音生成问题中的新方法,围

如何利用深度学习识别图片中的电话号码?

总结下最近做的一个项目,只提供一些技术方案,不涉及具体业务和具体实现. 背景 自动识别图片中电话号码,也可以推广到识别字符串,英文等. ---识别---> "18811610168" 当然,背景会有干扰(自然环境),字体也更多变. 要求:全对识别,人工修正的成本过高,如果有一位识别错误,人工修正还不如重新输入方便(人工输入可以支持语音识别的). 保证85%以上的数据是可以全对识别的,最好返回全对识别的概率.当然对于电话号码业务,根据识别的文本结果再加上电话的一些规则,后判断程序也

深度学习框架TensorFlow在Kubernetes上的实践

什么是深度学习? 深度学习这个名词听了很多次,它到底是什么东西,它背后的技术其实起源于神经网络.神经网络最早受到人类大脑工作原理的启发,我们知道人的大脑是很复杂的结构,它可以被分为很多区域,比如听觉中心.视觉中心,我在读研究中心的时候,做视频有计算机视觉研究室,做语言有语言所,语音有语音所,不同的功能在学科划分中已经分开了,这个和我们人类对大脑理解多多少少有一些关系.之后科学家发现人类大脑是一个通用的计算模型. 科学家做了这样一个实验,把小白鼠的听觉中心的神经和耳朵通路剪断,视觉输入接到听觉中心

文科生也能搞定的深度学习入门漫画!(上)

今天我们来说说深度学习,这个近年来炙手可热的新鲜事物,相信各位并不是第一次听闻,那么关于深度学习.人工智能.机器学习大家又了解多少呢?请看文科生也能搞定的深度学习漫画就明白了! 转载自云市场合作伙伴图普,图普的机器学习产品点这里!https://market.aliyun.com/products/57124001/cmgj013546.html

《中国人工智能学会通讯》——7.11 深度学习在推荐算法上的应用进展

7.11 深度学习在推荐算法上的应用进展 最近几年是深度学习发展的黄金时间,其在多个领域取得了重要进展,包括图像领域.语音领域.文本领域等.深度学习为科研工作者提供了一种非常有效的技术途径,其本质上是对数据特征进行深层次的抽象挖掘,通过大规模数据来学习有效的特征表示以及复杂映射机制,从而建立有效的数据模型.从方法上来说,深度学习具有的优点本质上是领域无关的.因此,在可预见的未来,深度学习将会作为一种较为通用的数据建模方法,对于多个潜在领域的应用产生重要影响. 在信息大数据时代,用户的个性化需求不

损失函数减肥用,神经网络调权重(深度学习入门系列之六)

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 系列文章: 一入侯门"深"似海,深度学习深几许(深度学习入门系列之一) 人工"碳"索意犹尽,智能"硅"来未可知(深度学习入门系列之二) 神经网络不胜语,M-P模型似可寻(深度学习入门系列之三) "机器学习"三重门,"中庸之道"趋若人(深度学习入门系列之四) Hello World感知机,懂你我心才安息 (深度学习入门系列

深度学习变革视觉实例搜索

雷锋网按:本文作者邓启力,哈尔滨工业大学深圳研究生院计算机系硕士研究生二年级,导师为"鹏城学者"徐勇教授.研究兴趣为深度学习与计算机视觉.曾获2015年首届阿里巴巴大规模图像搜索大赛二等奖,总排名第三名. 摘要 近些年,深度学习在各种计算机视觉任务上都取得了重大的突破,其中一个重要因素就是其强大的非线性表示能力,能够理解图像更深层次的信息.本文对基于深度学习的视觉实例搜索方法做了简单的总结和概括,希望能给读者们带来启发. 前言 给定一张包含某个物体的查询图片,视觉实例搜索的任务就是从候

互联网世界的“人工智能”——探秘“深度学习”的前世今生

最近一段时间里,Facebook.Google.Yahoo!.百度等各大公司都在尝试将深度学习(deep learning)算法运用到产品开发中,以期使产品更智能化,提升用户体验.在深度学习持续走红的当下,本文作者对这一概念做了梳理,并分享了他对深度学习的实用性及未来发展的看法. 本周一,加利福尼亚州的Lake Tahoe.Facebook CEO Mark Zuckerburg造访了神经信息处理系统(Neutral Information Processing Systems, 下文简称NIP