iNaturalist.org 推出了一个 Android 和 iOS 应用程序,可以在物种层面自动识别动物和植物。这个app使用 TensorFlow 进行训练,已经能够识别出超过10000种不同的物种,而且每1.7小时模型增加1个新的物种。
iNaturalist.org 是一个成立已久的受欢迎的网站,其使命是将专家和业余的“公民科学家”连接起来,激发人们对自然界的兴趣并鼓励参与自然世界,同时使用收集的数据帮助科学家检测生物多样性变化,甚至可以帮助发现新物种。网站由加州大学伯克利分校的学生成立于2008年,最近被加州科学馆收购,网站曾经依赖众包。当用户上传一张植物或动物的照片时,由科学家和博物学家进行识别。
iNaturalist 的联合主管斯科特·洛里(Scott Loarie)表示,众包的形式通常效果很好。用户上传的一半左右的神秘观察能在2天内被识别出来,假如上传的帖子就来自加利福尼亚州的话,识别的速度甚至更快,1小时就可以识别出来。这是因为iNaturalist的大量经验丰富的专家是以美国西海岸为基础的。但是,获得识别所需的平均时间是18天,这意味着一些用户需要等待很长时间才能知道自己拍摄的是什么物种。另一个问题是,随着网站越来越受欢迎,观察员(上传照片的用户)数量远远超过了鉴定员(告诉你照片中的生物是什么物种的志愿者专家)数量。
为了缓解志愿者专家的重担,iNaturalist 团队与康奈尔鸟类实验室(Cornell Lab of Ornithology),Merlin鸟类识别app的开发人员,以及Visipedia图像识别研究项目合作,使用机器学习技术更快地提供高质量的物种识别。
Visipedia 是 Visual Encyclopedia 的缩写,这是加州理工学院与康奈尔科技学院合作的一个项目,是一个人与机器联合的网络,旨在收集和处理视觉信息,并使任何人均可访问。
使用 TensorFlow 深度学习框架,Visipedia 团队对 iNaturalist 数据库上的专家社区标记过的图像训练神经网络模型。目前,iNaturalist拥有大约4,000,000可验证的观察结果,即具有所有必要的数据质量属性(例如照片,位置,非宠物,等等),并且已被专家审查,可以被认为是“研究级”的观察结果。这些观察结果代表了约100000的物种。
iNaturalist 的设计是,至少要有20个研究级的观察结果才能在其模型中包含1个物种。虽然上图显示有13730个物种,但这个数字可能是接近但还不到10000种,这是为了避免观察者的影响,必须确保每个物种有20个不同的观察者。
这个新的应用程序使用研究级的观察结果来对动物的物种给出自信的回答,并给出前10个可能的选项作为不确定建议。其最初给出的结果正确率是86%,在前10个建议项给出的结果正确率是77%。随着模型继续得到训练,这些正确率数字应该能提高,当然,这个应用程序本身对新的观察和新物种的识别也有帮助,平均每1.7小时能为模型增加1个新物种。
在demo中,app几秒内识别出牛科动物家族,虽然其识别的结果从濒危的蛮羊到大角羊都有。它给出的其他选项如下图:
右下方的是艾贝克斯山羊拉丁美洲亚种,西班牙东南部的北山羊,这似乎是完美契合的。App也会给出关于动物来源的信息,在上面的demo则是西班牙特有的野山羊。
iNaturalis 应用程序提供了一种快速简单的方式来以照片和GPS位置的方式记录用户观察到的动物和植物,并能够让世界各地的人访问其他人的观察,成为公民科学运动的一部分。
原文发布时间为: 2017-06-20
本文作者:Sue Gee