谷歌AI系统图像配文准确率高达 93.9%

要真正解释和描述一张照片,人工智能不仅需要了解图片中是什么,更要了解图像中这些对象有什么相互关系。谷歌的开发人员表示这不只是一个数据的倒推。该算法必须能够自然地理解图像中的对象和它们的用途。

谷歌研究的博客发文说:“令人兴奋的是,在展示全新情境时,我们的模型的确可以产生准确的配文,这显示出系统对图像中目标和背景的理解更深了。”同样重要的是,“它还学会了如何用自然的英语短语表达知识,尽管它只读了人类给的说明字幕,没有在接受其他额外的训练。”

至少从目前来说,相对于视频,机器学习算法能更好地理解静止图像的内容。

文章转载自 开源中国社区 [http://www.oschina.net]

时间: 2024-12-03 03:26:22

谷歌AI系统图像配文准确率高达 93.9%的相关文章

D1net阅闻:AI系统读唇语:准确率高达93.4%

AI系统读唇语:准确率高达93.4%根据牛津大学新发表的论文,被叫做LipNet的AI系统,能够将视频中人物的嘴巴活动与其台词进行匹配,准确率高达93.4%. Ayla战略牵手IoT数据分析领导者mnubo 双方正式建立战略合作伙伴关系,将mnubo的智能设备技术与Ayla的物联网平台整合,从而向IoT产品制造商提供高级数据分析和商业情报工具及服务. Facebook拟通过无人机为偏远地区提供宽带 北京时间11月8日晚间消息,Facebook正与印度政府和电信公司谈判,商讨通过其Aquila太阳

AI成功预测数百起人权案判决结果,准确率高达79%

据报道,英国伦敦大学.谢菲尔德大学以及美国宾夕法尼亚大学的研究人员宣称,AI(人工智能)系统成功预测了欧洲人权法庭(European Court of Human Rights )数百起人权案件的判决结果,准确率高达79%. 目前在新闻.法律以及会计行业,AI的应用日益增多. 但批评家认为,AI无法理解案件之间的细微差别.研究人员承认,这项研究并非意味着AI将终结法官或律师行业. 领导研究的Nikolaos Aletras说:"目前有关AI的炒作很多,但我们还没有看到其近期有取代法官或律师的可能

这家公司APT实时检测准确率高达98.8%

本文讲的是 这家公司APT实时检测准确率高达98.8%,独立测试机构AV-TEST研究所报告指出,每天出现的新恶意软件变种大约在39万个左右.杀软巨头赛门铁克则称此数字应该是100万个左右,而且这些都是尚未记录在案的新型恶意软件. 即使我们选择相信较小数字的估测,情况也是不容乐观的.尤其是这些新恶意软件指的是高级持续性威胁(APT)的时候.APT是病毒和恶意软件最复杂的变种,我们今日所用的很多网络安全技术完全检测不出.甚至安全专家都告诉公司企业,不用考虑攻击是否成功,因为那是一定的,只需要准备好

AAAI学会主席Rao演讲:AI系统崛起后的未来应当是更好地服务人类 | CCF-GAIR

2017年7月7日至9日,全球人工智能与机器人峰会CCF-GAIR大会在深圳大中华喜来登酒店举行.本次由CCF中国计算机学会主办.雷锋网(公众号:雷锋网)与香港中文大学(深圳)承办的大会聚集了全球30多位顶级院士.近300家AI明星AI企业 ,参会人数规模高达3000人,都是国内顶级阵容.  在7日上午的人工智能前沿专场中,亚利桑那州立大学教授.AAAI学会主席Subbarao Kambhampati教授进行了题为"人工智能的崛起与人类感知AI系统的挑战"的演讲,分享了他在AI浪潮中的

真相 | Facebook AI系统并未“失控”,研究员已修正bug

雷锋网AI科技评论按:英国<太阳报>8月1日报道了一则"机器人正在接手人类主动权吗?"的新闻.文中讲到 Facebook最近关停了一项人工智能实验,因为两个机器人开始用自己的语言交流,人类并不知道它们在讲什么. 随后,Facebook关闭"失控"AI系统,机器人发展出人类无法理解的语言等类似这样的标题占据国内各大科技媒体头条.然而AI科技评论并没有跟风,为了弄清事情的来龙去脉,给公众一个客观真实的报道,我们了解到: Facebook并没有关闭这个AI实验

在写诗之后,谷歌AI又能写歌了

今天,谷歌最新的机器学习计划创作出了第一首歌曲:一首90秒的钢琴曲.它由训练神经网络创作. 上周,谷歌开启了Magenta项目,旨在让谷歌的机器学习系统创作音乐等艺术.而这首钢琴曲是此项目的首个杰作. 除此之外,谷歌还发表博文,表明了在Magenta上的野心.从长远来看,Magenta的目标是引领机器艺术创作的潮流,并在此基础上建立一个艺术家社区.而从短期来看,Magenta创作的艺术作品,需要基于已有的艺术作品.团队负责人表示:"最开始,我们需要基于视频和音频支持,还需要一个能够连接艺术家和机

Facebook将反馈融入AI系统,视觉障碍者现在也能“读懂”照片啦

雷锋网按:Automatic Alt-Text (AAT) 的发布让盲人(或使用屏幕阅读器的用户)更好地读懂新闻推送  (News Feeds) 里的照片的内容.以访谈,可用性测试以及调查为手段的用户研究给工具的发明提供了帮助.我们将在本文简要介绍这项工作的一些亮点,雷锋网(公众号:雷锋网)独家编译,未经许可不得转载. 这项工作的主要作者.数据科学家Shaomei Wu将会出席本周在波特兰举办的CSCW 2017,届时她将在会上详细介绍该工具的功能以及所进行的研究.如果您想面对面探讨,请在会上和

Silverlight 2.5D RPG游戏技巧与特效处理:(十一“.NET研究”)AI系统

谈到人工智能(AI),这个话题就太大了:大学里有<人工智能教程>专门讲这方面的知识,什么大名鼎鼎的人工神经网络.遗传算法等等均可一窥究竟,这里如赘述似乎有些班门弄斧,我们暂且丢它一边去吧. 本节,我的主要目的是与大家共同探讨AI在RPG游戏中的应用.看过之前教程的朋友一定不会陌生,A*算法就是其中的一个重要组成部分:而本系列Demo中则使用了更为高级的改进型A*算法,不仅优化了性能,同时也大幅提升了玩家的操控体验.除此之外,AI更常见于RPG游戏中的角色,接下来我将引领大家循着AI的足迹,逐步

一起谈.NET技术,Silverlight 2.5D RPG游戏技巧与特效处理:(十一)AI系统

谈到人工智能(AI),这个话题就太大了:大学里有<人工智能教程>专门讲这方面的知识,什么大名鼎鼎的人工神经网络.遗传算法等等均可一窥究竟,这里如赘述似乎有些班门弄斧,我们暂且丢它一边去吧. 本节,我的主要目的是与大家共同探讨AI在RPG游戏中的应用.看过之前教程的朋友一定不会陌生,A*算法就是其中的一个重要组成部分:而本系列Demo中则使用了更为高级的改进型A*算法,不仅优化了性能,同时也大幅提升了玩家的操控体验.除此之外,AI更常见于RPG游戏中的角色,接下来我将引领大家循着AI的足迹,逐步