《碟中谍4》开场不久,特工哈纳韦在火车站台上戴上隐形眼镜,拿着手机,在茫茫人海中搜索跟踪对象。眼镜将哈纳韦看到的信息自动收集并迅速与人物数据库匹配快速锁定目标。迎面相逢的美女是致命杀手,手机发出报警声,显示出美女杀手的信息卡片,但为时已晚……这样的科幻场景正在被科技巨头变为现实,比如智能眼镜、智能手表,而这正是搜索引擎与虚拟现实结合的产物。
搜索引擎与虚拟现实的融合
所谓虚拟现实,是指通过数字手段模拟现实环境给用户一种身临其境的感受,提供使用者关于视觉、听觉、触觉等感官的模拟,让使用者如同身历其境一般,可以及时、没有限制地观察三度空间内的事物。
现在在百度搜索海边,用户会听到海浪和海鸟的声音;搜索布谷鸟,鸟叫声和泉水声带来一个森林环境;搜索“失恋”则会发出心碎的声音…让搜索结果发出声音前所未有,这可能让部分用户不习惯,但这种大胆的创新还是把搜索引擎带入虚拟现实时代,这一切尝试均是在让搜索引擎的结果更加逼真更加接近现实,而不只是枯燥的图文列表。
搜索引擎将虚拟与现实融合
搜索引擎尝试着虚拟现实并不是凭空捏造的需求。互联网让人们突破时空限制获取信息,但在信息之外却无能为力,比如在电商网站购物前无试用、再比如去订餐应用下单点菜前无法闻到菜品香味,空间阻隔依然存在。虚拟现实可帮互联网突破时空限制,从声音和图像升级到声音、图像、气味、触觉、味觉、感觉……
多媒体搜索 感知实体世界
搜索引擎最初只是基于关键词文本搜索,后加入对自然语言的理解,再到后来可以支持复杂搜索句形,整体而言均是基于文本。
现在,越来越多设备具备拍照、摄像和录音功能。移动设备多媒体功能已成为标配,支持定位、体感、重力感应等基础功能,智能硬件更是具备收集健康数据、环境数据的传感器。各种数据未来都将成为搜索引擎的输入。
输入方式富媒体化只是多媒体搜索的第一步。搜索结果与虚拟现实的结合,让用户面对结果如同身临其境是多媒体搜索的第二步。出现这两个变化的很大部分原因在于移动互联网的发达。互联网连接人与信息,移动互联网连接人与实体世界,现实世界正在被同步地映射到互联网。
地图提供空间结构基础;信息流、视频流、语音流、直播流等流式数据则进行时间维度的映射。在移动互联网映射实体世界的大背景之下,搜索引擎使命也在变化:连接人与服务,帮助人们探索实体世界。
搜索引擎再进化
说到多媒体,人们想到的是声音、图像和视频;说到虚拟现实,人们想到的是视觉、听觉、触觉、味觉、嗅觉等“知觉”。在这些多媒体形态或者“知觉”中谁最重要呢?触觉、味觉、嗅觉的模拟,目前技术难度还比较大,但视觉和听觉却已相对成熟。
相关数据显示人类有90%以上的信息获取依靠的是眼睛,李彦宏在2012年百度世界大会宣称我们已进入读图时代。而后语音与图像并驾齐驱,甚至更为成熟。
然而,语音目前更多是被当做输入,输出以图文等视觉性内容为主。但人们期望与搜索引擎对话,就像钢铁侠与他的助理贾维斯的对话一样自然。可预见未来的搜索结果更多会通过语音“读出来”,比如不太适合看屏幕的车载场景,再比如许多智能设备本来就没有屏幕,基于此应该更容易理解为何百度会让搜索结果模拟真实世界发出声音。
声音可以解放人类双手,还可以解放双眼。不过,语音也有它不擅长的场景:比如嘈杂的户外,或者容易影响他人的家庭或办公室。
在多媒体搜索上,声音和图像不是互相替换的关系,而是协作让搜索引擎更加智能、简单和自然。未来的多媒体搜索,应该是语音和图像交互为主,两者有不同的适用场景。而搜索引擎的框就像一扇真实的窗口,这窗口连接着人与信息,人与服务,人与真实世界。