人类最大的生物识别数据库正在印度实施,是机会还是隐患?

印度实施的唯一身份识别(Unique Identification)项目(也被称作 Aadhar 计划),近段时间,刚完成了人口统计和生物识别数据的收集,目前印度是全球同类生物识别项目规模最大的一个。

该项目实施着几年里,一直受到来自各方面的来自隐私和安全以及其他方面的争议声音。同时Aadhar 项目最新的进展又引来了有关其捕获、存储以及管理数据方法的担忧,特别是一家美国创业公司 MongoDB 在其中所扮演的角色。

MongoDB 是一家非关系型数据库(NoSQL database)创业公司,去年从美国中情局资助的 In-Q-Tel 机构中募集了资金。In-Q-Tel 是一家独立的非盈利资本机构,一直受到 CIA 和一些美国其他的情报机构的支持。

过去几天,几家印度媒体的报道引述了该国政党和活动人士们的意见,怀疑 Aadhar 项目的隐私数据被盗用,直指该项目的负责人 Infosys 的联合创始人 Nandan Nilekani。

也有一些报道文章将 MongoDB 列入批评对象当中。

全球各国政府都在日益警惕美国国家安全局(NSA)的窃听行动,任何与美国政府情报机构有丝毫联系的事情都会闹得沸沸扬扬。不仅如此,因为印度明年普选在即,该国政治意见的发声更是达到前所未有的程度。

诸如此类指控的时机不能来得再糟糕了,至少对于这个野心庞大的身份识别项目来说是如此,Aadhar 正在等待国会法案的通过,要在今年完全成为宪法承认的机构。

笔者访问了位于班加罗尔(Bangalore)的 Aadhar 项目办公地点,说实话,按照向我介绍信息的工作人员的说法,虽然有人指摘大额合同中包含与 MongoDB 分享数据的内容,其实 Aadhar 使用的是 MongoDB 的开源代码,并不会触及敏感数据。这次会面同样有机会了解到目前地球上最大的生物识别数据库如何运作,如何处理安全和隐私方面的隐患。

不仅如此,印度唯一身份识别局(the Unique Identification Authority of India)反驳了与任何美方机构分享印度国民数据信息的指控。

Aadhar 对于印度来说,意味着什么?

首先要理清谈论 Aadhar 的语境,这个项目对于印度这样的国家来说意味着什么?该国有超过 5 亿人口没有任何正式的身份证明(ID)或诸如此类的凭证,这就导致了许多其他问题,比如没办法领取政府补贴、注册银行账户、申请贷款、考取驾照等等。Aadhar 数据库项目,目前以每天新增 100 万印度国民的速度在记录,预计于明年底注册完成大约 12 亿人口,介时将成为地球上最大的生物识别数据库。

获得 12 位数字长度 Aadhar 编码的最大优势是该国政府能够将银行账户与贫困人口联系起来,直接现金权益和其他补贴做银行转账。目前,印度已经有将近 4000 万个银行账户与 Aadhar 数据建立了匹配。

市场研究机构 CLSA 的报告显示,印度政府总值 2500 亿美元的补贴和其他国民待遇中有超过 40% 是针对该国贫困人口的,但是却将在未来几年浪费在政府腐败当中。Aadhar 计划能够把过程的中间环节去掉,向需要政府补贴的人直接现金转账,用这种方式抑制腐败。

但也有包括位于班加罗尔的互联网和社会中心(Centre for Internet & Society)在内的智库和活动家对于隐私方面的问题始终持怀疑态度,甚至质疑整个项目能够发挥多大的效果。

深入全球最大的生物识别数据库

笔者多方尝试与 Aadhar 项目官员进行会面,了解安全方面的问题,目前的进展,以及他们对于批评使用 MongoDB 技术的反应。

周五 Aadhar 终于同意在班加罗尔南部郊区的总部与我见面,英特尔和思科在印度的总部也位于该地区。从外表来看,存储了全体印度国民数据(目前数据总量 5 Petabytes)的 Aadhar 技术中心一点也不像是个政府建筑——很容易让人以为是附近的英特尔或者思科公司办公楼中的一个。

走进内部,我来到了一间中央位置有十几个电视屏幕的房间,几位二十多岁的年轻工程师兴奋地坐在前面,在各自的电脑键盘上敲击,查询数据包裹传输的存储信息,整个场面很像一个先进的控制中心。他们盯着的电视屏幕显示了这些数据包裹(每个 5MB 左右)的记录,从全国 30000 个录入中心进入开始,经过至少三次信息核实过程。核实过程包裹为每一份档案进行重复性检验,确保同一个人不会被生成两次 Aadhar 号码。

也就是说,每建立一个新数据档,就要针对所有现存的档案运行一次“去重复性”检验,目前这个数字已经超过了 5 亿。

前英特尔工程师 Srikanth Nadhamuni 于 2010 年 9 月帮助设计了 Aadhar 的技术平台,该平台目前在班加罗尔的 Khosla 实验室运行。他告诉我,这些数据包都经过 2048-bit 加密存储处理,一旦有未授权的调用尝试即触发自我销毁(self-destruction)功能。

有关针对 MongoDB 的批评

那么为什么 Aadhar 一开始要与 MongoDB 合作?这种合作关系是否会继续下去呢?

Aadhar 技术中心的助理总干事 Sudhir Narayana 表示,MongoDB 只是最初为数据检索所选择的几种产品之一,其他还包括 MySQL、Hadoop 和 HBase。与只能够存储人口数据的 MySQL 不同,MongoDB 还能够存储图像。

但是后来 Aadhar 逐渐将大部分数据库方面的工作转移到 MySQL 平台上,因为他们意识到 MongoDB 无法处理大规模的数据,也就是上百万的数据包裹。

目前他们已经在使用“数据库分片(database sharding)”技术:将数据包裹存储在不同的机器上,确保系统不会在数据量增加时崩溃。

这种做法帮助 Aadhar 减少了对于 MongoDB 的依赖,而改用 MySQL 存储大部分数据。

Aadhar 技术中心的副总干事 Ashok Dalwai 告诉我,MongoDB 无法调用任何生物识别数据。

“我们认为使用开源技术可以避免过分依赖某一供应商的情况,但是这不代表我们以任何方式在安全方面做出妥协。”Ashok Dalwai 这样说道。

MongoDB 方面的一位发言人在我们联系采访时,建议我们到该公司网站上阅读有关 In-Q-Tel 投资的声明文件。

更重要的是,印度唯一身份识别局(UIDAI)早在这家创业公司从 In-Q-Tel 获得投资之前就开始使用 MongoDB 的开源软件技术。Crunchbase 的数据显示,MongoDB 仅仅在 2012 年从红帽(Red Hat)、英特尔资本(Intel Capital)和 In-Q-Tel 三方募集了总共 770 万美元。

Aadhar 前景如何?

抛开所有的争议不谈,Aadhar 将于 2014 年完成录入超过 12 亿印度国民数据的目标,数据库总量将达到 15 petabytes。目前项目的进展速度是每天 100 万人,从明年开始将会实现每天大约 200 万人的速度,将剩下的 7 亿人纳入此数据库系统当中。

原文链接:http://www.huxiu.com/article/24311/1.html

【编辑推荐】

MongoDB用户权限管理讲解Mongodb千万级数据在python下的综合压力测试及应用探讨MongoDB索引:太多字段要索引怎么办?使用通用索引MongoDB实战:Replica Sets + Sharding【责任编辑:王程程 TEL:(010)68476606】

时间: 2024-09-13 05:12:34

人类最大的生物识别数据库正在印度实施,是机会还是隐患?的相关文章

机会和隐忧:人类最大的生物识别数据库正在印度实施

印度实施的唯一身份识别(Unique Identification)项目(也被称作 Aadhar 计划),本周早些时候完成了人口统计和生物识别数据的收集,总量超过 5 亿印度居民--是目前全球同类生物识别项目规模最大的一个. 该项目实施的几年来一直伴随着来自隐私和安全以及其他方面的争议声音.Aadhar 项目最新的进展又引来了有关其捕获.存储以及管理数据方法的担忧,特别是一家美国创业公司 MongoDB 在其中所扮演的角色. MongoDB 是一家非关系型数据库(NoSQL database)创

NEC为印度Aadhaar项目提供的生物识别系统注册人数突破10亿

由NEC提供生物识别系统.印度国民ID管理局(简称UIDAI)主导进行并可为每位国民签发独有身份ID的Aadhaar项目,截至2016年4月其注册人数已经突破10亿.NEC通过提供集指纹 面部 虹膜等技术于一体的大型生物识别系统为此项目做出了贡献. 印度国民ID管理局旨在创造让国民公平地享受公共服务及金融服务的社会,因此大力推进可收集并管理包括国民姓名.住址.生物特征信息的Aadhaar项目.每位在系统注册的国民都将获得固定的12位数字国民ID.公共机关及银行会根据此国民ID确认享受社保.开设银

7000万美元收购生物识别公司EyeVerify,蚂蚁金服已锁定你眼球

还记得支付宝曾经轰动一时的"刷脸支付"吗?事实上,蚂蚁金服在生物识别的筹备上从未松懈. 据彭博社援引知情人士消息报道,阿里巴巴集团旗下蚂蚁金服以7000万美元收购了美国密苏里州堪萨斯城的生物识别技术公司EyeVerify.知情人士透露,交易完成后,EyeVerify将成为蚂蚁金服旗下全资子公司. EyeVerify是一家专注于研发眼球识别的生物识别技术公司,和基于人脸.指纹等生物特征的识别不同,EyeVerify使用的是从眼球照片中提取数据点的技术. 据介绍,EyeVerify的验证过

谭铁牛:智能化时代生物识别的机遇与挑战

谭铁牛:大家下午好.上午大家已经听了5个非常好的报告. 之前在7月26-27号中国人工智能大会上,我回顾了人工智能发展60年的历程.今天咱们是产业的论坛,所以我今天想讲一个比较具体的问题.题目叫"智能化时代生物识别的机遇与挑战",讲"生物识别",这是一个跟大家都有关系的技术.因为时间很有限,半个小时之内,希望留一点时间跟大家一起讨论. 所以主要是讲这三个问题: 1.时代背景. 2.重要机遇. 3.面临的挑战. 生物识别大家应该都不陌生,有时叫"生物特征识别

网络安全宣传周 生物识别在安防也很有市场

[导读]上游企业开始纷纷进入安防行业,通过寻找设备供应商,将最新的网络安全防范技术应用到安防产品中,这是上游企业打开安防市场的最佳机遇. 网络安全宣传周 生物识别在安防也很有市场 责任编辑:editor006 |  2016-09-23 17:09:33 本文摘自:千家网 [导读]上游企业开始纷纷进入安防行业,通过寻找设备供应商,将最新的网络安全防范技术应用到安防产品中,这是上游企业打开安防市场的最佳机遇. 在视频监控.门禁管理及可视对讲行业,设备网络化带来的信息安防已经引起从业者足够的关注,但

院士谭铁牛:智能化时代生物识别的机遇与挑战(附报告全文)

2015年8月14日,由中国科协.中国科学院指导,中国人工智能学会发起主办的第五届中国智能产业高峰论坛在上海长荣桂冠酒店顺利召开. 谭铁牛the expert中国人工智能学会副理事长.中国科学院院士 报告题目:<智能化时代生物识别的机遇与挑战> 摘要"互联网+"的本质是什么?简单的讲,我认为就是"以人为本,连接一切."既然是以人为本,当然你要知道这个人是谁.因此"我是谁"是"互联网+",连接人与服务的关键问题.也正

你了解行为生物识别吗?

生物识别让用户身份验证变得十分便利,这也是很多原始设备制造商(OEM)开始将各种生物识别技术整合到其设备的主要原因之一.现在人们已经慢慢熟悉使用指纹或面部来解锁自己的电脑和移动设备,毕竟这种方法要比记住并输入密码或PIN更加用户友好.  指纹.面部.手和视网膜等生理特征只是一种生物标识符,而另一种是行为特征,这涉及人的行为模式,例如打字速度.步态.姿态和声音等.我们几乎不可能复制或模仿他人的行为来欺骗行为识别验证技术,因为每个人的举止和身体语言特征都是由社会和心理因素所塑造,具有其独特性.  行

智能家居倾向利用生物识别解决安全问题

近日,受英特尔安全(Intel-Security)委托,美国市场研究机构最新研究报告指出四成消费者认为在智能家居生态系统中采用传统密码并非良策,而更倾向于基于生物识别的安全解决方案.调查结果显示54%的人倾向于指纹解锁,46%的人倾向于语音识别还有42%的人倾向于虹膜解锁. 该机构对美国.英国.法国.德国.巴西.印度.加拿大.澳大利亚和墨西哥9个城市的9000名用户进行了问卷调查,77%的调查者都期望在2025年之前智能家居像现在的智能手机一样变得这么普通常见. 而在安全方面,92%的受调查者预

iPhone新手机引领生物识别应用潮流

指纹识别是苹果公司( Apple)最新款智能手机的主要新功能,这是数字设备首次内置简单可靠的指纹识别 传感器,不仅可以解锁手机,还可以授权在苹果公司的应用商店.iTune和电子书店内购物. 电子手写签名应用与之非常相似.人们可以用手指或触笔在触屏上签字,应用系统进行识别.这种技术已被一些公司所采用,可帮助减少文书工作.现在,该技术正在大步进军健康保险和金融服务领域. 如今,说到这类技术,人们的最大顾虑是安全问题,尤其是在一个黑客组织本周初展示了如何用指纹图像而不是指纹本身来解锁iPhone之后.