印度将建造最大的生物识别数据库

2014-3-26 10:16| 发布者: joejoe0332| 查看: 2861| 评论: 0|原作者: 千家网|来自: 千家网

摘要: 　　抛开所有的争议不谈，Aadhar将于2014年完成录入超过12亿印度国民数据的目标，数据库总量将达到15petabytes。目前项目的进展速度是每天100万人，从明年开始将会实现每天大约200万人的速度…… 印度实施的唯一身份 ...

　　深入全球最大的生物识别数据库

　　笔者多方尝试与Aadhar项目官员进行会面，了解安全方面的问题，目前的进展，以及他们对于批评使用MongoDB技术的反应。

　　周五Aadhar终于同意在班加罗尔南部郊区的总部与我见面，英特尔和思科在印度的总部也位于该地区。从外表来看，存储了全体印度国民数据（目前数据总量5Petabytes）的Aadhar技术中心一点也不像是个政府建筑——很容易让人以为是附近的英特尔或者思科公司办公楼中的一个。

　　走进内部，我来到了一间中央位置有十几个电视屏幕的房间，几位二十多岁的年轻工程师兴奋地坐在前面，在各自的电脑键盘上敲击，查询数据包裹传输的存储信息，整个场面很像一个先进的控制中心。他们盯着的电视屏幕显示了这些数据包裹（每个5MB左右）的记录，从全国30000个录入中心进入开始，经过至少三次信息核实过程。核实过程包裹为每一份档案进行重复性检验，确保同一个人不会被生成两次Aadhar号码。

　　也就是说，每建立一个新数据档，就要针对所有现存的档案运行一次“去重复性”检验，目前这个数字已经超过了5亿。

　　前英特尔工程师SrikanthNadhamuni于2010年9月帮助设计了Aadhar的技术平台，该平台目前在班加罗尔的Khosla实验室运行。他告诉我，这些数据包都经过2048-bit加密存储处理，一旦有未授权的调用尝试即触发自我销毁（self-destruction）功能。

　　有关针对MongoDB的批评

　　那么为什么Aadhar一开始要与MongoDB合作？这种合作关系是否会继续下去呢？

　　Aadhar技术中心的助理总干事SudhirNarayana表示，MongoDB只是最初为数据检索所选择的几种产品之一，其他还包括MySQL、Hadoop和HBase。与只能够存储人口数据的MySQL不同，MongoDB还能够存储图像。

　　但是后来Aadhar逐渐将大部分数据库方面的工作转移到MySQL平台上，因为他们意识到MongoDB无法处理大规模的数据，也就是上百万的数据包裹。

　　目前他们已经在使用“数据库分片（databasesharding）”技术：将数据包裹存储在不同的机器上，确保系统不会在数据量增加时崩溃。

　　这种做法帮助Aadhar减少了对于MongoDB的依赖，而改用MySQL存储大部分数据。

　　Aadhar技术中心的副总干事AshokDalwai告诉我，MongoDB无法调用任何生物识别数据。

　　“我们认为使用开源技术可以避免过分依赖某一供应商的情况，但是这不代表我们以任何方式在安全方面做出妥协。”AshokDalwai这样说道。

　　MongoDB方面的一位发言人在我们联系采访时，建议我们到该公司网站上阅读有关In-Q-Tel投资的声明文件。

　　更重要的是，印度唯一身份识别局（UIDAI）早在这家创业公司从In-Q-Tel获得投资之前就开始使用MongoDB的开源软件技术。Crunchbase的数据显示，MongoDB仅仅在2012年从红帽（RedHat）、英特尔资本（IntelCapital）和In-Q-Tel三方募集了总共770万美元。

　　Aadhar前景如何？

　　抛开所有的争议不谈，Aadhar将于2014年完成录入超过12亿印度国民数据的目标，数据库总量将达到15petabytes。目前项目的进展速度是每天100万人，从明年开始将会实现每天大约200万人的速度，将剩下的7亿人纳入此数据库系统当中。

12 / 2 页在本页阅读全文

酷毙

雷人

鲜花

鸡蛋

漂亮

收藏分享邀请

上一篇：国产COS操作系统是Android吗?下一篇：投资者如何看智能硬件的分类?

快毕业了，没工作经验，
找份工作好难啊？
赶紧去人才芯片公司磨练吧!!

帐号		自动登录	找回密码
密码			注册

印度将建造最大的生物识别数据库

最新评论