SIC:NSA硬盘可存全球通话记录数年

多牛科技 2019-10-08

美国参议院情报委员会(SIC)情报官员上周末对美国国家安全局(NSA)收集公民数据的行为进行了辩解。SIC官员称,NSA可以收集目标电话的时间、通话时长、IMEI号码、以及综合通信路由信息,NSA虽然收集了数百万份通信记录,但只对其中不到300个电话用户做进一步调查,电话监控数据仅被用于调查恐怖活动。而且,这些通信记录每五年就会被销毁。

SIC此举旨在表明,NSA数据收集项目远没有想象的那么广泛和可怕,但仅仅是公布的这些细节也让人触目惊心。监听全球手机用户的通话记录!这句话听起来无比彪悍,但NSA是如何做到的?究竟要什么样的技术才能支撑起庞大的数据?

 

据国外媒体报道,NSA专门打造了一个用于存储和分析庞大数据的开源数据库——​Accumulo,这是此次事件背后的关键技术。NSA在07年起就开始尝试使用自动化的分析来追踪和发现潜在的恐怖活动。现在,NSA数据中心“正运行着上万节点规模的超级计算机”,用来监视全球规模的通信数据。其中有众多的超级计算机存储着PB级别的数据(1P=1000T=1,000,000G),可以让NSA存储数年的全世界电话通讯记录数据,同时这些机器也作为后台支持着NSA大部分的数据分析能力。

 

 

那么,NSA采集的数据规模究竟有多大?这个问题的答案,恐怕是钱说了算。我们并不能完全确认之前NSA被爆出的两个项目的数据总规模,但证据表明至少在数据容量上这不会非常庞大。

“棱镜计划”每年仅有2千万美元的项目资金,恐怕很难覆盖存储所有原始数据产生的费用(Google、Facebook、Microsoft、Apple、Yahoo、AOL…),更不要说由这些数据产生的分析数据。据了解,Yahoo每年在运营其Hadoop环境中的花费就超过1亿美元,而且还都是数年前的数据了。Facebook用户每天生成的新数据超过500T,所以对于传闻中NSA与众多的互联网公司合作,它也只能选择有限的一部分来存储分析。

 

不过,公开的预算从来就是为了掩人耳目而存在的,这也是美国情报机构的惯例了。在越战期间,美国中央情报局每年都会得到一笔庞大的特别资金,来进行各种预算之外的活动。

有消息指出,几个月前,NSA开始在犹他州建设密码破译和数据分析数据中心,总投资达到12亿美元,同时,NSA最近还开始在马里兰州新建另一个新的数据中心,该数据中心面积达100万平方英尺,其中高性能计算机将占10万平方英尺,整个数据中心的存储容量将达到5泽字节(1泽字节大约等于1万亿GB,或者约2500亿张DVD),这个数据中心能储存全球网民今后100年的通信数据。

自:爱活网

SIC:NSA硬盘可存全球通话记录数年