设为首页收藏本站

八达网

 找回密码
 注册
查看: 774|回复: 16
打印 上一主题 下一主题

码农三大技术成美国國镓安全局监控用户数据帮凶

[复制链接]

780

主题

0

好友

13万

积分

主区版主

Rank: 8Rank: 8Rank: 8Rank: 8

跳转到指定楼层
1
发表于 2013-6-19 12:54 |只看该作者 |正序浏览
三大技术助力美国國镓安全局监控用户数据
http://it.21cn.com/itnews/a/2013/0613/14/22151109.shtml
来源:腾讯科技 | 作者:思睿 | 2013-06-13 14:34:19 | 我来说两句已有0人参与
下载新闻客户端

三大技术助力美国國镓安全局监控用户数据

全球消费者平均每月使用的网络、电子邮件和数据流量图(腾讯科技配图)

  腾讯科技讯(思睿)北京时间6月13日消息,据国外媒体报道,上周,随着美国炡椨利用互联网监视和追踪民众的消息浮出水面,这使得互联网履行其最初使命的前景看似暗淡。现代计算技术正帮助公司和炡椨准确、快速地分析庞大的数据资源,其中数据库系统、机器学习和Hadoop基础架构三大技术发挥了非常重要的作用。

  以下是文章内容全文:

  仅仅在五年之前,诸如美国國镓安全局(National Security Agency,NSA)这样的炡椨机构要想通过关键词的方式高效率地分析数百万份电话、文本消息和在线聊天记录,简直是不可能完成的任务。不过目前,一系列新技术的使用则让NSA拥有相对充分的人力和财力做到这一点。尤其考虑到,这些关键词最终有可能避免未来针对美国恐怖袭击的放生。

  这些新技术能够在一个单独的数据库里存储大量不同类型的数据,而且不需要使用造价昂贵的硬件设备就能够实现数据的高速处理,同时还无需数据分析专家提前设定假设条件。

  哈佛商学院客座教授、数据分析专家汤姆 达文波特(Tom Davenport)指出:“这些新技术为炡椨部门节省了巨额开支,同时还极大地提高了炡椨部门分析此类数据的能力。虽然需要配套的数据中心支持才能完成数据分析任务,但这些技术的成本要远比几年前低得多。”

  NSA斥资十二亿美元在犹他州打造大型数据中心将于今年秋季投入使用。目前尚不明确的是,到底NSA在覆盖全美的数据中心使用的是何种计算技术。但总体来说,这些技术被分为三大类型:

  1. 数据库系统

  大多数使用SQL编程语言的传统数据库是把数据存储在由行与列组成的表格中。然而,当遇到存储包括电子邮件或文本信息等字符串时,传统数据库就暴露了能力有限的弊端。而且它们还无法处理图片或视频。

  而于2009年年底开始出现的新型数据库NoSQL(Not Only SQL,不仅仅是SQL)则突破了传统数据库的能力限制,可以允许数据分析专家针对所有类型的数据创建信息要求。这些新型数据库包括MongoDB、Cassandra和Simple DB等。

  在帮助公司分析超大型数据组方面,NoSQL数据库体现出了非凡的能力。比如,美国保险数据供应商Verisk Analytics Inc.的分析师就在针对数十亿客户资料不断运行各种不同的数据模式和分析方法,以从中发现虚假保险索赔记录。

  Verisk副总裁兼首席信息官佩里 罗泰拉(Perry Rotella)表示,使用IBM提供的传统DB2数据库“需要通宵达旦地工作6个小时才能完成工作”。此后,分析师还得投入大量时间研究得出的数据结果,并提出新的信息要求,而这恐怕还得再熬一个晚上。他指出,分析师每次都需要花费几周时间才能创建出新的数据模型。Verisk最近刚刚开始使用更换后的NoSQL数据库,分析师仅用30秒就能完成相同类型要求的运行。

  罗泰拉表示:“突然之间,你的模型建构告别了几天才更行一次的传统,变成了实时更新状态。通过使用NoSQL数据库,你可以在一天内多次进行数据运行,这极大地缩短了获得数据结果的时间。这项功能简直太强大了。”

  对于美国在线图片交易平台服务商Shutterstock Inc.来说,如果没有NoSQL,该公司简直无法生存。Shutterstock拥有超过2,400万张图片的存储库,而且每天还以1万张图片的速度递增。其中的每张图片都拥有相关数据来帮助用户缩小搜索范围。Shutterstock的数据库还记录用户在该网站上的所有网络行为,这些行为不仅包括诸如他们授权何种图片这样的重大决定,而且还包括微小的细节,比如他们的鼠标箭头经常停留在什么地方以及停留的具体时长。

  2.机器学习

  传统分析要求分析师对数据有充分的了解,然后才能创建假设问题,进而针对数据库提出复杂的问题。而最近以机器学习和自然语言处理为核心的编程技术则依靠计算机程序来发现数据类型,甚至还可以根据上下文阐明模糊词汇的意义。

  达文波特指出:“你可以把机器学习程序植入多个数据之中,然后你就会看到该程序会给你提供什么样的分析结果。通过使用自然语言处理技术,你还可以分辨出‘炸弹’这个词是百老汇舞台剧的剧名,还是恐怖分子将会使用的武器。”

  权威市场研究机构Gartner Inc.的分析师道格拉斯 莱尼(Douglas Laney)指出,机器学习又被称之为“认知分析”,它能够让分析师提出的问题不断进行“自我修正”。比如,在新信息出现时,零售商就可以使用该技术来实时自动更新计价算法。这些新信息包括天气、时间、甚至是消费者在其零售店里的行为视频。

  莱尼表示:“以前,更新价格往往需要一天多的时间,但这些零售商现在可以每小时就制定一个新价格,并借助趋势信息实施产品的实时定价。我不确定他们在一年前能否做到这一点。”

  3.Hadoop基础架构

  直到最近,还是只有造价昂贵的硬件设备才能够运行特别复杂的计算机程序,比如超大型计算机设备。但现在,Hadoop开源软件分布式系统基础架构已经能够让从资料库提取信息的过程进行分布实施。在这一过程中,不同的分析任务被分配给大量造价低廉的服务器进行分析,每个服务器只负责分析其中的一部分内容,然后这些内容又会在任务结束后被汇总在一起。达文波特表示:“这非常省钱,而且运行速度特别快。”

  这种将复杂的问题分配给大量造价低廉的计算机处理的能力有助于人们获得问题的及时反馈,而且人们还会获得大量的数据变量。比如,美国汽车信息网站Edmunds.com可以帮助汽车经销商预测一辆车在他们自己的停车场里停留的平均时间。这种预测能够最大限度地缩短一辆车售出的时长。Edmunds.com的首席信息官菲利普 波特洛夫(Philip Potloff)指出:“对于汽车经销商来说,这可是衡量销售业绩最为重要的指标之一。”

  流媒体视频服务商 Netflix Inc.则使用Hadoop勾勒出用户使用多种设备接入视频的流量数据图谱。这有助于Netflix提高其为移动设备、笔记本和电视机提供视频数据的可靠性,同时帮助Netflix规划流媒体电影和电视剧集的未来增长。此外,Hadoop还帮助Netflix更好地分析客户喜好,从而为该公司提供改进建议。 [责任编辑:sayaliu]

207

主题

0

好友

2万

积分

大和

家家蜜

17
发表于 2013-6-21 08:34 来自手机 |只看该作者
vox貌似更猛些.多讨论技术吧
回复

使用道具 举报

163

主题

2

好友

6700

积分

大象

16
发表于 2013-6-21 08:18 |只看该作者
我知道有一个是非死不可的,另外一个不知道

希望别吵架啊,我喜欢看这种技术贴,球开智
回复

使用道具 举报

210

主题

0

好友

4万

积分

光明执政官

15
发表于 2013-6-21 03:01 |只看该作者
8da IT高帅富太多了......................吓死了....................
I went to the woods because I wished to live deliberately, to front only the essential facts of life, and see if I could not learn what it had to teach, and not, when I came to die, discover that I had not lived.
回复

使用道具 举报

289

主题

3

好友

5万

积分

光明执政官

14
发表于 2013-6-21 01:04 |只看该作者
BabyV.O.X 发表于 2013-6-20 22:20
这B装的,您真内行
您还是先了解下我是做什么的,再来跟我装内行吧。

我操,你是做什么的?来说说?
不过你知不知道我是做什么的?
回复

使用道具 举报

230

主题

1

好友

8万

积分

仲裁者

gg复gg,只为日ziyi

13
发表于 2013-6-21 00:01 |只看该作者
华为上市了吗?  不是说不上市的
回复

使用道具 举报

1

主题

0

好友

2万

积分

大和

12
发表于 2013-6-20 23:29 |只看该作者
中兴这种渣公司,年终奖都发不起了

华为不会上市,要真到华为上市的那一天说明华为就要思密达了,6万多的虚拟股木有了,你让原生家庭的孩子还加个什么班啊

CISCO和华为的业务又不冲突么
回复

使用道具 举报

4332

主题

5

好友

5万

积分

光明执政官

战队
[S.lian]
种族
Zerg

2012年度八达十大水友 2011年度八达十大水友 2011中国少年先锋队八达支队副总队

11
发表于 2013-6-20 22:57 |只看该作者
赶紧买NOSQL
   
回复

使用道具 举报

95

主题

1

好友

6万

积分

仲裁者

2013年夜饭

10
发表于 2013-6-20 22:42 |只看该作者
BabyV.O.X 发表于 2013-6-20 22:20
这B装的,您真内行
您还是先了解下我是做什么的,再来跟我装内行吧。

你是做什么的啊?
回复

使用道具 举报

4

主题

0

好友

2万

积分

大和

当时明月在,曾照彩云归

战队
The.
种族
Terran
9
发表于 2013-6-20 22:25 |只看该作者
本帖最后由 BabyV.O.X 于 2013-6-21 00:38 编辑
新建文件夹 发表于 2013-6-19 14:19
思科的网络设备里有后门?


美军的网络军事演习的设计者就是思科,这个公司本身就是美军的网络战中心
中国70%到80%的金融,能源,炡椨,通信行业的网络设备和大部分骨干网络节点的设备都是思科供应的,有的央企还指定非思科设备不用
中国大部分网络骨干节点可以说已经掌握在思科手里了,当然其他主要國镓也一样,包括欧洲这些美国的盟友
这次史上最大规模的网络间谍项目棱镜曝光以后,國镓一些骨干网络节点,IDC中心已经开始撤换思科的设备了,所以说这也是国产网络设备商的一个好机会
回复

使用道具 举报

4

主题

0

好友

2万

积分

大和

当时明月在,曾照彩云归

战队
The.
种族
Terran
8
发表于 2013-6-20 22:20 |只看该作者
nejcnejc 发表于 2013-6-19 15:14
SNS带来了SQL的新生,请不要外行

这B装的,您真内行
您还是先了解下我是做什么的,再来跟我装内行吧。

套用句阿布的话说,不是网络,你连到我面前面试的机会都没有。
回复

使用道具 举报

0

主题

0

好友

3万

积分

大和

7
发表于 2013-6-20 11:05 |只看该作者
我就来看看
回复

使用道具 举报

头像被屏蔽

0

主题

0

好友

375

积分

禁止发言

6
发表于 2013-6-20 10:02 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

289

主题

3

好友

5万

积分

光明执政官

5
发表于 2013-6-19 15:14 |只看该作者
BabyV.O.X 发表于 2013-6-19 14:03
NoSQL,智能语义分析,分布式存储,都不是多新的技术了,国内超大型门户几乎都同时使用这三类技术,SNS时代 ...

SNS带来了SQL的新生,请不要外行
回复

使用道具 举报

289

主题

3

好友

5万

积分

光明执政官

4
发表于 2013-6-19 15:13 |只看该作者
一看就是外行写的
回复

使用道具 举报

1656

主题

0

好友

17万

积分

黑暗执政官

2013年夜饭

3
发表于 2013-6-19 14:19 |只看该作者
BabyV.O.X 发表于 2013-6-19 14:03
NoSQL,智能语义分析,分布式存储,都不是多新的技术了,国内超大型门户几乎都同时使用这三类技术,SNS时代 ...

思科的网络设备里有后门?
待会把她带到我房间
回复

使用道具 举报

4

主题

0

好友

2万

积分

大和

当时明月在,曾照彩云归

战队
The.
种族
Terran
2
发表于 2013-6-19 14:03 |只看该作者
NoSQL,智能语义分析,分布式存储,都不是多新的技术了,国内超大型门户几乎都同时使用这三类技术,SNS时代开始以后的海量数据逼着各大公司采用这类新的解决方案来避免传统技术带来的瓶颈,又不是中情局专用的。
不知道这文章想表达什么意思。要说网络安全危害,最大的毒瘤还是思科公司。这次老美棱镜项目曝光后,思科在华的垄断地位肯定要受到极大冲击,大家可以考虑去买中兴和华为的股票了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

手机版|Archiver|八达网    

GMT+8, 2025-11-29 00:49

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部