西点教授如何用大数据对抗ISIS威胁
【数据猿导读】 2003年第一次前往伊拉克的作战经历,让萨卡利亚教授产生了研究数据的动力,因为这场战争和之前的任何一场战争都不同的地方在于计算机的广泛应用。士兵们巡逻回来之后都会把发现的情况和侦测的数据输入电脑并形成数据库,所以萨卡利亚教授一直思考如何用大数据来对抗恐怖主义的威胁
独家采访研究ISIS的计算机科学家萨卡利亚教授
我:下午好,萨卡利亚教授,非常高兴您今天接受我们的采访。
他:我也很高兴。
我:您和您的研究现在在中国有挺多人关注的。就在巴黎恐怖袭击后的几天内,中国媒体就已经把你八月份在学术会议上做过报告的那篇论文介绍给中国读者。因为伊斯兰国也将中国看作是敌人,所以中国读者也非常关注伊斯兰国在中东地区的崛起和对中国穆斯林地区的渗透。因此我想今天的采访对于我们读者更好的了解你和你的研究来说非常有帮助。您能先简要的和大家介绍一下您自己吗?
他:当然。我在高中毕业之后就读于位于纽约西点的美国陆军学院,计算机科学学士毕业。之后我以美国陆军现役军官的身份前往伊拉克参加“伊拉克自由行动”(注:即伊拉克战争)并在那里从事了两年的平叛作战。在结束我第二次在伊拉克的部署之后,我回到美国申请博士研究生项目,并在马里兰大学拿到了计算机科学的博士学位,研究如何将人工智能技术应用于解决国际安全问题,特别是恐怖主义叛乱所造成的问题。博士毕业之后,我在西点教了三年书并以陆军少校的军衔退役,然后从去年开始在亚利桑那州立大学担任计算机科学的助理教授。
萨卡利亚教授 2003 年作为美国陆军第一装甲师的战术情报官参加伊拉克战争,2004 年以 501 军事情报营排长部署于美军在德国的基地,2006 年作为陆军上尉随第一步兵师重返伊拉克担任军事情报顾问并获得铜星勋章,2007 年加入国防高级研究院(该院发明了互联网和 GPS 等关键技术)担任研究员。2008 年就读马里兰大学的计算机科学博士项目,2011 年毕业后在西点军校任教三年,2014 年转到亚利桑那州立大学。
(萨卡利亚教授提供的私人照片)
我:谢谢您的介绍,并欢迎您来到亚利桑那州立大学。我最近在看您的几篇研究,觉得您的研究非常有意思。在我读您的论文之前,我从来没有将反恐怖主义和大数据或者人工智能联系起来过。我很好奇您是如何开始在这几个截然不同的领域展开交叉学科研究的?
他:怎么说呢,这些研究最初都是来源于我2003年第一次前往伊拉克的作战经历。这场战争和之前的任何一场战争都不同的地方在于计算机的广泛应用。士兵们巡逻回来之后都会把发现的情况和侦测的数据输入电脑并形成数据库。因为我是学计算机科学的,我就在想“我们能用这些数据干什么”,“怎样才能更好的应用这些数据”,“这些数据里面是否有一些不为人知的宝藏可以用来帮助我们更好的对抗恐怖主义的威胁”。我在战场上大部分时间都在思考这些问题,所以当我开始读研究生的时候,我就逐渐把我的这些想法和我开发的软件应用到研究中去,看这些想法哪些能真正对我们的作战起到作用。
(图片来源:Business Insider)
我在我最近写的那本书中就认为伊斯兰国是一种全新的敌人,他们其实是一个从事恐怖袭击的小型国家。所以他们一方面会采用传统的军事行动和周边国家对抗,另一方面又像恐怖组织一样四处进行恐怖袭击,而且他们还是两种策略同时进行的,这就严重挑战了我们过去应对恐怖组织的传统思维。过去我们的方法是试图发现恐怖组织的行为模式,并根据行为模式找到事件之间的关联。可是有的时候我们找到的并不是关联性事件,而可能仅仅是偶然性事件。在过去,我们通常是依靠专家根据他们多年经验评估我们掌握的数据,并以此来排除偶然性事件。现在我们有着海量的数据,我们可以用大数据的方式更好的了解伊斯兰国,并在大数据的基础上突破过去的关联性局限,在事件与事件之间建立起更有说服力的因果关系,而这正是我近期研究致力于的方向。
2012 年萨卡利亚教授的一篇关于恐怖组织内部结构和斩首行动成效的论文引起美国高层的注意,联邦国会众议院常设情报委员会邀请他前往国会介绍他的研究成果。萨卡利亚教授还开发软件用于侦测阿富汗的自制炸弹(SCARE)和通过社交媒体分析芝加哥黑帮的组织结构(GANG 和 SNAKE)。
我:我注意到您的研究采用的数据大部分来源于战争研究院这所华盛顿智库的报告,而且您的研究也是公开的,甚至您的研究就是用一台普通的商用计算机实现的。如果伊斯兰国知道您正在做的研究,然后改变了他们的行为模式怎么办?为什么您要将您的研究公之于众呢?这背后有些什么考虑?
他:你会有这样的疑问是很合情理的,这也是一个值得我们去探究的有趣问题。首先,研究公开对美国国防部来说非常重要。因为基础研究能为实用研究提供肥沃的土壤,所以不管是我们的研究还是我们研究所依赖的数据都应该是可以公开获取的学术资源。
那么伊斯兰国是否会因为我们的研究结果去修正他们的行为模式呢?理论上他们是可以的,但是我们需要考虑几个情况。首先,伊斯兰国的运作是受到很多限制的,他们并不会变魔法,所以他们在现有条件下是很难改变他们的行为模式的。尤其是这篇论文刚刚发布,他们恐怕还来不及根据这篇论文的研究结果进行大幅度的变动。其次,我们这篇论文其实起到的是抛砖引玉的作用,我们的目的是希望国防部把我们的算法用在一些更庞大更完整的数据库上,从而可以更好的发掘出伊斯兰国的运作模式,而这些数据库通常是保密的。还有一点我想说的是,之前在其他相关的论文中我也运用了类似的博弈论和对抗理论,而在那些论文的模型和算法中,即使对方处于最强大的状态中,他们的行为模式也会受到限制且很难发生改变。所以我想伊斯兰国的行为模式也不会因为获知了我论文中的信息就能发生巨大的变化,因为现实条件对他们还是不利的。
(战争研究所,图片来自网络)
我:这项研究的数据库由 2200 多个有记载的军事行动所组成,请问您是如何从这么庞大且看似随意的数据中选择有用的数据来分析伊斯兰国的军事策略呢?
他:你提出的这一点很好。在这个研究中,我们收集了六个月内 2200 多次军事行动,既有伊斯兰国的行动也有叙利亚政府军和美欧盟军的行动,我们试图发现这六个月中军事行动密集出现的时间段,以及双方各采取了哪些类型的军事行动,从中我们试图找出导致伊斯兰国在某个时段密集采取军事行动的原因,以及这些军事行动之间的关系。
因为我们有如此庞大的数据,所以就产生了数量繁多的变量组合,因此我们通常会找到多个潜在的原因。这时候我们就要区别这里面哪些是偶然性事件,哪些是原因。然后我们会进一步比较这些潜在的原因,而其中那些能对特定结果出现的可能性产生持续性增加效应的原因就是真正的原因。
在研究中,萨卡利亚教授分析了伊斯兰国的步兵作战、汽车炸弹袭击、自制爆炸装置、自杀式袭击和大规模斩首和逮捕等作战方式,伊斯兰国在伊拉克和叙利亚两个战场采取的作战方式之间的关联,以及伊斯兰国如何应对叙利亚政府军、伊拉克政府军和美国为首的盟军的空袭。
(萨卡利亚教授在西点的官方页面)
我:你在研究中还采用了 APT 逻辑,规则学习和因果论证等方式,但这对于普通读者来说似乎比较难以理解,您能用平实的语言大致解释一下您的算法吗?
他:其实这些道理都很容易。APT 规则学习策略是用来发现相关性的,而 EBT 规则学习的算法则是我在读研究生的时候开发出来的,我们这项研究的方法论是基于新泽西斯蒂文斯理工学院的一些研究人员的科研成果,而这主要是用于前面我们说的潜在原因比较。我们的研究就是把这些技术整合在一起,找到伊斯兰国的军事策略之间的相关性,然后比较这些潜在的原因,然后基于我们之前提出的假说,找到最有可能引起特定结果的那个原因。
我:那其他因素呢?您是否有放在您的研究模型中考虑环境,天气和政治局势等值得考虑的变量呢?如果有的话,您是如何处理这些因素的?
他:我们的研究基于我们所采用的这个数据库,我们所观测的变量在数量上来说非常庞大,在类别上来说非常广泛,但是我们并没有观测政治或者其他外部环境的变量的影响。但是这些变量在未来的研究中是可以放进现有的研究范式中的。我们现有的数据库主要关注的现象是诸如哪里发生了恐怖分子渗透,哪里发生了路边炸弹,哪里遭遇了恐怖袭击等等。
(今日 ISIS 战报)
我:那就是说战争研究所提供的这些报告中并没有涉及政治、天气和环境等因素,所以你们的研究没有涉及这些变量,对吗?
他:对,当然没有理由认为这些变量不能放进我们现有的这个框架之中,但我们现在还未涉及而已。
我:您刚才说到伊斯兰国是一种新型的敌人,那么他们和之前同样危险的基地组织之间的差别是什么?
他:我认为伊斯兰国和基地组织最关键的区别在于他们有更明确的军事目标和实际的势力范围。正如我前面所说的,伊斯兰国的武装分子他们正在运作着一个国家,并像国家一样采用传统的军事作战方式。与此同时,他们又像基地组织等其他恐怖组织一样采用恐怖袭击和敌后叛乱等非正规军事作战方式。相比之下,基地组织则只采用恐袭和叛乱等方式与我们对抗,没有打算组建国家或者搭建一个作战平台去运用诸如步兵和炮兵战术等传统军事作战方式。这也是为什么我认为我们研究伊斯兰国采用的不同类型军事行动之间因果关系的规则是异常重要的,因为像基地组织这样的恐怖组织我们没办法用大数据从他们的恐怖袭击战术中分析出他们的意图。但因为伊斯兰国同时采用两种作战方式,所有我们有的时候可以发现他们如何用恐怖袭击的方式来增强自己传统军事行动的成效。比如我们研究就发现,当伊斯兰国在伊拉克境内某处发动传统军事行动的时候,他们倾向于在伊拉克境内其他地方,特别是在巴格达,采用汽车炸弹的方式发动恐怖袭击并以此困住伊拉克政府军和警察部队,这样他们就可以避免巴格达派出增援部队支援被他们袭击的前线阵地。
我:那他们其实是充分利用了两种策略的互补性?
他:正是如此。他们就是利用恐怖袭击的方式来削弱和干扰中东各国传统军事力量,从而实现自身的军事作战目标。
我:您这项研究中所发现的那些伊斯兰国的军事作战“规则”是否有被美国和其他西方国家用来对付伊斯兰国呢?如果有的话,这些规则在战场上是否取得了预期的效果?
他:现在中东那边的情况是,盟军,包括伊拉克国防军,都注意到伊斯兰国发动的恐怖袭击的方式有所变化,更多的使用路边炸弹或者自杀式袭击等耗费弹药更少、更不依赖大量一手情报的袭击方式,且更少使用像汽车炸弹这样需要侦察、准备和策划的较复杂的恐怖袭击方式。至于我们的研究是否有影响到美军的军事策略,我认为最关键的一点是我们必须意识到美军现在首要的作战方式是针对伊斯兰国的军事行动进行大规模空袭,因此美军需要和地面的盟军进行协调性作战,比如让伊拉克国防军进行扫雷作战之类的。但因为伊斯兰国采用两种作战方式和盟军对抗,所以我们有必要和我们的盟友进行合作,让我们的盟军出现在伊斯兰国可能采取恐怖袭击的地点及时阻止此类事情的发生。
萨卡利亚教授的团队发现的“规则有”:
1,如果这一周伊斯兰国自伊拉克采取步兵作战,下一周他们就将在叙利亚进行汽车炸弹袭击;
2,如果这一周伊斯兰国在提克利克发动攻势且执行大规模斩首,那么接下来他们将在伊拉克和叙利亚进行大量的自制爆炸袭击;
3,叙利亚政府军的空袭将导致伊斯兰国在接下来一周大规模逮捕民众;
4,如果盟军在伊斯兰国进攻安巴尔省的时候对摩苏尔发动空袭,那么下一周伊斯兰国将会在伊拉克发动自制爆炸袭击;
5,如果盟军在伊斯兰国进攻叙利亚的时候对摩苏尔发动空袭,那么下一周伊斯兰国将会在叙利亚发动自制爆炸袭击;
6,伊斯兰国在发动大规模步兵作战之前会在巴格达部署自杀性汽车炸弹袭击以阻扰伊拉克政府军和警察部队增援;
7,伊斯兰国在发动步兵作战之前会进行炮兵作战,其目的更类似传统军事作战,而非骚扰式作战;
8,盟军空袭和伊斯兰国部署自制爆炸袭击的关系暗示伊斯兰国更多的采用分散式、叛乱式的战术对抗空袭。
我:那就是说您的研究已经被用于盟军的军事战略了吗?如果是军事机密的话就不用回答这个问题了。
他:这些研究成果都是现成的。我一直和国防部的人保持联系,商讨关于作战模式转型的问题。我们的目标是开发通用型的技术,并将其广泛应用在国防部的系统中。
我:您前面说到伊斯兰国的恐怖袭击和他们的军事行动是有因果关系的。现在伊斯兰国的恐怖袭击已经超出中东地区,并开始在欧洲进行了数起大规模恐怖袭击。而与此同时伊斯兰国的传统军事行动也遭到盟军的遏制和挫败,丧失了 10%的势力范围,在伊拉克和叙利亚节节败退。那么我们是否可以假设伊斯兰国的传统军事作战上的失败和他们在欧洲的恐怖袭击数量的增加有因果关系呢?
他:我们现在这项研究极大的依赖历史数据。我们的研究是建立在参战双方2014 年军事行动的数据之上的,而在 2014年伊斯兰国正处于自身实力的巅峰,他们有能力重复性的进行类似的军事行动,不管是步兵作战、炮兵作战还是恐怖袭击,因此我们可以通过分析那六个月的军事行动发现其中的关系和规律。但伊斯兰国现在在其他国家发动的恐怖袭击,虽然数量上在增长,可在统计学上来说只是孤立的事件,他们发生的频率并没有高到我们可以从中找出规律和模式的程度。而伊斯兰国失去控制区域这件事情本身也是新现象,发生频率也没有高到我们可以得出类似“他们在极短时间内丧失多少土地就会引发一系列恐怖袭击”这样的结论。
我:那就是说大数据研究还是有其不足之处的?
他:我们的研究仅仅是大量针对伊斯兰国研究的一部分,也有其他的研究关注那些数据上的异常现象。
我:那您这项研究所用到的算法和模型是否也能用在有关伊斯兰国和恐怖主义的其他领域呢?
他:我相信可以的。我们的研究分析的是他们行为模式上的因果关系,因此可以让我们更好的理解他们采取某种行动背后的原因,并根据他们过去的行动来推断出他们接下来可能会采取哪些行动。而这样的因果关系分析有非常广阔的应用前景,未来的潜力非常大。
我:现在伊斯兰国依旧是我们当前的一个重大威胁,那么您这项研究还有在继续进行吗?您有加入新的数据,包括那些机密数据,去更新您的研究成果吗?
他:我们的确有和国防部官员进行密切的互动,讨论这个研究的下一步方向。我们还和亚利桑那州立大学的其他研究者们一道来分析极端分子如何利用社交媒体进行极端思想的传播和招募新的极端分子的问题,这个项目被称为“密涅瓦计划”,国防部为该计划提供了三年的研究资金。
密涅瓦计划:一项由美国前国防部长盖茨在 2008 年发起的研究计划,致力于深入了解对全球具有战略利益地区起到塑造作用的社会、文化和政治机制。通过对全球人口的深入了解,密涅瓦计划将会产生更多有效的战略和政策。密涅瓦学者将有机会为上至参谋长联席会议主席等国防政策的决策者、下至美军第一线的地面指挥官提供与战争高度相关的、有价值的分析和洞见。
(萨卡利亚教授及其团队成员,图片来自网络)
我:这也正是我想问的,据说你们这项研究旨在发现伊斯兰国在社交网络上进行招募的运行机制并以此对他们的招募进行阻扰,那您能更进一步和我们谈谈这个项目的细节吗?
他:好的。这是一个非常庞大的研究项目。这个项目并不仅仅针对伊斯兰国,其关注点在于发掘极端思想是如何在社交网络上变得病毒化的。我和我们研究小组的成员将会通过多种方式检测不同类型的消息是如何跨越熟人圈子而开始病毒化传播的。但我们主要关注的是传播方式,以及信息内容所属的类别。同时我们还关注文化对消息传播机制的影响,所以人类学等社会科学的研究者也会加入我们的团队,帮助我们更好的理解大数据,然后我们才能更好的理解极端组织在互联网上招募的机制。
萨卡利亚:我们如今不再为领土而战,我们为人们的思想观念而战。
我:基于您刚才说的,我觉得这里有一个潜在的道德风险。这项技术可以用来对付伊斯兰国,但也可能被政府用来侵犯我们第一修正案的权利。特别是斯诺登揭秘之后,似乎在国家安全和个人自由之间总是存在着一股张力。您是否认为这项技术会不会比它要对付的敌人更危险呢?
(国防部密涅瓦计划)
他:我不这么认为。首先,这项技术将会公之于众,发表在公开的学术媒体上。其次,我们只是试图分析这些带有病毒潜力的消息能够广泛传播的原因,所以我们并没有研究如何采用先发制人的手段去阻止他们的传播……
该团队发现伊斯兰国的线下招募对象通常是孤独、被边缘化的大学新生,这些人一般都犯过一些小错或使用过毒品,或出身于与极端思想有联系的家庭,加入极端组织让他们找到归属感。
我:那您认为这项技术本质上是中性的,取决于谁会使用它?
他:怎么说呢,现在有很多研究团队都在研究社交网络和病毒式传播,而且这些技术都有着广泛的应用前景,所以我觉得不能用“道德”和“不道德”的方式来对技术进行简单的划分,尤其是这些社交网络的应用本身是开放的。我们的研究并不会试图盗取社交网络用户的个人信息,仅仅是分析病毒消息的传播机制而已。
该研究将会在逻辑编程框架内嵌入社会心理学模型,对社交网络的行为、特定个体的特征和个体之间的关系进行搜集和分析。该研究团队将会检视社交网络上特定人群的互动模式、他们的关键符号、他们中间的关键用户和他们的意识形态取向。该团队将通过在线调查媒体研究、以及和地方专家会议等方式挖掘网上的极端倾向和极端主义者的个性特点。
我:我注意到在另一篇关于这项研究的报道里面,您的同事提到你们团队还有东南亚的区域研究专家,这位专家也是来自亚利桑那州立大学吗?我们学校一直致力于跨学科研究,你们这项研究涉及很多跨学科的领域吗?
他:对,这位东南亚研究的人类学家也是亚利桑那州立大学的研究者。他的研究将会侧重于分析特定族群和文化对使用者社交网络上行为所产生的影响。他现在正在一些相关国家进行田野调查,他的研究将会帮助我们提高我们算法的效率,让我们了解到文化背景对于一个消息大范围传播所产生的影响。
密涅瓦计划所提供的资金将会用于亚利桑那州立大学的宗教与冲突研究中心,该研究团队包括该校计算机科学、社会学、政治学、历史学、宗教学、人类学、社会心理学的研究者。
(萨卡利亚教授的团队,助理教授就能率领 CySIS 实验室和数百万美元的大项目)
我:你们这项研究涉及六个国家,但为什么是这六个国家?为什么没有研究美国呢?
他:我们刻意回避美国是因为这是一个国防部注资的项目,我们不想给民众一个错误的印象认为国防部在通过研究的方式监控美国公民的网络行为。而我们所以选择的国家则组成了一个比较有代表性的样本,代表了全球的不同区域,这里面有欧洲国家,也有中东国家,亚洲国家和非洲国家。
这些国家是印度尼西亚、马来西亚、尼日利亚、英国、伊拉克和叙利亚。
我:可是为什么也不包括阿富汗和巴基斯坦这样的穆斯林国家呢?我觉得对于研究极端组织的社交网络行为来说,这些国家也很重要才是,是什么原因让你选择了现在的这几个国家呢?
他:其实我们也有很多其他感兴趣的国家最后没有列入我们的研究计划。比如乌克兰,那里现在也是热点区域;比如哥伦比亚和墨西哥等国,那里也有很多极端组织和武装冲突,非常值得去研究。但我们这是一个社科领域的研究,我们的预算很有限,所以我们没有能力同时研究这么多国家。
我:好的,这些基本上就是我今天想问的问题。最后我有一个个人感兴趣的问题,为什么您从西点转到亚利桑那州立大学来从事研究工作?
他:哥们,因为天气啊!这里一整年都是夏天。
来源:知乎日报
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14