܄

清华大学研究员崔鹏:物理模型结合大数据建模,弃用深度学习

【数据猿导读】 8月26-27日,由中国人工智能学会(CAAI)发起并主办、中科院自动化研究所与CSDN共同承办的 2016中国人工智能大会(CCAI 2016) 将于在北京·辽宁大厦盛大召开。会前,记者对清华大学计算机科学与技术系特别研究员崔鹏进行了专访

清华大学研究员崔鹏:物理模型结合大数据建模,弃用深度学习

8月26-27日,由中国人工智能学会(CAAI)发起并主办、中科院自动化研究所与CSDN共同承办的 2016中国人工智能大会(CCAI 2016) 将于在北京·辽宁大厦盛大召开,汇聚全球顶级人工智能专家共论前沿技术与产业实践。除了重磅主题报告,大会设置了“人工智能驱动的人机交互”、“机器学习的明天”、“人工智能青年论坛”和“人工智能产业论坛”等四大专题论坛,邀请来自知名院校及创新企业的专家担任论坛主席,就当前人工智能领域的核心问题展开讨论。

大会前夕,“人工智能青年论坛”联席主席,清华大学计算机科学与技术系特别研究员崔鹏接受CSDN记者专访,介绍了他在人工智能领域的研究和进展,所采用的方法和心得,以及人工智能青年论坛的策划思路。

崔鹏的兴趣在于对人的理解、对人的行为建模,出于人的行为机理的复杂性以及动态性,他使用物理学理论模型与大数据模型相结合的方法来处理,目前已经可以构建一个关键统计指标和真实社交网络基本一致的社交网络,可以对社交网络信息传播进行准确的预测。深度学习在大数据处理上虽然性能很好,但是是黑盒的,与简洁、精确刻画人类行为机理的初衷相违背,所以不能用在这个模型。

清华大学计算机科学与技术系特别研究员 崔鹏

崔鹏,清华大学计算机科学与技术系特别研究员、助理教授,研究领域包括数据挖掘和多媒体分析。在数据挖掘和多媒体领域的高水平国际会议和期刊上发表论文60余篇。最近的成果包括ICDM 2015最佳学生论文奖,KDD 2014最佳论文Finalist,ICME2014最佳论文奖,MMM2013最佳论文奖,ACM Multimedia 2012重大技术挑战奖等。曾多次担任ICDM、ACM Multimedia等高水平国际会议的程序委员会领域主席,并担任国际期刊ACM TOMM,Neurocomputing的编委。于2015年获得ACM中国新星奖。

以下为采访实录:

CSDN:您是如何走上人工智能技术之路的?

崔鹏:对于我而言主要是兴趣驱动,我本身对跟人相关的东西比较感兴趣,包括怎么对人的行为进行建模去理解人。我原来做计算机视觉,主要研究计算机怎么去理解视频里的人的动作。到2010年社交网络逐渐兴盛,有很好的阵地可以研究怎么理解人的行为,包括理解网络社会现象里边的规律,从而能够开发算法去预测人的行为,预测一个人、一群人或者整个社交网络里面会出现的某种现象,比如哪些信息会爆发,哪些信息会流行,哪些谣言会出现等等。

CSDN:在您关注的领域,最近一年有哪些进展让您感到比较兴奋或者惊讶?

崔鹏:我们现在基本上把社交网络上的信息传播问题研究得比较透了,比如说一条新的信息发布出来,我们可以在很早期就预测出它未来会不会爆发、会在多大程度上爆发。我们的这个工作去年拿了数据挖掘领域顶级国际会议ICDM 2015的最佳学生论文奖,知道一个信息的很早期的传播过程,我们可以预测出它后来任意一个时刻受到的关注度,这个东西可以叫做人工智能,但实际上它已经超乎人的智能——人做不到这件事情,但机器可以利用大量的历史数据去统计、建模。

我们最近在做一项工作,就是希望生成一套和真实社交网络媒体社会平行的系统,这个平行系统里面产生的信息传播过程,和真实的微信、微博里面的传播过程是一致的。如果现在能够做到这一点,我们就真正拥有一套技术体系,能够从根本上去理解人在社交网络里的行为规律,就可以去预测人的行为,进而可以去启发我们设计出更好的系统来为人类服务。

CSDN:在您的工作中,您遇到的主要挑战有哪些?是如何解决的?

崔鹏:这是我们面临的两个最大的挑战:

第一个挑战,就是人的各种行为,它们产生的机制是很复杂的。我们并不知道人心里面怎么想的,只能去观察他的行为规律,从看到的行为去推理这个行为到底是受到哪些决定因素影响的。

第二个挑战,就是人的行为具有很强的动态,随着时间的推移不断变化,行为规律可能有变化。在这种情况下,我们需要有一种很强大的技术手段能够处理这种高动态的性能。

解决这两个挑战很痛苦。我们研究了很长一段时间,后来发现一个比较好的办法,就是把物理学的理论模型和计算机的大数据、人工智能的模型结合起来。

物理的模型是至简的,一个现象,它要用最简单的几个参数描述出来,当参数少到不能再少的时候,它就是能够刻画这个现象的一个最基本的规律(比如万有引力定律)。这是物理学最基本的一个假设,和我们这个碰到的第一个问题就很相关——如果我们能够用尽量少、尽量简洁的模型和参数体系去对用户的行为进行一个比较全面、准确地建模,那么这个参数体系就是对人的行为机理的一个比较好的刻画。

第二,物理里面很多模型都是动力学模型,它是天然地描述一种自然的、连续时间态的现象,而人工智能处理情绪动态学一直是一个比较大的短板,所以我们也希望能够把物理里边的动力学模型进入进来,和大数据去做结合——光靠物理解决不了这些问题,因为物理不具备从大规模数据里面去归纳现象、去建模的理论体系,物理模型可以描述一些现象,可以从理论上做一些推理,但是无法搞懂大规模的人类行为数据(如TB级的数据)。所以人工智能的手段和物理的理论融合,才能从根本上解决这个问题。

CSDN:除了您的团队,当前还有其他团队在使用结合物理模型的方式?

崔鹏:其实我们国家在这方面的起步并不是很早的,如果从国际视野上来看,像美国就有一些军方项目,实际上就是物理专家和人工智能专家协作做一个方向的研究,也是看到了多学科交叉对于解决复杂系统问题的帮助。

CSDN:能否描述融合的那个简洁模型?比如它有多少参数?

崔鹏:比如说我刚才讲到的信息传播的平台,这个体系用四个参数就可以描述了。这四个参数把我们人类行为的异构性、记忆性、集群效应都刻画出来了,这些参数都是有物理含义的,通过这个体系可以产生出来一些数据,各个统计指标非常接近真实数据,所以这些参数确实是对于这个现象的本质的刻画。

CSDN:和真实世界相比较,模型目前的准确率差在哪里?

崔鹏:从统计指标上来看,行为机理刻画和大数据处理相结合的模型产生的数据,和人类真实社交网络里产生的数据相比,已经基本上没有偏差——并不是所有统计指标都很好,我们现在还需要进行模型的进一步刻画,但是比较常用的,或者说比较关键的指标,形态、使用度各方面现在就可以做到和真实的数据基本上是匹配的。从现有的方法,到目前我们提出来的模型,通过一个交叉性的研究,实现了很大的一个跨度。

CSDN:说到情绪动态,您的模型在情绪计算/情感计算方面如何处理?

崔鹏:情感计算一直是学术研究的一个重要方向,最近关于从文本、图像里面感知情感,或者是说能不能通过图像能够推测出来情绪,这确确实实已经是一些前沿的研究课题,我们在2013年也研究过这个方向。在信息传播领域,行为当然会跟情绪相关,但是情绪实际上是更底层的一个信号,可能更上层的信号还是用户行为,情绪只是解释用户行为的一个维度,我们也只是在刻画行为的时候有可能去考虑很多情绪上的因素。

CSDN:处理大量的数据,在计算机模型这一端有没有使用到深度学习?

崔鹏:深度学习是一个纯粹的计算模型,是端到端的,从数据输入到输出要有明确的目标。深度学习框架的性能确实更好,但它是黑盒子,你不知道它内部的结构是一个什么样的机理;而我们做的恰恰是要把这个机理剥离出来。所以我们一般不会采用深度学习模型,用的是另外一套技术方法。

CSDN:从您对目前人工智能领域的观察,您对哪些技术的应用前景比较看好?

崔鹏:我关注的比较多的还是跟人相关的。人工智能去处理资料、处理视频,它可以一步一步做得越来越好,但是我觉得最难的一部分就是让机器去理解人——理解人本身是一个比较突破性的问题。在2015年的时候,美国国防部列了六项所谓的颠覆性技术,其中有一项就叫做“人类行为的可计算建模”,他主要目的是通过计算模型的方式,让机器对人的行为进行建模,从而能够去模拟人的行为,甚至利用人的一些行为规律去更好地去服务人类。我觉得这项技术如果有突破的话,将会是一个很大的一个进展,因为人工智能最终还是要服务于人。有一些商业公司开始去做,包括研究方向上试图去理解人的偏好、人之间的影响怎么去形成、社会结构怎么演化等等,我觉得这个领域既具有很强的学术价值,也很有社会意义,同时还可以看到一些商业模式。

CSDN:谈谈2016中国人工智能大会,您的论坛策划,以及对于从业者的意义?

崔鹏:我们人工智能青年论坛,主要将会讨论“ 当青年遇上人工智能,是机遇还是泡沫? ”人工智能60年的发展实际上非常曲折,而今天的年轻人基本上都没有经历过人工智能的泡沫,对于泡沫并没有太深刻的理解,但泡沫一旦破灭,对整个领域的发展,对从业者工作、生活的影响都会很大,我们也希望大家能够有一个相对清醒的认识:人工智能能做什么,不能做什么,到底它的底线在哪里,现在存在哪些泡沫。我们希望通过我们论坛,让与会者有一个全方位的分析,从而能够对人工智能有一个全方位的认识,清楚地知道现在人工智能的阶段,未来几年会到一个什么样的阶段,可以真正地抓住里面的机遇,而不要去泛泛的去炒作,去透支人工智能的概念。我估计人工智能大会的大部分嘉宾都会谈整个领域发展得很好,能够创造很多的价值。但是另外一个方面的声音,我们觉得也很有必要出现。


来源:极客头条

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

旅游交通大数据——大众旅游时代的“富矿”
旅游交通大数据——大众旅游时代的“富矿”
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...
张涵诚:大数据招商平台可推动地方供给侧改革
张涵诚:大数据招商平台可推动地方供给侧改革

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部