北京大学邹磊副教授随后带来了主题为《图数据库技术在知识图谱数据管理中的应用》的演讲。
在报告中,他首先回顾了一些经典的按照关系数据库的方法来管理知识图谱数据。然后,集中讨论从图数据库的观点来研究知识图谱数据管理的问题。最后,演示了基于图的RDF数据管理DEMO系统,gStore和Answer;前者是用来设计支持SPARQL1.1的RDF存储和查询系统,后者是用来支持自然语言和关键词的RDF语义检索系统。报告中,将介绍现有的分布式知识图谱数据的管理的相关工作。
唯一一位来自海外的专家,美国犹他大学计算机系李飞飞副教授最后压轴出场,他研究的课题是目前比较前沿的在线数据处理技术。
在主题为《互动式在线数据分析技术与系统》的演讲中,他提到在当前时代背景下,数据量越来越大,数据的异构性也越来越强。这样就催生了目前的应用系统大都采用分布式数据结构的形式。在这种情况下,就要面临很多挑战。过去针对海量大数据的计算,或者说那种针对精确计算的形式显然已经不合符要求,未来Online计算的方式将更符合目前海量数据的计算要求。
李飞飞在演讲过程中分享了美国气象局的案例,真实的展现了互动式在线数据分析技术在这方面数据处理的能力。同时强调在线数据分析的技术,如何能够online边搜集边计算的方式,对于未来主流数据技术的发展的重要性。
会议的结尾,孟小峰教授对本场会议做了总结。他表示,在未来海量数据的处理要求下,传统数据库技术进一步延展深度数据问题的解决是一种能力,对广度数据关键数据的关联问题也是一种能力,流数据的处理能力也是当前大数据关键问题的解决办法之一,再加上在线数据搜集与处理的技术,几个前沿技术浑然一体,可以对当前大数据关键问题给到很好的解决。