云计算 频道

DTCC前沿专场:洞悉大数据处理未来

  【IT168 云计算】汇集国内外数据库领域顶尖学术专家,探讨大数据时代最新的前沿技术话题,这是本届中国数据库技术大会—前沿技术专场的基调。

DTCC前沿专场:洞悉大数据处理未来

  4月16日,2015第六届中国数据库技术大会在北京新云南皇冠酒店隆重登场。在下午的前沿技术专场上,来自全国重点大学、大数据领域的资深业界专家,就目前数据库学术研究界的前沿成果一一展示。专家们对图数据处理、流数据处理、RDF管理技术以及在线数据计算处理等技术的研究做了深度剖析,为在场的听众带来了一场大数据领域的前沿技术盛宴,下面小编就技术前沿专场的精彩内容做一盘点。

  DTCC前沿专场:洞悉大数据处理未来
▲中国人民大学信息学院副院长孟小峰

  来自中国人民大学信息学院副院长孟小峰教授作为本场活动的主持人首先开场。作为数据库技术业界的资深导师,孟小峰表示,在中国数据大会这样一个以应用为主的交流平台场合,举办这样一个前沿技术专题研讨非常有现实意义。他介绍本次演讲的几位老师都出自中国计算机协会数据库专项技术委员会,他们不仅具有深厚的学术背景,而且在现实应用开发中也具有丰富的经验,希望能给大家提供最新的数据库管理上面前沿信息。

DTCC前沿专场:洞悉大数据处理未来
▲北京大学信息科学技术学院教授高军

  作为第一位登台的演讲嘉宾,北京大学信息科学技术学院高军教授带来了《可扩展的大图数据管理框架和查询处理》主题演讲,在大图数据管理的相关前沿技术与一些进展方面做了精彩分享。

  我们知道,随着数据采集和存储技术的蓬勃发展,社交网络,生物信息科学、交通导航等领域都出现了规模庞大、内部结构复杂、查询需求多样的大图数据。事实证明,传统图算法无法满足大图数据的管理需求,基于这样的背景,新型扩展计算平台的发展为大图数据管理提供了底层支持。高军在报告中重点讨论了基于关系数据库,基于MapReduce计算框架和基于BSP计算模型的大图数据方法,并介绍了以上方面的研究发展。

 DTCC前沿专场:洞悉大数据处理未来
▲浙江大学计算机学院教授、网易研究院院长陈刚

  浙江大学计算机学院教授、网易研究院院长陈刚第二个出场,由于他的双重身份,所以他结合目前自身科研与实际应用的成果,为我们带来了《云数据库管理系统及在互联网领域的应用》的主题演讲。

  分享过程中,陈刚先就自己在产学研方面的一些心得做了解析。作为网易研究院的院长,他认为,科研与产业的结合,不仅仅体现在资金的支持,尤其在数据库处理技术的科研方面,产业可以为科研提供的还有很多,比如大量数据的提供,新的科研思路的拓展还有充足人力的支持。

  我们知道,云计算变革旨在为互联网产品提供弹性、成本、可用可靠性、可伸缩性更好地IT基础设置,为了达到云计算的目标,负责结构化数据管理的云数据库的实现是最大的技术挑战。浙江大学与网易合作研发的包含云数据库在内的网易私有云平台,目前该平台已经成功应用于易信、手游等核心产品。另外,针对不同的产品需求,网易私有云可以提供云关系数据库服务RDS、云分布式数据库服务DDB和云Redis服务NCR等三大云数据库服务。

 

  演讲过程中,陈刚分别介绍了网易私有云及云数据库的设计理念与系统架构,并详细介绍RDS数据高可靠、RDS与DDB可伸缩性,多租户与资源隔离,数据库性能优化等关键技术的实现,引起了与会嘉宾的关注。

DTCC前沿专场:洞悉大数据处理未来

  ▲山东大学计算机学院副院长、教授禹晓辉

  作为第三位出场的演讲嘉宾,山东大学计算机学院副院长禹晓辉教授带来了他在流数据处理方面的前沿成果,主题为《分布式流处理技术》的演讲引用了很多案例,比如流数据处理技术在交通监控、犯罪嫌疑人排查等方面的有效应用,精彩的阐述了技术革新带来的应用便利。

DTCC前沿专场:洞悉大数据处理未来

  禹晓辉表示,为应对海量高速数据处理需求,分布式流处理模式应运而生。传统的数据库方式并不适合对于这种数据形式的处理,Hadoop是基于批处理,实施相应的模式也不适合。分布式流处理是一种非常好的方式来应对这种数据形式。

DTCC前沿专场:洞悉大数据处理未来

  在演讲过程中,他将相关的分布式流处理技术一一展开,介绍了常用大数据的处理模式,界定分布式流处理的外延;简要回顾分布式流处理的背景和技术演进;从数据模型、系统架构、存储管理、语义保障、负载控制、容错等方面进行分析,比较优势与不足。

DTCC前沿专场:洞悉大数据处理未来
▲北京大学副教授邹磊

  北京大学邹磊副教授随后带来了主题为《图数据库技术在知识图谱数据管理中的应用》的演讲。

DTCC前沿专场:洞悉大数据处理未来

        在报告中,他首先回顾了一些经典的按照关系数据库的方法来管理知识图谱数据。然后,集中讨论从图数据库的观点来研究知识图谱数据管理的问题。最后,演示了基于图的RDF数据管理DEMO系统,gStore和Answer;前者是用来设计支持SPARQL1.1的RDF存储和查询系统,后者是用来支持自然语言和关键词的RDF语义检索系统。报告中,将介绍现有的分布式知识图谱数据的管理的相关工作。

DTCC前沿专场:洞悉大数据处理未来
▲美国犹他大学计算机系副教授李飞飞

  唯一一位来自海外的专家,美国犹他大学计算机系李飞飞副教授最后压轴出场,他研究的课题是目前比较前沿的在线数据处理技术。

  在主题为《互动式在线数据分析技术与系统》的演讲中,他提到在当前时代背景下,数据量越来越大,数据的异构性也越来越强。这样就催生了目前的应用系统大都采用分布式数据结构的形式。在这种情况下,就要面临很多挑战。过去针对海量大数据的计算,或者说那种针对精确计算的形式显然已经不合符要求,未来Online计算的方式将更符合目前海量数据的计算要求。

  李飞飞在演讲过程中分享了美国气象局的案例,真实的展现了互动式在线数据分析技术在这方面数据处理的能力。同时强调在线数据分析的技术,如何能够online边搜集边计算的方式,对于未来主流数据技术的发展的重要性。

  会议的结尾,孟小峰教授对本场会议做了总结。他表示,在未来海量数据的处理要求下,传统数据库技术进一步延展深度数据问题的解决是一种能力,对广度数据关键数据的关联问题也是一种能力,流数据的处理能力也是当前大数据关键问题的解决办法之一,再加上在线数据搜集与处理的技术,几个前沿技术浑然一体,可以对当前大数据关键问题给到很好的解决。

1
相关文章