【IT168 厂商动态】随着云计算和大数据的兴起,开发者们面临着全新的挑战和机遇。拥抱最新的技术发展趋势,才能在竞争中占得先机,程序员们急需一个高质量的干货分享和交流平台,共同学习交流当下的前沿技术。
10月25日,在UCloud技术沙龙上,来自网络、大数据和应用性能管理领域的专家分别就相关的最新最潮的技术为大家做了分享。
UCloud杨镭:SDN如何解决云网络中的多租户需求
SDN(SoftwareDefined Networking) 通过重新思考转发层与控制层的关系,以及每个角色的特点,将控制、转发层分离——控制层完全由软件通过OpenFlow等南向协议控制转发层,从而实现网络的灵活控制。SDN也是近年来在网络方面非常热门的技术。
UCloud网络技术专家杨镭为大家分享了在云环境下,SDN如何解决网络中的多租户问题。云计算作为颠覆传统IT架构的一种潮流,在成本、灵活弹性、可靠性等方面有着很大的优势。在云网络中,多租户是最基本的要求之一。但是多租户在公有云环境下的实现,相对于企业内部和私有云难度要高很多,虽然传统网络中基于VLAN的隔离手段已经比较成熟,但公有云场景下VLAN最大只能支持4096个(每个用户可能需要多个隔离的2层,一个用户又有多个子账号),显然难以支持公有云计算平台更大的网络规模需求。NVGRE和VXLan代表的Overlay技术作为目前公认的解决方案基本解决了云环境下的各种新需求。尽管在性能方面还不如传统的VLAN,但可改进点非常多,需要一定的时间。
在SDN出现之前,网络发展出现了停滞,做网络变成堆砌协议,网络工程师淹没在层出不穷的各种协议中;SDN的出现让大家对网络能有重新的认识,SDN将网络发展推到了十字路口,让网络问题能从更加接近本质(连通性和转发)的角度出发思考:转发层保证连通性,控制层来控制如何转发,让业务需求在这里得到满足。类似TCP/IP协议的多层模型,分层使得创新突破能分层出现,减少了耦合带来的制约。
SDN的控制层实现类似于一个分布式处理系统的实现要求。这使得10年来互联网公司技术创新的成果能在公有云这种超大规模的网络管理中实践。SDN将一个网络领域的小众问题转为一个常见的已经被处理的得心应手的问题。虚拟网络可以根据业务需要进行定义上。业务上的需求挑战转为分布式系统设计的挑战,后者的处理能力决定了交付出的网络功能,稳定以及灵活性。传统的2层网络在云场景中有不一样的理解定义,使得传统的限制不再存在,简化了云网络中用户在网络管理上的负担。
上海高欣周诚:基于Hadoop & HBase的在线实时文字转换技术
近年来关于大数据的应用研究非常热门,但是大部分是关于Hadoop支持的离线数据处理,关于在线的大数据应用相对较少。上海高欣的技术总监周诚,介绍了在东方输入法中的文字转换技术,如何基于Hadoop & HBase技术来解决其中语料收集、海量数据存储,机器学习和在线实时计算等问题。
东方输入法的文字转换技术主要包括云端联想、本地拼音、本地五笔等。在线实时文字转换技术难点在于语料的收集、海量数据的存储、大数据的离线机器学习、数据库的选择、在线实时计算和云系统的高可用性。语料是实现文字转换技术的数据基础,通过网络爬虫将网页正文保存成文本, 并通过ETL转换到HDFS中,最后通过MapReduce实现了机器学习模块。其中,网络爬虫使用HBase存储URL队列。
汉字与拼音的转换,是自然语言学科的研究方向之一。首先对语料进行分词、词性标注、拼音转换,再利用HMM等数学模型对上述处理过的语料进行训练,最后达到所需模型,输出满意的结果。对于数据库的选择,根据简易性、通用性、容错性、效率等方面结合考虑进行选择。在线实时计算中主要包括WEB Service、实时计算模块、HBase。其中实时计算模块中包含Coprocessor End-Point 和Storm。在东方输入法中,采用在线实时计算技术,解决了连续拼音转汉字问题,能够实时的在云端匹配成功。最后系统的高可用性体现于作业主要采用分布式事务数据控制单元(分布式文件系统HDFS),业务查询模块也采用分布式DB-HBase。
在高欣cloud(Gcloud)中,主要采用Hadoop、MySQL、Storm、HBase、Spark、Hive等技术,结合UCloud云平台产品UMem、UHost、UNet、UMR、ULB、UDB等进行作业。在高欣DC架构中,底层采用Hadoop的HDFS,中间层采用HBase集群,分布式计算集群,对外服务通过Web Service和MySQL。
OneAPM黄东:字节码和网络抓包在应用性能管理中的实践
随着大数据、云计算的兴起,各个互联网企业的应用系统架构变得越来越复杂,为保证系统的平稳运行,一个完整的应用系统又会由各个子系统组成:如:1)web前端系统;2)中间件集群; 3)数据库集群;4)缓存系统; 5)分布式存储系统等。传统运维的技术,只能对各个子系统进行单独的监控管理,无法从业务的角度整体观察IT系统的性能。因此,传统运维中,系统故障定位困难,运维的压力也在不断加大。
随着应用性能管理技术的发展,逐步打破了这项瓶颈,企业可以通过此类技术低成本的实现业务性能的监控及深度分析。由此,应用性能管理技术也出现的多项分支,常见的如网络包捕获技术,字节码技术,日志分析等。下表为上述3种技术的优劣的对比:
不难看出,使用BCI技术实现的用户事务级监控是最优的解决方案,但是也是最难实现的。
现如今,java是BCI运用最成熟和最规范的语言,OneAPM也是使用BCI技术,实现了java语言的应用性能管理解决方案。OneAPM系统可以实时抓取业务系统执行缓慢的的程序代码及SQL语句,快速深度的查找问题。
UCloud技术沙龙第一次举办获得了圆满成功,后续UCloud还会在上海、北京、深圳、广州等城市进行全国范围内的线下交流活动,提供一个行业、技术干货的交流平台,开发者们可以在会鸽、活动行,31会议网上关注UCloud活动的预告。