@ fnii.cn

登录邮箱

黄韬

发表日期:2015年12月11日      共浏览 682 次      编辑:


非常高兴我来做一个自己研究方面的报告。今天是SDN的网络虚拟化。我重点想讲实验平台的设计,在我们这几年的研究当中,还是发现了很多问题。SDN控制平面有一个根本性的问题,是在做虚拟化的时候面临了很多的挑战,我今天希望在虚拟化方面跟大家分享一下我们的想法。

第一部分是技术方面的想法,一个是探索方面的想法。

它的优势就是技术很成熟,而且大量的用在现在的局域网企业网,这些配置起来很复杂,在很多的功能需求只求,开通时间很长,难以满足在新的场景,比如说数据中心,比如网络功能虚拟化,这两种类型的虚拟化技术,传统的二层和三层的网络虚拟化技术,面临一个比较大的挑战,这些年大家一直看到学术界有看到同仁做的事情,是否能满足业务多样的需求,希望有更好的灵活性,更好的弹性,自动化的能力和更高的效率。

它的特点大家可以看到,以这种V×LAN的核心构建,它的一个核心的方式通过这种虚拟化的方式,只是让用户可以对网络终端侧的设备进行定义。这个虚拟化技术的控制逻辑对用户来讲是不需要的,在DAT或者大的运营商里面,租用一个网络的资源,其实最需要的是计算和存储的资源,这个是在数据中心里面的。这个虚拟化技术解决了连通性的问题。这个虚拟化的技术,我们认为它最核心的局限性在这里。

下一步正在探索的就是面向大网的网络虚拟化如何来构建。第一个场景就是这次大会的主题,重点关注的一个事情,要满足创新的实验,必须做到一个端到端。可能产业界也提了很多年的,就是虚拟运营商,其实原因就是技术不成熟,目标看上去非常美,边界很清晰,所有的基础设施都可以共享,让每一个用户,每一个应用平台都可以在统一的平台上进行业务网的定制,追求的目标也是需要在网络虚拟化层面上做到一个完全的隔离。

这个需求是现在学术界和产业界研究的很关键的问题,又没有得到很好的克服,这种虚拟化要求每一个上面的用户,都能够对底层的业务逻辑进行定义,定义它的带宽,定义它所有的流量,这个相比云数据中心里面更清晰一点。SDN的技术由于提供的非常细腻,或者各种不同力度的定义的能力,就给了我们现在做到网络虚拟化的一种可能。

实际上要做到这个事情有四个非常关键的步骤,第一个步骤是接入识别策略,每一个用户进入我的网络的时候,我首先要标识出来这个流也好,它应该是属于哪一个业务,属于哪一个虚网的。它需要在入口处进行租户流量的识别。第二步,在虚拟网络中做到流量的标识,有些场景里面要实现地址的复用,很多两个租户有两个地址的需求。要实现节点的虚拟化。可能很多同学在早年斯坦福大学提出的FLOWVISOR技术,它在这个技术里面怎么做这件事情,当时的核心想法就是在做实验平台,很重要的一个控制平面用了这样的工具。追求的是实现力度非常详细,大家可以看到接入识别策略,使用的是12元组。在实验者用户来讲,可以根据所有的需求来组装,出现很多融合。进行流量识别的时候同样用了12元组来做,它有很多的缺陷,在流量的缺陷方面空间会产生冲突,而且在地址复用方面也没有做太多的处理,这个真正走向产业界的时候会发生很多问题,包括我们用在我们的试验网里面也会出现很多了问题。

2011年由意大利的一个实验室CEATENET的一个实验,它实际上是牺牲了灵活性,它变的没有那么的灵活,这个做法先减少了复杂度,可以用更简单的方法达到它的目的。由于它做了简化,所以说它从理论上实际解决了流量泄露的问题,也解决了地址复用的问题。

在虚拟节点的抽象和虚拟链路上,支持拓扑任意虚拟化,真正意义上把2015年以来做的网络虚拟化这件事情,希望往实际平台进行策划和移植,能够有些实际的系统出来。在2012年又推出了一个平台,它实际上又回到了第一条路线,它发现第二个方案灵活性不够,在解决试验网的时候发现了问题,因此用了12元组,它做了一些尝试,同时也做了一些节点和链路虚拟抽象的工作。

美国的斯坦福大学ON LAB一方面整个操作系统,另外一方面很重要的一个开元项目在OVX,它的核心理念和意大利的实验室方案有些类似的地方,它选择了一个MAC地址。我们可以看到很多云计算的公司,现在认为这个方案是一个非常值得下一步进行落地的方案,它的虚拟化更强,能够实现拓扑链路。

前面介绍的几种技术,我想给大家对比分析一下,这几个类型的技术无于乎就这四个点,我们可以看到第二和第四个方案,两个相比其他方案的很本质的特征,就是采用了单元组合的方式进行隔离,达到的一个效果可以看到,面向的场景是多租户场景,特别适合云计算场景。它的应用场景和最后选择方案是相关的。大家可以看到流量标识的策略,实际上在网内的隔离问题。这两种方案支持了流量的完全的隔离和地址的复用。最本质的一点是它使用了一个标签,保证所有的每个业务全部不会造成任何的干扰冲突。

我们需要考虑到未来的应用场景什么,我们到底应该选择哪种方式定义流的策略。对于虚拟的节点抽象和虚拟链的抽象,实际上是从最开始的不支持到部分支持,现在这个华为公司和我们探讨过很多次,现在他们已经基本上认可网络虚拟化技术,逐渐转移到他们未来的生产网络里面,面向这种大网里面,都必须具备这种虚拟化的控制能力。

面对这个问题,我们也做了一些尝试,从前几年开始,我们选择了一条路线,国家网络实验设施上面,怎么实现各个实验的先切入隔离。这个平台我们虚拟化的策略,还希望支持1.3版本,比如说这种39元组,希望提高更高的复杂性,整个控制变的更为艰难。

在流量隔离方面,有一部分的技术手段,造成冲突以后,可能会对我们的实验设施造成很大的问题,这里面采用的是基于QINQ+DPID,这种方式采用冲突检测方法可以避免时间流的冲突。需要在交换机平面上和控制器平面上设置一种协议也好,机制也好,需要在交换机平面把队列的开放出来,控制器希望指定队列的有限集合宽度,才能使每一个用户都可以控制到队列的宽度和优先级。虚网映射,这些都是华为在关注的问题。我们在这个项目里面,重点是用SDN的手段解决虚拟化的问题。

下一步要解决什么问题呢?工作还非常多。包括地层的抽象最基础的问题,目前还存在额很大的争议。需要从抽象模型上面来引入,来兼容。包含这种迁移,包含OM的管理,这方面都有很大技术的挑战。从系统的挑战来讲,这个系统的扩展性怎么样,如何保证一个大规模的使用,以及这种可湿性帮助人员进行管理,这方面有很大的挑战。

下面介绍一下实际的一些情况。实验平台最核心的一点,就是希望能够面向各种业务需求和结构的需求。大家可以看到这个架构也是比较简单清晰的,中间这一层是资源的虚拟化,上面再进行业务的编排。这个平台要考虑的场景,比如说域内的情况,也要考虑域进的变化,也可能涉及是基于光的传输链,只有这样才能把一些现有网络的流量引入到实验网络里面来。每一个用户大家可以看到,实验用户从最上面,首先登陆这个门户,在上面进入虚拟化的管控平台,来切分自己的资源。大家可以看到的是,除了这个资源虚拟化,在上面要进行相应的各种终端的接入,保证动态的情况。

这是系统平台的设计,整个这个平台除了要解决交换机,可编程的交换以外,包括云计算的平台,也要纳入统一管理。而且这个实验平台希望通过接口,和试验平台进行对接,这是整个架构的情况。我们在北京邮电大学已经了四年的时间,这个是一个校园级的平台,在SDN平台上今年也正是对外开放了,只要通过申请就可以能够在这上面获得相应的资源,开展相应的实验,现在的资源情况比较少。下一步希望在这个平台上把功能进一步完善,来满足国家重大基础设施的需求。

这个是在2012年北京邮电大学当年部署的一个平台。分布在各个楼,通过在每个楼部署相应的光纤,把所有的连接起来,组成一个SDN结构的实验网。控制平面就是利用虚拟化的技术来进行实验。各个实验室之间还用了隧道的技术融入到互联网。

基于这个实验平台,一些实验把录用挪到这个平台上面来了,学生在这个上面进行自定义的实验,进行提交,再进行对接,就可以更方便的进行实验,而不像以前每个礼拜只有两个小时到实验室工作。有底层光的层面,还有二层三层的实验,很多老师和同学都在上面进行验证。

这个平台大家可以想象到,现在是基于工业互联网进行部署的,其实也是可以做二层的实验,其实是在三层目前已有的上面,初期的一些学生的实验和一些产业界创新的实验都是可以在上面的。这个是实验平台的一个情况,用户登陆以后可以看到整网全局的情况。可以根据自己的需求定义自己的子网,有160个虚网,54个正在并行着运行。下一步如何扩展性的问题,如何保证上千的用户,每个用户都有自己的需求,这上面进行这种压力的测试,都还有很大的挑战,也是我们下一步的工作。

这是每个用户都能够自由的定制自己的期望,这是一个详细的情况。这个上面的流量的控制,ODR的研究,这些实验都可以在上面进行演示。

这个平台一直的一个目标,或者下一步这个团队在做的一个想法,首先最核心的是资源抽象的隔离,尤其是现在在实验场景下面临这个场景,是非常有价值和意义的。自服务和业务编排层面,这个是希望针对这个实验的需求,我们怎么样给每一个用户能够体规一个非常完善,非常简便,按照需求定制的。性能的优化,这个也是很重要的,在这里面大家很多地方都希望开通一个虚网,这就希望我们能够实现秒计的速度。这里面对于未来我们看到的BAT也好,对于他们是非常有价值的。大规模组网的问题,当成协议发展也好,这个有很大的挑战。我们在尝试这些事情。

这是平台的一个网址,大家不知道的同学可以去看看,可以进行使用。

我今天的报告就到这里,谢谢大家。