@ fnii.cn

登录邮箱

张攀 SDN Controller Performance Test

发表日期:2015年12月11日      共浏览 843 次      编辑:


我本来应该是今天上午的演讲。接下来的20分钟里我想分享一下我做的与SDN性能控制的测试工作。我主要从三个方面来介绍,一个是控制性能测试为什么是必须的,第二个我们的测试方法,第三个是分析。因为时间关系我不可能把所有的功能都介绍给大家,我们有一个白皮书,场外可以扫一个二维码进行关注。

我们就从第一个有提到一个控制器,需要解决的一些问题。我觉得这个和我们的想法不谋而合,一些设备他们之间的不兼容,我们的网络用户想摆脱厂商对他们的锁定,这个工作也是我们之前在做的工作,也是我们现在提出的解决方案的事情。第一个是说OpenFlow1.3进行了颁发证书,如果厂商采购这些设备可以极大的解决通信的问题,当然不可能完全的解决,一部分可以解决。第二个我们要谈到性能的问题,厂商SDN的技术,主要的特点是用户驱动的,而不是由厂商推动,这两天我们听到的太多的名字,可以说是灵活,可以说是自动化,这些名词这些词汇这两天的会议里面已经听了许多,但是这些功能是需要靠什么实现,如果性能支持不足,即便是完成这个功能,也不是SDN达到的需求,这个是我们这部分将要重点介绍的内容。第三个就是关于安全、可靠性,这个是我们后续的工作,未来我们会有专门的测试。

下面我简单的介绍一下我们三个测试点,就是三个性能方面然后他对应的结果,我们选择了主流的开源测试器在特定的平台上,在这里就不在PPT里面说,所有的在白皮书里面有说。这个是关于OpenFlow1.3作为我们的唯一的协议,想在特定的环境下最大的控制器是多少,我们需要测量在不同的连接数的情况下内存的使用情况。测试方法因为不再多多的介绍,都在白皮书里面,我们就看测试结果,这个是使用了三种不同的拓扑,最左边是一个线性的拓扑,它在500和600交换机的时候可以正常连接,占用内存差不多是1100兆和1600兆,两个NA是到800和1000的时候,控制器不能跟所有交换机交互,所以我们认为它的数据是不可用了。但是我们看到在另外一个拓扑图里面,中间的那组图所有交换机都完成了连接,内存几乎是线性增长,这个是单点的测试,我们只选点了一个,同时通过我们的测试,能够将单点和集成的控制器做一个对比,因为我们在实际网络中不可能只有一个控制器,我们会有大量的控制器进行一个操作,我们可能会有一个预想,既然是集成,如果更高层次的集成,我这些内存的占用可以说每一个节点除以三或者除以二都可以接受。我们看一下实际情况,这组结果我们刚刚说到在到800的交换机的时候,可以正确连接的,但是另外是说占用内存使用率降低,但是我们看使用率并没有降低,三个还要做一个同步,同步的现场就会导致内存占用的升高,我们希望通过定量的结果真正给网络用户部署这些控制器一个参考,这样的话我们大概就会清楚的知道集成的时候是怎样的状况,它最大的上线是多少,这样就有定量的分析。那么这个是关于第一个测试。

第二个我想跟大家介绍网络不断变化过程中怎么改变网络,或者从OpenFlow1.3来看的话,就是不仅给交换机做一个反馈,如果控制器下载的速率越快,我们的网络越好,这个测试标注以多大的速率下发,在实际过程中我们面临的问题,哪些问题是需要控制器厂商一起解决的,这个测试方法我简单介绍一下,控制器上面有一个学习的PPT,我们可以模拟。这个测试的变量也会影响到下发的速率,我们就用不同的上送的速率有200有400有500有600,这样就可以看一下速率是多少,这样看一下不同颜色的柱状图,我们看到从200到600的话它下发的速率不断增长,但是上升到800的话速率反而下降了,这实际上是它已经达到极限了,如果你的网络中评估自己每秒变动的上送这些速率达到800的话,就不符合你的需求。这个是单点测试的结果。我们看一下机群测试的结果,我们也是有一个先期的预期的,下发的速度会比较快,但是我们看一下实际情况,这个我是从白皮书上截取的层次,我简单解释一下,所有的控制交换机是需同时给三个节点的,这样的话三个控制结点都要接受消息,但是下发那个有的时候当你思维很快的时候,他们的同步做得并不是特别完善,应该说只有一个是下发的,但是同时下发一样的,这样测出来的认为他这样的结果其实是不可控,但是同步方面做得不是特别好,这就是我们通过性能测试发生的问题,你在真正部署这些控制器的时候可能要回避这些问题,那些厂商可能也会做一些改进。这个是第二个测试结果。

第三个也是说一个典型的需求,就是建立端到端的连接,也是有一个APP,然后发送消息建立连接,这个时候我们是需要从最开始发现到结束之后,这个我们也是采用几种不同的类别,我们也是标定了一些测试结果。如果是拓扑图里面节点增加的话,这两个拓扑图不一样,这个其实是符合逻辑的。到集成的时候我们是希望它能够更快,但是我们看一下集成的测试结果,这个时候我们看到黄色的条是说之前谈到的问题,它会下发重复,就是头部做得并不是特别好,有一些消息重复运算重复处理,造成了资源的浪费可能也导致一些问题,所有的内容都是在我们白皮书里面有详细的解释。当然这三个测试是我从白皮书里面截取的,未来我们大概涉及到十个测试,都在白皮书里面,我们也会逐渐发布一些更多的测试功能,也希望运营商跟我们多多交流,提出第一线的需求我们帮助他们解决这些问题。好,这就是我今天的演讲,希望是在时间之内,谢谢大家!