@ fnii.cn

登录邮箱

杨益锋 深入了解SDN和OpenFlow

发表日期:2014年12月09日      共浏览 1133 次      编辑:

大家好,我是来自Ixia的杨益锋。今天非常高兴非常荣幸可以参加这样一个大会。我今天主要给大家演讲的题目是深入了解SDN和openflow。在多的很多朋友都听说过Ixia公司,是做一个传统提供二到七层有线产品的服务公司,同时对于SDN这一块也是非常关注。实际上是第一批加入ONF的成员,是ONF现在测试组和互通组的主席。前面的很多专家和同仁讲的非常清楚了,最主要的想跟大家说大家看看Ixia能做一些什么事情。这个实际上前面的很多专家已经讲的很清楚了,switch是什么,前面说的是软件定义的网络,而且最大的优点是什么,可以集中管理,集中控制,转发层其控制层面是分离的,带来了很多的,对我们实际应用非常有优势的技术或者手段。前面也有专家说了,实际上openflow是SDN的一部分,南向接口里面有很多内容。一个主流的,或者一个比较早先南向接口的技术。后面或者在前面也有很多南向接口的技术,在座很多人都知道我们像过去PCEP,实际上也是一些典型路径优化的协议,但是因为这一块,我们支持的厂商越来越多,用户越来越多,现在被很多同志们接受。

openflow也有一个管理的协议,前面我记得一位专家也提到过,这个实际上在openflow1.0的时候是没有这一块的,到1.3后面才有。实际上这一块对openflow大规模的部署和控制提供了手段。我就不想太多讲了,前面很多专家同仁都讲了,分享就是从测试的厂商,我们做了很多的SDNopenflow的测试,无论我们是做产品的,提供解决方案的,对我们产品和解决方案中有很多的挑战。我举几个例子,作为一个测试厂商测过很多厂商的交换机和解决方案,目前SDN无论是控制器还是交换机,现在最大,这是一个调查机构提供的数据,他认为最主要的挑战是现在SDN的产品或者openflow的产品还没有达到一个运营商的级别,我就想跟大家分享一个案例,我做过一个大规模的SDN的控制器和交换机的整体解决方案的测试。过去我们做虚机都知道,一台服务器可以挂10个20个甚至30个VM,机房里面有成千上万的虚机,一旦机房产生了问题,或者大规模虚机需要迁移的时候,大家觉得会发生什么样的事情,一千台虚机可能问题不大,涉及到几个主要关键的因素,第一个是迁移的时间,比如说现在我们所有的数据中心都是异地备份,大规模的虚机,从甲地到乙地,如果甲地出现了物理的问题,我要备份迁移到乙地,如果一千台可能时间很快,大家有没有测过一万台虚机,迁移的时间是多少,会不会影响我的业务。对我的最终客户有什么影响,这是客户最关心的。第二,这种大规模迁移的过程中我又没有数据包的救市,尤其是行业用户非常关心的问题,迁移过程中希望一个包都不要丢,如果丢失了对我的影响是不可估计的。这个在我们目前,无论是做SDN的控制器,无论是交换机,无论是硬件还是软件,现在大家都存在一个挑战,但是我们对于客户来说,不管以什么技术对我来说要达到我的需求也是最好的。刚才张攀也介绍了,最近在做的互通性测试,因为是ONF组织公开的测试,有很多最终的用户做的四下测试,因为有一个大的测试要采购设备,肯定要采购控制器,交换机实际上有很多的厂家组成的,这时候就希望知道控制器能不能跟所有的交换机进行互通,然后我控制器所有的特点能够下发到所有的交换机上,这是我最终用户非常关心的问题。但是从我个人测试发现,实际上这里面存在很大的挑战,有很多的工作要做,实际上自定义的内容太多就导致了我们互通性存在更大的问题。

SDN现在经过这几年的发展,大家也很清楚,去年在北京查不到这个会的时候,一些技术一些概念,实际上到2014年,我们现在中国的几个运营商都有一些试点的网,然后我们现在的BAT也有SDN的网络,从他的发展历程来看,首先是overlay,还有underlay,我想跟大家分享一下这两者是集合在一起的。我们有没有看到过想到过,我们现在openflow下放到流表的时候,是有VNI的信息的,我完全可以把他们结合在一起,这是一个大的趋势,已经部署SDN的网络,可以把这两个技术融合在一起。在城域网这一块,我们已经补充了,已经在试验了。经过2013年性能功能的验证测试,大家觉得我们客户觉得有信心,在城域网,或者在移动的网上面部署他们的SDN网络,中国有好多的省份部署了城域网。后面最大的一块,专家提到了SDNONF是1.0、1.2、1.3,实际上大家看到1.4,今年的年底应该是1.5,明年年初1.5的标准会出来。大家有没有关注过1.5跟1.4,1.3比,有非常大的区别。在1.5的时候是一个多领域的SDN,这个对我们客户来说,面向的客户会更打更广,这也是ONF发展的一个大的方向。业务编排也好,这个是后面一个发展大的方向,我们跟很多的厂商和最终用户讨论过。现在控制器拿过来改一改可以用,我们有传统物理的switch,这个是跟业务结合最紧密的一层。这个是全局SDN和NFV的试图,大家可能看的不是很清楚,主要我想跟大家表明一个就是说事情,SDN现在不仅仅在数据中心,实际上数据中心最主要的数据中心的网络服务器还有储存,无论体是虚拟化的平台还是硬件的平台,我们都可以通过SDN方式去实现,有SDN的控制器。我们可以看到左下角这一块接网,前面有很多的专家也介绍了他们相关的产品城域网的接入,有无线的接入,有wiFi,这一款都是SDN,通过控制器控制整个的网络,大家看到这些多控制器,他们之间怎么结合在一起去工作,最终目标是做到什么,是应用调度网络。我的应用调用整个网络,我应用不知道你的网络情况,不知道你是有线还是无线,不知道你是什么。但是我要通过一个中间的层,我要去调度,各个领域的网络五,个世纪上是一个大的发展方向,真正的应用去调用网络。从这个我们可以看到SDN、NFV他们是紧密融合在一起的,没有分开的。openflow交换机,很多的时候都是用的OVS,我们现在很多都是用的虚拟的,所以这两个是完全融合在一起的技术,在很多领域是集合在一起。

我们现在用的是openflow1.3,大家可以看到1.0、1.1、1.2过的非常快,因为1.0确实只是一个技术层面的标准,但是到1.3不一样,我们可以看一下,细看一下,switch跟1.3建立了一个通道,是SDN或者openflow网络关键的通道,你有没有备份,主备控制器,我们线是绝对不可能用的。第三你支持不支持辅助接口,万一你的主通道出现忙的时候你怎么办。还有一个最重要在1.3上加了一个,对典型复杂的应用非常有用,都可以通过这个建立,比如GRE,比如你MPS,都可以通过这些建立,这个对我们线网的应用是很有帮助的。如果你不支持多级流表就没法分成,单一层面的openflow网络,大的网络是不可接受的。第二个就是字段是不是够多,过去IP,我觉得不够,我要有更多的内容,以满足我一些新的应用。大家都知道,只有才可以做到,这些技术是很难做到线网上去。前面很多专家说了,SDN怎么做QOS的。1.3我们现在无论是最终用户还是设备制造商都在推动的1.3,后面可能会跳到1.5。

前面很多人提到了SDN的平台,大家说的很多,我在这儿只想总结一下,实际上SDN的平台很多,就是三种,这个是OVS,或者是虚拟机挂上的,有个什么好处,是完全基于软件的,功能开发非常快,非常全。有些限制我测过,吞吐量转发,我们做传统的做数据都知道2455,我们测一下吞吐量,有没有达到限速,在OVS里面是很困难的,当然它带来的好处是它的成本比较低,投放市场很快。混合模式,现在是很多厂商推导的模式,在原有交换机路由器的基础上加一些软件的开发,这个第一可以跟线网无缝连接,第二开发周期比较短,但是它的弊端是因为现有的switch或者芯片不是为路由器定制的,性能往往不是很高,不是完全新的,基于新的硬件平台,这个是功能性能最好的,但是弊端就是说成本比较低,这一块最主要的技术是控制在很多的芯片的厂商手里。

既然说到芯片性能,前面也有同事提到了,网络芯片主要供应商,我跟大家分享一下Broadcom,他们把很多软件做的事情,芯片级实现了,这样的好处是什么,性能很高,因为大家也知道工作组专门在做这个事情,有很多的流表,如果查找的话,根据软件或者原有芯片查找的话,这个时间花的非常长。你进行一定的分组,您预定义查找的速度就很快,测试中这样做以后交换机的性能是一个数量级的提升。推出了这样一个解决方案。

OPEN  DAYLIGHT是一个开放平台,里面什么都有,南向的北向的都有,我们现在很多目前厂家做的是其中的部分。但是这一个平台对我们非常好,就是说我知道现在有很多的openflow就是基于这个,在上面进行定制改动,所做的工作要减少很多。投放市场的速度会更快。这个我就不介绍了,这个是ONF关于openflow一致性的认证。

下面讲一下我们Ixia在openflow下面可以做什么事情,一致性的认证是非常重要的一环,Ixia有一套成套的商业应用软件,我们是专门做一致性认证,我们做BGP、OSPF一致性都是这一套平台在做,所以我们有一个很大规模的TM,专门开发一致性测试的套件。在openflow我们不仅仅支持1.0,也支持1.3,而且全面覆盖1.3所有的规范。下面我要测试控制器的测试,我们要开发控制器的厂商,我要做一些控制器功能的测试最重要的是性能测试,因为性能测试没有一个专业测试工具的话,是很难做到的。专业的测试工具可以做到几点,第一,它的测试是非常稳定的,是完全基于硬件的,第二,它所有测试是完全可以重复的。第三,是得到业界认可的一些测试的方法。同样一个端口既可以模拟控制器,同样的也可以模拟交换机去测试控制器。因为我们对openflow来说有两大平台,一个是硬件,10G、40G、100G,我们最近推出400G的模块都会支持openflow,无论大家有什么端口速率的需求,都可以用我们测试仪区市县。第二个平台是虚拟的,臂助说OVS,不需要对外接怎么办?没关系,我有IXVM,可以装在虚机上,产生虚机内部的流量,这样完全可以验证虚机的性能。怎么测一致性,一致性非常简单,根据对应的结构建立一个链接,会告诉你通过多少没通过多少,我们可以结合抓包分析,我为什么没通过,我是哪个字节,哪个包头跟标准不符合。openflow典型有手包上送的机制,对很多的应用来讲,我要知道每个包的延时是多少,我可以完全仿真这个环境,可以测到你的手包送的时间是多少,我可以测你交换机流表是多少,我们都可以仿真测试。

随着SDN网络建的规模越来越大,我们有上千个交换机,上万交换机,我能多长时间发现,这也是我们目前很多客户存在的痛点。控制器的处理速率,这是验证我们一个控制器最主要的性能指标,我有一千台交换机,每个交换机有48端口,如果每个端口同时进来的时候,你这个控制器能够处理多大速率的回复下发的流标,这个是我们控制器的一个最主要的系统。控制器的扩展性,一个控制器下面可以挂多少交换机,对我们控制器的影响是非常大的。拓扑,一个交换机在家里可以用OVS产生10个去测试控制器,但是你能产生1万个OVS吗?每个OVS下面可以产生一定的拓扑结构吗?这是我们很多最终用户非常需要的测试场景。时间关系我就不展开介绍,大家如果有什么问题可以线下跟我联系,谢谢大家。