@ fnii.cn

登录邮箱

傅晓明:从客户端、服务器架构到面向内容的发布订阅系统

发表日期:2012年12月20日      共浏览 1797 次      编辑:

感谢这么多人下午参加这个讲座,我也没有做好心理准备,所以有的时候翻译不到位请你见谅。

刚才几位老师都讲到内容分发还有视频流量影响了因特网的性能,将来是以一种新的方式来做呢,还是说以演变的方式做,这里我们看一下历史演变,看看怎么样演变到一个以内容或者信息为中心的网络。这个工作是和合作伙伴做的,感谢他们。

这个图刚才几位老师以不同的方式描述了,同样一个消息在这儿,网络的性能,视频是占很大的规模,从金钱预测超过50%的流量都是视频。过两年越来越多,而且将来用户产生的流量是最大的,这样带来了一系列的问题。在这种情况下,我们可以细化去看。我们传统的互联网其实在六七十年代的时候大家没有想到过为什么用这么多网络,其实那个时候大家是把IP地址作为定位的主要机构,用的是服务器模型,这样的话一个咨询,一个反馈,就是以这样的方式。现在越来越以数据为中心的网络来讲,其实因特网到今天为止发展到了包揽万象的东西了,这里就带来一个新的挑战,传统的讲TCIP是为了围绕着我是传数据,A传大B,所以要根据IP地址传。现在改造成了中心结构,最早TCIP是它的体系,整个新的信息流就是一个传输的渠道,至于怎么传大家采取不同的措施,你可以采取CDM,也可以采取其它的对吧,包括我们所说的未来网络。这里面人家为了大量的支持大规模的视频流,就是各种信息流,这个有很多不同的尝试。不同的技术有不同的优点,从客观上来讲技术的发展,包括最初点对点的通讯,包括对等网的通讯,包括加几个服务器在不同的地方做不同的部署,技术在演变,时间也在改变我们的思考,所以我们要看未来的话,可能既要想象现在的事情,也要看看将来的需求。

我们假设不久的将来大家不再关心信息数据从哪儿来,我们只关心什么是数据,数据有什么用,我们就会想象说好,将来的网有可能是一个面向内容分发的,和检索的平台,从某种意义上讲它是无数的存储器,但是你不知道它到底在哪儿。所以这个你要关心的是数据的信息内容,而不是它从哪里来到哪里去。还有你想知道的是,对那些东西感兴趣,所以你向这个网络需求的东西是你对内容的兴趣程度,你对哪个关键子,对那个内容感兴趣就变成你的查询资料,而不是去查询IP地址。如果有这么一个机制,让这个未来的网络能够支持基于信息的检索和存储,就是分发系统的话就会非常有利。一种途径就是我们把里面每个发布信息的人和享受信息的人分开,不要让他们直接知道对方的存在,这样才能保证信息的来源和他俩分布式的结构,大家可以随意的在网上放内容,你只要把内容的标识符放在网上,然后以某种方式快速的查询就好了。这个从客观意义上讲,在服务的角度,人家已经开发了不同种,就是基于订购和发布系统。我们如果想把网络分发机制放在网络层的话,这样就造成了它有可能会更加的有效,因为把信息变成第一级别的话,你会享受到你不需要在网络层做很多的工作,做很多没有效率的服务。这样你可以有两个内容,一个是按你的兴趣订购的,这个叫预定的内容,还有一类是即使我想随时去查询,就是查询的服务。一个典型的系统就是微博,大家很多人天天都在用微博,其实你在微博系统里这两个功能都用,第一是查询哪个人,或者哪几个信息条,你会根据关键字查询。这里一个非常具有先驱意义的项目,大家都知道NDN,这个里面把内容变成一个可以标识在网上的,可以用名字来标识内容,而不是说你用IP地址标识它的信息,就是可以分级,最后变成一个内容的表述词。从技术的角度来讲它就是引进两个,一个是兴趣包,一个叫做数据包,这两个包在数据里面保证他能够查询到他需要的东西,这个以内容为中心的网络,它的原始没有包括你怎么让他能够广范围的传播,只是每个人是独立的去做请求,请求到网上的时候有人给你就拿下来,如果没有的话你就上一条去。其实每一个数据包可以做一个内容的缓存,这个缓存就可以服务于多个人,它是牺牲空间,牺牲它的存储器换取空间上的行为,就是别人同时,或者过一会儿再访问这个地方的时候他就能看到那个地方有一个缓存,具体的机制我们待会儿可以展开讲一下。

其他几位朋友说介绍一下欧洲的技术,我说一下,欧盟平均每四年有一个FP,明年就是最后一年了,然后2014年开始是第八个FP。这个是从最早1984年开始启动FP1,FP1大概是37亿欧元,然后到FP6大概是180亿欧元,是在2006年,那时候我参加了三个项目。FP7为期六年,从2007年到2013年,这个大概是720亿欧元,其中XT占的比例是最大,达到91亿,欧盟人员在讨论的时候说能不能控制在800亿,即使是800亿,这个钱也是比原先的FP高二十倍,所以它是每年在增长的,而且出于我们通信和计算机的领域,这是最大的领域,可以体现出来欧盟对通信技术设施和未来网络,以及信息领域的支持度。欧盟有一个项目和中国的937类似,需要工业界和高校一起做,需要三个以上的欧盟成员或者副成员,然后四个以上的国家,这个国家如果满足了三个欧盟国家的话,中国也可以作为合作伙伴。在欧洲还有一个非常令人瞩目的,各个国家也有组建工业界和学术界合作的项目,比如法国电信和朗讯他们一起跟法国政府要了一笔钱,作为项目的资金,就是不同的角度去解决这方面ICN的问题,他们也提出不同的构架,大同小异。

从研究的角度来讲,这个CCN技术上和因特网的区别在哪儿,有几个部分不同,我们在这儿由于时间关系我只讲数据理念不讲控制理念。控制理念基于名字方式做路由,这个有一部分人在做,但是今天时间关系我们不讲,主要侧重你在路由表传输的时候怎么做查询和分发。这张图和IPE转发的机器很相似,有一点不同的是这里有一个转发的信息机,这个和路由表很相似。但是有一个不同点,刚才说到有两个数据,两个包,一个叫兴趣包,一个叫数据包,兴趣包发出去以后只是说我想得到相应的数据,然后等着数据到来,这个时候就把等的数据留在这儿,然后做一个缓存。它的物理网卡不叫物理网卡,叫做脸面。当你真正来一个因特网的时候怎么处理呢,已经有某种控制层,建立了基于名字的数据传输系统,当你来一个用户,目前这个用户问一个数据的时候,他把兴趣点说出来,然后我们去查,能不能找到呢,能找到,如果找到这个PIT,他往前发的时候PIT有一个记录,留了一个PIT的话,下一次数据发回来的时候就知道是往这个地方发了。你的数据会向最终的数据源要,但是这个数据源我们不需要知道,因为这个自己会构建一个路由表,这张路由表当你在路由器里面,这种CCN的路由器代管这个数据的话,你是可以直接从那儿取的,就是牺牲时间换取空间,这里我们不具体讲动作了。

但是有一点,如果说CCN每个人都去问,问了以后再查询的话就牺牲了很多时间,所以你在微博系统能看到的,你一开机或者一联网就能收到的那些信息其实是根据你定制的,我们做了一个工作要求在CCN的技术设计里面加一个功能,就是让他真正推送给用户本身,这样的话不需要你每次都去查询,查询的代价很大。如果想快我们需要有一个定制过程,这个定制过程可以用不同的方式表达,我们在这儿是通过内容描述符的,这个代表着关键字,你可以是单个,也可以是组合,你在微博里面输入一个关键字的时候就可以找到相关的信息,而不用再去找IP地址。我们从机制上讲为了达到这个目标,在它的每个转发机器里面加了一个功能,除了刚才说的加了一个定制表,有了定制表的信息以后就可以一次性的发送出去,而不需要再一个一个的去发,这样就可以达到很快的,大规模传输信息的功能,当然我们为了保证一部分用户还是基于简单的方式,我们也保持着和传统的CNN兼容性的系统。时间关系我就不再多讲数据怎么传了,关键一点就是我们可以既可以传,但是也可以不传,告诉你有什么样的信息,你看见感兴趣的地方再说我需要,这样我就可以根据你的信息方式再去推送给用户,这样就剩下了很多时间,因为CCN传统上,你要求CCN的路由器都有缓冲器其代价是很大的,我们进可能避免内容的缓冲器,尤其是核心路由器不能让它天天干这个活儿,所以还是要想想怎么样减少核心路由器的开销,你不需要每个路由器都加,这样你要引进来的新的芯片是什么呢,有一个内容就必须放在固定的地方,所以在这里面我们做了很多工作,感兴趣的话可以看一下我们相关的报告。从我们系统架构来讲我们也做了不同的应用,一个是像微博系统一样的订购和发布系统,另外一个是多人在线游戏,多人游戏我们玩的很开心,学生在游戏中也不关心别人从哪个机器上来的,只关心进入房间有什么样的信息在那儿,所以这是非常典型的应用,所以我们用了游戏的数据来表明这套系统是非常有效的,这个也是通过一段时间的研究发现游戏,或者说越大型的系统我们就越有效,有这种效果,就是要让他演变成非常大的系统的话,你就需要有一个大的内容发布系统,但是有可能要考虑不同情况下优化的目标,所以这里就需要不同的设备,如果对于设置性要求很高的话就要用集中式的发送,如果对于设置性要求不高的话就用分布式的发送。一旦有一些网络的路由器非常的拥塞怎么办,因为网络的稳定性是管理人最关心的,所以有一大批有待研究的问题,就是不同的人看这个问题会有很多新的角度,另外一个角度这个未来网络的概念怎么和现在的网络融合,这也是需要考虑的问题。时间关系我不再对具体的机制进行详细阐述了,希望后面更多的朋友对未来网络感兴趣,谢谢大家!