@ fnii.cn

登录邮箱

李葆春:云计算对未来因特网设计的影响

发表日期:2012年12月20日      共浏览 1803 次      编辑:

非常感谢大家下午两点钟准时参加我的讲座。首先我跟大家声明一下,我算是北京人,但是中文现在讲的越来越糟糕了,为什么差呢,主要是因为在国外呆的时间太长,呆了十五年,所以很多时候是用英文思考的,但是我现在希望用中文思考。

我今天讲的是云计算和未来因特网设计的关系。首先我希望跟大家强调一下,到2016年会有多达80%的网络流量跟视频有关,视频有两个不同的地方,一个是语音媒体,还有一个点播媒体,这两个是非常重要的。这两个加在一块超过80%的流量,这些大多数将来会从云端给用户传输的,包括现在为止有很多的网络视频的传输公司,这些公司都开始从云端输送语音媒体了。现在从云计算的角度来看,我们不仅仅是一个数据公司,我们现在有多个地理位置,有很多的数据中心同时分布在全世界各地。这些数据中心之间都是有非常高速的网络连接的,就是今天上午谈到的,多次提到数据中心互联网的质量非常高。从视频分发的角度来看,我们都有一个中央的数据库,这个数据库会分发一些视频到网络,或者数据中心的节点,从这个节点继续再往用户上分发。

我今天讲的问题主要是云计算和互联网之间的关系展开的,我希望着重于视频的角度看这个问题,云计算的流量主要从视频上看的。我希望看云计算和互联网之间的关系,我讲一下将来因特网的设计思路,我希望因特网设计是逐渐的往视频流量优化演进,支持视频需要尽量多的考虑云计算的有关问题。云计算是主要视频分发的,从语音数据中心分发这些视频。云计算的数据中心互相之间有一个非常好的连通性,有很多视频公司分布在世界不同的角落,云计算又直接影响了未来的因特网的设计,所以我要把这两个完全的结合起来研究怎么样设计因特网。

今天我想讲三个不同的角度,三个不同的问题。第一个问题我希望能够研究一下怎么样分别优化,一个是数据中心之间的网络,还有一个是从用户到数据中心的网络,这两个网络我希望能够分别优化,我想提一些这方面的工作。第二个问题我希望能够预测跟视频有关的流量需求,尤其是非常近期的需求,未来一小时的需求,然后根据这些预测的结果,希望能够影响流量在因特网之间的传输。最后讨论一下能不能全局优化,相当于请求和应答他们在因特网里面怎么样从数据中心分发给用户,就是做一个路由。

 第一条怎么样才能分别优化数据中心到用户。从这点来看我希望能够以视频会议做一个例子研究这个,视频会议有一个点对点网络方案,就是说让用户之间形成一个连接,互动这些连接传输这些视频,然后形成一个会议。问题在于如果我有两个用户,我在两个用户在两头,有一个用户在中间,这就有一个瓶颈,就是很难使网络通过这个瓶颈。比如现在显示的画面里面,通过瓶颈发了两份数据,其实最小可以发送一分数据,其实我希望尽量减少瓶颈上的流量。关键我不知道瓶颈在什么地方,如果我要用数据中心互相之间连接网络的话,那么我就可以希望能够用户先把数据传到数据中心,再把数据中心的网络传到目标数据中心,最后传到对方的用户。问题在于能不能运用数据中心的网络更好的实现视频传输。视频中心的网络,假设我同样有两个用户在北美,两个用户在中国,我可以用一个非常简单的,把视频给离他最近的数据中心,数据中心在代表这个用户分发给其它的用户,或者其它的数据中心再分发给他们相应的数据中心。在这个情况下我就能基本保证在瓶颈,比如中国到北美的瓶颈我只发一分数据,而不是两份数据。实际上现在实现了一个很简单的方案,这个方案就在于数据中心做了一个全权的用户代表,使得他可以把流量在数据中心之间优化的传输,用最小的代价传输视频会议有关的文件。

现在有一个例子是四个数据中心,其中用户把视频传给离他最近的数据中心,数据中心相当于全代理了,这个数据中心就可以把他收到的视频,首先他会反馈给用户一些反馈,使得用户可以调整视频的流量,如果传的太快网络就无法支持,他收到视频之后就可以通过这个数据中心的网络,通过多条用户,或者通过多条路径传输给相应的目标数据中心,数据中心再把视频传给相应的用户。在这种情况下我可以设计很多不同的算法优化数据中心之间的网络传输方式,比如说我可以最大化流量,然后我还可以保证在数据中心之间不要延迟太长,延迟要在某一个要求里面。

我们可以做一个很简单的实验,即使现在还没有未来因特网设计实现的情况下,比如我做了一个简单的实验,用数据中心传输到另外一个地方,从首尔到中国,从中国到巴西,从首尔到巴西,先看延迟,如果我要是用P2P的方式时间就可以相对短一些,但是绿色是用云计算,红色是用P2P,两者都小于要求时间小秒钟时间,如果从流量角度看会发现云计算远超过P2P的带宽,这是因为数据中心的矛盾,如果我先把东西发给数据中心,然后用数据中心分发给带宽的话,那么就会有效的利用数据中心的网络。所以总的来讲如果我们用数据中心这个网络的话,就可以实现三倍到二十四倍不等的性能提升。总的来讲我第一个想说的问题就是希望能够分成两部分,把因特网分成两部分,一部分是从用户到数据中心,还有一部分是数据中心之间的网络,从用户到数据中心我希望能够优化这部分,这部分我希望增加它的灵活性,两部分我优化都是要用SBN,都是要用软件定义的网络,比如说用户到数据中心的网络,我可以用软件转发的形式,如果我在数据中心的话希望同时用他的灵活性和性能,这样我用不同的方法优化。很简单的MPOS,或者用一些新的技术,比如说小路径路由,这种情况下我就可以增加一些灵活性。所以非常简单的机制使得在数据中心之间的网络会提升它的牺牲,另外又非常具有灵活性。总的来讲我可以用四个字体现第一部,就是分而治之,就是分成两部分,一个是数据中心之间的,还有一个是用户到数据中心。

第二个我希望能够提出一个预测方案,就是我可以预测流量,未来几分钟,或者未来几小时的流量,这种情况下如果预测的非常准确我就可以改变流量的模式。大家都知道在云计算里面我可以去购买虚拟金,就是开销和购买的虚拟金是成正比的。但是这只是在GO的角度来看,如果从网络带宽角度来看,如果我的需求是以这个分布,每天晚上到白天是忽高忽低的分布,现在数据中心的云计算也不可能实现完全和需求吻合,有时候带宽多一些,有时候带宽少一些,甚至有时候带宽不够。这样就说明了带宽这方面的资源利用和CDO利用不是特别的优化。我希望能够实现预测机制,比如说在视频的点播流量,比如说在需求带宽比较多的情况下我能够预测到。一个例子假设有一个云计算的平台,另外我还有一个点播的平台,比如优酷,假如这个点播的平台是利用云计算平台实现给用户需求的,这样我就希望点播平台给一些钱,然后云计算平台给点播平台一些性能方面的提升。这个就形成了非常好的市场,在这种情况下,云计算平台就可以在能够预测的情况下把他们的视频流量分发给多个不同的数据中心,这样使得不同的点播平台互相之间可以整合起来,使得数据中心他们的网络带宽可以充分的利用。就是说如果我能预测未来十分钟,或者未来几小时的带宽,我就可以更好的把用户的点播需要的带宽传道不同的数据中心去,相当于预留一些带宽,然后用我预测的结果使得不同的数据中心充分预留带宽。

我们做了一些实验,说明预测是可以成功完成的,可以预测的相当准确。每一个点播的频道我们可以预测它未来十分钟的需求。假设我需要预测需求,我用了一个公司的数据,这个公司是用P2P的平台,是用用户的上下线活动看他去了哪些频道,就是我实际测量的数据是白天用户需要的流量比较多,晚上用的比较低,这样就可以利用近期的历史,跟24小时前的历史,48小时前的历史整合起来预测下一个十分钟视频的流量,我们预测的结果非常准确。如果我要是能够预测未来的流量,我就可以用预测的结果把不同的点播平台和点播公司互相之间整合起来分发到不同的数据中心。比如第一个公司和第二个公司的需求,他们互相之间是反的关系,这样把他们两个加起来,总的需求将会是一个更平稳的。这种情况下就可以在数据中心,比如假设有两个数据中心,有两个不同的点播平台,点播平台他们有预测机制的需求,对带宽的需求,我就可以运用一个很简单的方法做一个优化,使得他们需求可以从定向到不同的数据中心,总的来讲我把数据中心加起来预留的带宽是最小化的,这样就可以最大限度的利用数据中心已有的带宽,就可以改变流量在因特网中的传输。如果考虑数据中心是高速公路,如果这些用户是一些城市要上高速公路的车的话,我们可以优化什么样的客户上什么样的高速公路,我总结四个字叫知己知彼。

第三条我希望全局优化,从用户到数据中心,问题是一个请求怎么样传输到不同的数据中心,从用户回到数据中心就是预留的问题,他可以选择不同的发源地,然后从数据中心回到用户。这两个问题实际上是相辅相成的,我可以把它们俩加在一起整合,然后做一个全局优化,这样我就可以照顾不同的目标,比如我可以优化性能,或者可以优化带宽。总的来讲这是一个非常大的优化问题,这个优化问题将会有很大规模的用户。我希望能够有一个非常有效,速度非常快的分布式的测量,我们可以用一个最近几年提出来的一个算法,这个算法是一个分布式的优化,但是又是一个很简单很实际的算法,它可以在多个不同的控制器里同时进行计算。总的来讲这方面的结论就是把工作量进行优化,并且全局优化,所以四个字总结就是全局优化。

我三个不同的问题,第一是分而治之,第二个是知己知彼,就是先预测,用预测的结果,最后是全局优化。总的来讲我的目标是照顾视频的用户,只不过是一条路开始,如果你要有更近的路的话更好,谢谢大家!