张建峰:阿里云张建峰的独家对话:云计算接近下一个时代|钛媒体深度

智聪说说网
智聪说说网
智聪说说网
43262
文章
0
评论
2023-03-1500:29:02 评论 5

“互联网和网络科学的快速发展使人产生了一个具有误导性的印象,即社会网络悬浮在空间内,似乎不再被重力和物理世界所累。” 与阿里云智能总裁张建峰(花名:癫痫)的沟通很快让我想起了杰弗里·韦斯特在他的奇书《规模:复杂世界的简单法则》中说了这句话。

因为他的对话,重点是如何使用最小的计算和能源消耗,更有效地管理快速扩张的数据中心规模——到目前为止,阿里云在27个国家和地区,84个可用区,2800个网络节点,运行数百万服务器,服务于全球400多万客户。他很清楚,这个快速发展的大型服务器集群会带来超乎想象的管理难度和成本。

与此同时,大规模也给阿里云带来了好消息。5月26日,阿里巴巴发布了2022财年业绩报告,云业务同比增长23%,年收入分别为1001.8亿元和745.68亿元,分别为1.46亿元。这是成立13年来首次实现年度利润和历史性突破。

“规模。张建峰对利润的解释很短,因为只有足够大的规模才能摊销巨大的研发成本。所以对阿里云来说,不断投入研发,用先进的技术手段对抗、消解云计算规模扩张带来的挑战和成本,就是赢得竞争的不二法门。

过去,我们都是从分布式到资源池化的CPU在以云为中心的时代,其实也完成了很多创新,尤其是资源池化等。然而,随着数据的增长、规模的扩大和延迟要求的增加,需要呼吁一个新的技术系统来满足下一阶段的要求。张建峰说,为此,他在2022年云峰会上提出了一个新的主题——Back to Basic。如果你最近出差,你会在机场看到阿里云的广告,回到原版——为了无法计算的价值。

在云峰会上,阿里云发布了下一代云计算基础设施的核心CIPU。CIPU说法直接映射PC时代的CPU,意思是云时代IDC内部处理核心。在这种新的架构下,计算、存储和网络接入CIPU,资源可以有效地云管理。通过CIPU加速硬件,实现超高性能。他举了一个例子,使用阿里云盘古存储协调CIPU、盘古高密度存储服务器和洛神Solar-RDMA该网络可将延迟降低到30微秒,这意味着访问存储在远端的数据,延迟低于访问本地硬盘。

当张建峰三年前第一次接管阿里巴巴云时,我们第一次见面。他提出阿里巴巴云应该集成。这一说法的核心是促进阿里巴巴云从提供资源向提供能力的转变。但当时对于如何集成,如何定义可以包装的能力,还有很多模糊之处。三年后,他提出Back to Basic,再次把技术放在首要战略位置,再次把向用户提供能力作为努力的方向。但这一次,用户和阿里云对能力的定义要清晰得多。从某种意义上说,这也是阿里云和整个中国云计算市场的螺旋上升。

云计算越来越接近下一个时代——新的架构定义,新的软件界面,硬件加速。我们错过了PC时代,但云这个时代大家都是一样的。在重新定义云结构的窗口期,如果我们定义它,中国可以在下一代技术时代有自己的位置。”张建锋认为,新一代的技术架构,会催生新一代的云原生应用,也是中国软件和企业数字化的巨大机会。因此,阿里云一方面会深耕技术,另一方面也会加大力度推进生态建设。

云峰会前,张建峰与钛媒联合创始人刘湘明就云计算的发展和生态建设进行了深入交流。

张建峰:事实上,我们要做的是更底层,但为了让客户使用它,我们用业务翻译了一层,做了各种数字项目,结果越来越厚,离云越来越远。

钛媒体:事实上,每个人都面临着同样的问题。现在提到这个真的很好,只是市场环境每个人都在减速,最初被绑在战车上,没有人能减速。

现在真的可以回头看,很多原本没有时间思考的本质。对于过去的云计算,你觉得有哪些判断是有点失真的,偏离了它的本质?

张建峰:云本身正在发展,尤其是在过去的两年里。在最基本的层面上,客户使用云必须比传统更好IT更灵活、更安全、更划算是基本要素。

我们认为,今天的云计算面临着几个挑战:一是计算和网络传输的延迟。以前可能不明显,但随着我们的系统结构越来越分布,这意味着我们的一个大型应用程序将分散在多个子系统中进行部署,需要高速连接和非常低的延迟;第二,随着大数据应用程序的增长,IDC内部的东西向流量越来越大,所以我们需要满足流量增加后网络的一些新要求;第三,我们的系统越来越大,越来越复杂,所以我们需要解决超大型基础设施的复杂管理问题,以及云中超大应用和复杂应用的管理问题。

从数据中心的角度来看,并不是简单地从软件上做一些创新,而是逐渐成为整个系统的结构性创新。

从数据中心的角度来看,它不仅仅是从软件上进行一些创新,而是逐渐成为整个系统的结构性创新。在这种逻辑下,需要一个中央控制节点,是为了云数据中心。

现在这个领域,国际上的玩家很多,比如英伟达就倾注了无限的热情,三年的路线图都规划好了。对阿里云来说,我们现在有自己的CIPU。

每个人都应该用同样的想法来看待这个问题。综上所述,对于整个云来说,软件必须定义整个基础设施。具有灵活性的软件定义必然牺牲性能。但是如果有CIPU之后,其实在灵活性的基础上大大提高了性能,即软件定义、硬件加速。

结果是什么?到目前为止,由于系统结构的变化——访问速度更快,不消耗主机,我们访问远端集中存储,速度比访问本机硬盘更快CPU资源。

我们有了CIPU,中间还有一个网络协议。今天阿里云基本上是网络协议eRDMA,延迟很低,带宽很高。我们是中国最近评选的世界十大计算机网络研究机构之一。我们定义了云计算时代的网络协议和工业标准化。

因此,云计算越来越接近下一个时代——新的架构定义,新的软件界面,硬件加速。

以后集中做的基地型IDC一定是未来,规模30万台。我们在张北有大规模的机房,成都会重点投资。

另一个问题是IDC互联网,中国目前不同于国外的模式。但是东数西算可能还是有考虑的——如果按照传统的方式移动这么多数据,成本会很高。如果这一突破,云计算可能会在下一轮爆发。

钛媒体:今天我们谈论的起点是不同的。我们真的在考虑云的规模。事实证明,我们仍然有很多想法PC 时代的影响。

张建峰:我们现在面临着一个非常关键的节点,我们错过了PC时代,但云这个时代大家都是一样的。在重新定义云结构的窗口期,如果我们定义它,中国可以在下一代技术时代有自己的位置。

比如为什么要有无影?家里有一台电脑,需要一个屏幕和一个键盘,今天的带宽,计算能力,移动主机到云是一样的,没有影响,不需要买一个物理主机。现在大家都在考虑把办公电脑的主机定位,但是如果以后没有主机,就没有必要定位那个东西——而且定位成本很高。

钛媒:因为那条发展之路,你要再走一遍。

张建峰:是的。因此,面对下一代技术的发展趋势,应考虑国产化问题的解决方案。

无影现在在很多地方都很好,我们的一些客户渲染,使用非常高的计算能力,云计算模式节省了很多成本,数据都在云上,完全加密,熔断,保护,也非常安全。

在同一条起跑线上,中国对下一代的结构具有优势。

钛媒:刚才我们在谈论从CPU、IPU、DPU、CIPU,事实上,真正的变化是打破了整个计算架构的集中化,慢慢地,所有的功能都有不同的核心来完成。传统计算架构的真正核心是什么?是指令,所以CPU控制一切的指令。现在计算架构的核心变成了数据流,所以会有这么大的变化。

张建峰:是的,以前处理任务,现在处理数据,要有新的结构。

钛媒体:原来我们一直在谈整个云生态的设计,但是在这个架构里面谁去做什么事儿一直都是模模糊糊的,比如阿里云有段时间差不多做成SAP、埃森哲的样子,冲在数字化的前线。现在谈Back to Basic,其实各自的角色都清晰多了,阿里云还是要做成云计算架构Intel这样的公司,就是退一些。

张建锋:做英特尔也要做Windows,因为云计算本身需要操作系统,我们是CIPU 飞行操作系统。

钛媒:以前听说过Back to Basic,当时感觉有些共鸣。事实上,在过去几年云计算的发展中,大家都觉得有些地方不对劲,但也没有时间去想。

张建峰:其实大家都在做数字化转型。当然,使用云后,这项工作可以更好地自然地打破部门墙或系统墙。因为数据在同一个基础上,你更容易分析和使用数据。

例如我们去做冬奥会,冬奥会上有几十上百个系统,有计分的,有赛场管理,用了云其实还是非常大的区别的。本来奥运会要开的时候,奥组委会有一个技术部门,要先找个地方把它拿走IDC建成后,从选址到合作伙伴,购买空调等,从头开始,购买服务器。

建成后,上面运行的许多系统不相互连接。我们应该打开界面并进行开发。在操作和维护过程中,我们应该测试操作和维护。如果中间有问题,我们不知道网络或服务器有问题。我们应该找到无数的供应商来解决这个问题。最后,还有一件非常复杂的事情。奥运会结束后,他不得不花很多时间处理资产。现在他可以退出了。

因此,云的出现极大地改变了以往整个信息系统的构建方法。许多企业也面临着同样的问题。

钛媒:所以过去很多企业基本上把数字化和云计算画等同于数字。

张建峰:当然,大型互联网公司仍然是云计算的主要消费者。他们知道软件是自己做的,云服务厂商只需要提供资源。

其实在我看来,云上的数据库中间件和大数据计算都不是云的核心。这些都是云原生的系统,云原生和云不原生还是有很大区别的。

中国客户,或购买资源,而不是购买你的能力。但像Snowflake,用户购买的不是资源,而是能力。我们的数据库现在正在慢慢地从资源到能力。

我们不希望你想我买了多少台服务器,我买了多少台内存,这和你无关。你应该能处理多少?QPS(QPS:Queries Per Second, 每秒查询率是服务器每秒可以响应的查询次数。事实上,这种商业模式有一个的名字,不叫SAAS他们叫这个东西。Serverless,也就是说,你最终不必关心硬件。例如,如果你想做一个翻译,你只需要输入文档,拿出文档,不一定要注入两个服务器,然后布置软件,然后做这件事。

钛媒体:最近,我在大平台上遇到了很多人。有一种特别明显的感觉,所有的大平台都在从工具转变为能力。平台规模达到1亿用户,实际上达到了很多天花板。但是一旦转成能力,就是古人所说的大象无形,跟客户,跟生态全混在一起了,做的再大了,外界也是看不到,但它其实变得越来越强。

  咱们第一次见面,在讲被集成,后来在谈云钉一体、低代码,现在兜兜转转Back to Basic,这三年完成了一个周期。我记得一开始咱们在谈被集成的时候,我就在问怎么把这些东西变

显卡芯片:国产12nm显卡问世,性能不亚于国外显卡厂商,国产GPU芯片崛起?

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。

标签:张建峰:阿里云张建峰的独家对话:云计算接近下一个时代|钛媒体深度

智聪说说网
  • 本文由 发表于 2023-03-1500:29:02
  • 转载请务必保留本文链接:https://www.zhicongwang.com/110822.html