澳门威斯尼人平台登录云总计火了,揭秘Tencent数据主旨市斤年建设及运维施行

2000 年,腾讯第一个 IDC 在深圳东门建立,2012 年 9 月,第一个微模块数据中心在宝安落地。这中间,腾讯又相继建立了异地 IDC、海外 IDC、还包括自建数据中心和超大规模数据中心的上线和交付。十八年,腾讯在数据中心建设和运营上积累了一系列的实践经验,也在自主设计、自主建设领域已经取得了丰硕的成果。

腾讯数据中心负责人钟远河在“人工智能新时代:中国互联网设施创新与发展”高峰论坛上表示,“开放+智慧”是腾讯数据中心的关键词,未来腾讯将继续致力于建设好互联网基础设施,为7.5亿网民提供更便捷的生活。

中国电信佛山华南数据中心

腾讯四代数据中心的发展腾讯第一代数据中心在 2006 年前后起步,采用的是传统的电信解决方案,数据中心 PUE在 1.6 左右;第二代数据中心以天津数据中心为代表,全面转向超大规模数据中心的建设,该代数据中心为 UPS 架构,采用了当时国际上最为先进的自然冷却等节能技术,PUE 降至 1.4;从 2012 年开始,腾讯开始自主研发以“微模块”为核心技术的第三代数据中心技术 TMDC;2015 年底,第四代腾讯数据中心 T-Block 技术正式推出,目前该代技术还仅处于试验阶段——进行不同环境下的小批量部署,验证间接蒸发冷却技术在不同环境下的节能效果,它带来的直接好处就是让数据中心标准化、模块化,效率更高,PUE 更低,快速地满足市场的需求。

12月6日,“人工智能新时代:中国互联网设施创新与发展”高峰论坛在中国科学院学术会堂举行。中国工程院院士、中国互联网协会理事长邬贺铨,中科院自动化所副所长刘成林,腾讯数据中心负责人钟远河,腾讯 AI资深专家研究员、NLP技术中心副总监张锋,腾讯数据中心首席产品专家、数据中心副总监高江等嘉宾围绕论坛主题“经世致用”进行了探讨与分享,工信部、科技部、国家信息中心的相关领导出席会议。

1月16日,中国电信佛山华南数据中心项目一期工程顺利封顶。该数据中心于2017年7月11日宣布开工,今年10月份A栋数据中心一期全部完工并投入运营。此项目是中国电信、佛山电建集团及广东开普勒通讯科技三方联手,共同打造的中国电信超五星级别的数据中心,该数据中心位于广东第一批省级大数据产业园-广东福能大数据产业园区内,占地面积5.1万平方米,总投资近10亿元,将分A/B两栋建设,A栋第一期投运1375个机架,总建设规模约6000个机架。

据了解,去年 4 月,腾讯在贵阳建设了 T-Block 的试点项目,通过此来验证 T-Block 的建设方式和其技术性能。西部实验室由八个模块组成,验证不同模块拼装实现的方式。未来 T-Block 技术将会规模化的在上海、深圳等地的数据中心投入实际运营。

开放共赢,赋能行业

澳门威斯尼人平台登录 1

在 TMDC 技术上,腾讯攻克了在建设成本、高压直流供电对 IT 设备的风险、与行业规范兼容、租电分离计费模式等一系列的难点,采用了通道封闭、高压直流、列间空调、简化的配电结构、气流组织优化等一系列节能环保关键技术。TMDC 的技术架构中,每个微模块都包含自身的配电、空调、消防和监测系统等,可以认为一个微模块就是一个微型的数据中心。同时,微模块也是一个完整的产品,像服务器一样,微模块的所有组件都在工厂预制和测试完成,到数据中心现场拼装完成即可投入使用,部署时间最短仅需要两个星期。

腾讯公司董事会主席兼首席执行官马化腾在近期公开表示,腾讯将做好“连接器”的角色,把云计算、大数据、LBS、AI、支付、安全等“互联网+”上的核心能力开放出来,而腾讯数据中心正是腾讯各项业务的基石,也是腾讯开放“互联网+核心能力”的基础设施和技术支撑。

数据中心的规划建设按照T3+标准进行设计,充分运用高科技、信息化、绿色环保技术打造新一代五星级电信数据中心。目前1到3层己经陆续投入运营,4到7层将会根据客户的不同需要提供数据中心的定制化服务。

另外,相对于第二代数据中心,TMDC 还实现了去 UPS。作为一种体型庞大、操作复杂的供电设备,UPS 在数据中心内使用存有恶性事故隐患,通过“去 UPS”,TMDC 解决方案有效提升了数据中心运营整体的安全性。在 TMDC 解决方案中,服务器供电变成了市电直供加直流系统备份。

钟远河表示,目前腾讯数据中心达到国内互联网公司最大规模,规模与技术的飞速发展归功于“开放”二字。腾讯数据中心一直秉承着开放共赢的信念,引领整个数据中心行业升级换代,并借助云服务,开放更强计算力从而赋能产业智能化。

数据中心有着超高规格的电力保障:市电由三个不同区域的高等级变电站,分别引入四路10千伏电力专线;正规的三线接入,与广深同等级出口,直接163骨干网络;PC端+移动APP智能巡检系统,打造智能化运维,提供个性化服务,开普勒将打造成华南地区乃至全国的高端数据中心标杆。

腾讯第三代数据中心 TMDC 技术组成

在当前“云计算+大数据+人工智能”的大背景下,腾讯数据中心作为互联网基础设施,面临更高的技术要求。从传统的TMDC到T-block,腾讯数据中心经历了四代演进。第四代和第一代数据中心技术相比,建设成本下降40%,交付周期下降83%,运营效率提高100%,PUE下降27%。

长沙云数据中心

到了第四代 T-Block 数据中心的运行,腾讯主要基于两点技术实现更好的能效和性能:

AI让数据中心“智慧”升级

7月30日,位于长沙市高新区的中国联通云数据中心正式投入运营,该中心占地145亩,总建筑面积为13万平方米,可运营服务器数量多达18万台,是中国联通在中南地区规模最大的云数据中心。目前,中国联通长沙云数据中心一期IDC已建成并投入使用。

1、制冷系统采取间接蒸发冷却,配电系统继续沿用腾讯目前比较成熟的市电 +HVDC;

刘成林提出,“自2006年来爆发式发展的人工智能,有着‘基础平台开源化’和‘关键技术硬件化’的态势。国内诸如BAT这样的企业在技术和应用水平上可以与国际最高水平相媲美”。张峰在会上同时也分享了腾讯AI Lab的发展现状。

长沙云数据中心属于中国联通十二大云数据中心之一,项目按照国际T3标准、电子信息系统机房A级标准及绿色数据中心理念进行设计和建造,分三期建设。项目一期建设一栋IDC机房、一栋综合通信枢纽楼和两栋动力中心,安装2000架标准IDC机柜;二期建设两栋IDC机房和两栋动力中心,安装4000架标准IDC机柜;三期建设三栋IDC机房和三栋动力中心,安装6000架标准IDC机柜。三期建设完工后,机柜总数达到12000架。

2、通过标准模块化的供配电,短距离的热量传输路径。

其实,AI技术的发展与数据中心也有类似“相辅相成”的关系,一方面AI技术的发展将带来对数据中心IT设备等多方面的新需求;另一方面,运用于数据中心自动化的AI技术,使得数据中心的运营更加智能。目前腾讯数据中心在基础设施运营中,有“电子巡检的运营智库”、“索伦之眼视频识别”等诸多AI应用的尝试。

腾讯怀来数据中心

去年年底,有媒体曝光过 T-block 数据中心的外观,其外表虽然看着是集装箱,但内部已进行大量的改装。它由若干个集装箱体拼接而成,包括了办公箱、供电模块箱、两个 IT 模块箱、制冷模块箱 A 和制冷模块箱 B 等。据了解,T-block 核心思路在于通过产品化手段解决数据中心建设问题。而这种思路也更贴近数据中心本质的功能属性:快速响应业务需求,提供一个稳定可靠的 IT 设备运行环境。

当前,电子巡检系统已经在广州电信永顺数据中心、广州移动华新园数据中心等多个大型数据中心上线应用,腾讯数据中心将更加“智慧”,带动整个行业的创新升级。

8月22日,腾讯与张家口市怀来县正式签约,宣布将投资300亿元建设腾讯华北信息技术产业总部基地,入驻环首都新一代信息技术示范区。怀来数据中心将是腾讯华北最大数据中心基地,腾讯在张家口市怀来县将投资三个数据中心基地,每个占地350亩,合计1050亩,预计2022年全部建成后将上架服务器约100万台。

随着技术的不断成熟,腾讯数据中心的 PUE 值也在一次次的突破“极限”。腾讯第三代数据中心已经在腾讯自有业务和腾讯云业务上得到大规模应用,目前承载的服务器量超过 20 万台,实测平均 PUE 值 1.35 左右。2016 年 4 月,工信部电信研究院对腾讯 T-block 进行了 24 小时不间断带载测试,测得日电度 PUE 值为 1.0955,是工信部数据中心标准化测试中最佳的测试结果。

突破软硬件建设三大难点

从建设模式上看,腾讯怀来数据中心是云数据中心典型的一地三中心布局,或将承载腾讯云的大部分业务。用腾讯的话说,这将是“腾讯公司发展历史上最大规模、最高等级且位于非核心都市的云计算综合产业基地。”

青浦数据中心三联供技术解析

高江介绍,腾讯数据中心软硬件建设上存在三大难点:巡检难、供电效率低以及建设周期过长且缺乏标准化的问题。“软件方面,腾讯数据中心自研的‘精品化电子巡检’工具,拥有会思考大脑的‘巡检智库’。在此基础上发展起来的Nebula平台,再次体现了自动化运营的思想。”高江介绍,精品化电子巡检将应用人工智能技术,把腾讯十多年的运营经验转化为巡检工作的智能辅助,这一工具经过数年打磨,将在今年11月正式对外发布,提供给合作伙伴使用。

京东云华东数据中心

除技术上的演进外,近年腾讯 IDC 平台部在数据中心新能源领域也进行了最新的尝试。上周四,记者随行来到腾讯位于上海的青浦合建数据中心进行参观,也见证了腾讯在数据中心上的多项技术尝试与创新。整个青浦数据中心园区的规划包括:四栋数据中心楼、一栋配套业务楼、一座 35KV 变电站,一座三联供能源站,总共可容纳 10 万台服务器。位于一号数据中心楼的微模块数据机房,内有电力室、冷机房等重点基础设施。体现了模块化数据中心新的运营理念,和自动化监控管理模式。

而在硬件方面的“冷热电三联供”更注重节能环保,它利用余热回收的吸收式冷机为机房制冷服务的供电模式,在大幅提升供电效率。据悉,腾讯上海青浦数据中心是中国第一个商用三联供数据中心应用,并因此及其他节能措施获得5A级数据中心的称号。

8月24日,京东云“华东数据中心”于2015年投建,截至2018年,园区内4大模块全部正式投入运营。整个园区占地13万平方米,总机量超过5000架,由4个规模相当的云数据中心模块和1栋综合大楼组成,总建筑面积55328平方米,每个模块建筑面积12332平方米。此外,园区还建设有110KV专属变电站,晓店和湖滨变电站双路63MW用电接入,并配备双路UPS、柴油发电机,实现三重供电保障。

这里再重点说说三联供能源站相关技术:

与此同时,为解决数据中心建设周期长、建设标准化困难的问题,腾讯数据中心研发出了T-block的模块化建设模式,大幅缩短建设周期。12月1日,深圳光明T-Block数据中心历经1个月安装1个月测试,仅60天正式交付。

作为第一个自建自营数据中心,京东云华东宿迁数据中心内四大模块机房将于今年年内全部投入运营。该数据中心的二期工程将迎来众多“黑科技”,包括液体浸没式的制冷技术和热管式技术等。另外,机房内感应温湿度的智能机器人预计将于四季度投入运营。目前,京东云华东宿迁数据中心的最大PUE( 数据中心总设备能耗/IT设备能耗)<1.4,达到国内一流水平。

目前国内三联供的应用场景大致可分三类:第一类对三联供的要求较低,体量较小,典型的代表是一些办公园区;第二类场景规模体量较大,对三联供的持续性要求较高,典型代表是大型的工业园区;第三类除了体量大和持续性要求,还加入了对稳定性和突加载的要求,典型的代表就是数据中心。所以腾讯认为三联供是数据中心的实践,它代表成熟技术在新领域的应用。

主导了中国3G至5G网络研发的邬贺铨院士表示,“基于5G网络技术的数据服务将可更快地在线访问更多数据”。他提出,基于信息的即时性需求,互联网服务将更多地省去本地存储的数据并转而依赖于云。在未来,5G时代对数据中心选址、网络设施、电力供应能力都会提出新的挑战。

世纪互联上海数据中心

在数据中心应用三联供技术,原因主要由二:电是数据中心最为主要的能源需求,在对电以及通过电产生冷供服务器采用上,三联供可通过燃气启动发电机,同时采用溴化锂机组将供电产生的余热回收制成冷供数据中心使用;其次是相比煤资源,三联供使用的清洁能源可以减少碳排放,实现绿色的数据中心。相对于传统数据中心标准的两路式电和后备电,青浦数据中心引入三联供制冷和供电能力,可以形成三者备份、补充的架构。

中科院战略院研究员、国科大网创中心执行主任余江也在会上提出,各国人民对互联网高质量服务日益增长的需求,以及人工智能与具体产业的深度融合,都呼唤新一代网络和新一代数据中心的强大支撑,以此更好地为人民提供高质量的互联网服务。而腾讯数据中心作为数据中心行业的领头羊,下一步将在智能感知、智能预测、智能调控、无人值守等多个智慧领域探索更多可能。

10月15日,世纪互联集团在上海外高桥保税区开通运营了一个新的数据中心。这座四层楼的数据中心机房约6000平方米(65000平方英尺),IT机房面积超过2000平方米。一楼设有数据室、电源和其他配套室和管理室,二楼到四楼是机房。底层有2000个支撑设施,三层建筑中拥有可以部署1000多个机架的IT空间。其设计和制造符合中国国家数据中心标准,带有密封的冷热通道。

腾讯青浦数据中心主要承担了腾讯的游戏、微信等 To C 业务以及大量的 To B 业务。为保证数据中心整体的稳定运行能力,三联供在落地实践过程中也经历了大大小小的考验。例如,电供冷和三联供制冷对接,导致整个系统非常复杂,为了和市电错峰运行以达到更高的效果,整个供电中心的制冷需要进行两次切换,一次切换是在早上六点,另一次是在晚上十点,每一次切换对于数据中心的运行都是严重的考验。

世纪互联在上海新开通的数据中心采用2N冗余UPS配置,其中包括两组蓄电池,每个蓄电池可在满载情况下为数据中心供电15分钟以上。为了应对长时间停电,其备用电源部署了五台柴油发电机,带有独立的埋地油箱,可以在满负荷下为数据中心供电超过8小时。如果停电持续时间更长,柴油供应将在2小时内到达。

面对一系列的考验,腾讯建立了一个体系和完善流程,从而确保三联供和数据中心产生 1+12 的效果。比如腾讯数据中心的高温设备巡检,使用热成像仪对高温设备监控来减少隐患,这样的改进可以有效的发现三联供在运行中的隐患。通过 7 大类共 52 个应急预案以及对相关人员运维水平和熟练度的各类演练,青浦数据中心可以有效降低三联供技术故障对业务带来的影响。青浦三联供运行至今,大大小小一共进行了 50 余次的演练,平均每周要进行两次演练,电制冷和溴化冷也进行了 200 余次。

天津赞普数据中心

此外,在新能源探索和使用上,青浦数据中心还布局了将近 3000㎡的“光伏发电”系统。在参观时,腾讯数据中心高级工程师李典林也表示,未来腾讯或许会将数据中心和三联供技术进行结合:让三联供能源站内部对白天两者产生的电量进行调配,用光伏发电所产生的能源供给水泵等设备的消耗,从而不对整个“电池子”的总容量形成大量消耗。包括如果在未来加上储能电池,并将夜间低谷期的能源存储在电池中,即可作为“光伏发电”系统之外的另一大供电渠道。

10月25日,赞普数据中心在天津高新区渤龙湖科技园建成投入使用,并与京东云、天津联通、中经云数据中心等11家企业签署战略合作协议。赞普数据中心填补了天津大型、高等级数据中心的空白,将为大中型互联网企业,金融、证券、政务、智慧城市等各行业的大数据应用提供高品质的基础设施支撑环境。此次建成的赞普数据中心大厦总建筑面积2万多平方米,地上四层,配备24个机房模块,设计容量3700标准机柜,可容纳4万至7万台服务器。中心按照国际标准设计和建造,是天津首家也是唯一一家获得国标A级认证的数据中心。

据腾讯的相关统计,“三联供”投产后截至目前,平均每年节省标煤 3500t;CO2 排放量减少 2.33 万 t,减排约 48%;节能率超过 18%。“光伏发电”设计年均发电量也将超过 20 万 kwh。

华为云廊坊数据中心

正如腾讯数据中心高级数据中心经理许均在 6 月 15 日“第三届腾讯数据中心 云分享日暨 DCD 腾讯合作伙伴峰会”上所说的那样:“腾讯青浦数据中心,是用三联供技术并投入商业运用的国内第一个中心,在技术上和商业模式上都有很多的创新和突破,未来我们还有很多工作要做,很多功课要做,我们还在路上。”

华为廊坊数据中心建筑面积54000平方米,地上建筑2层,其中1层9米,设置冷冻站、电力设施支撑区、展厅、大厅、开闭站等区域;2层6米,部署53U8KW机柜及控制中心、办公室、库房等。每机柜8KW的供电能力,在国内的云数据中心里已处于一流水平。

腾讯数据中心自动化运维的实践

廊坊云数据中心,华为将AI技术应用到数据中心的日常管理中,利用AI技术,华为将服务器、存储等设备中故障率最高的硬盘、内存数据进行处理,提前预测硬盘、内存的故障趋势和发生时间,实现了从预防性维护到预测性运维的跨越;通过iCooling技术,智能协同IT与制冷系统,调节制冷系统运行在最佳状态,年均节能超过5%,每年节省电费近千万。实现运营可视化、运维自动化、服务自助化服务。

腾讯数据中心经过十八年的发展,积累了丰富的规划、设计和运营的经验,形成了清晰的技术发展线路。据了解,腾讯数据中心一直服务于腾讯自身业务,直到五年前才对外开放,并以云服务的方式将这种能力开放给全行业。

百度首个自建超大型数据中心

在对技术探索的过程中,数据中心需要管理对象的数量、规模及复杂度也在呈现指数级增长,这对自动化运维管理也提出了更高的要求,传统人工干预、保姆式管理监控与故障处理的方式已无法满足业务需要。自动化人工故障修复机制、日志和监控信息集中管理与控制、大数据的机器学习机制都是数据中心常用的几种现代运维新技术手段。

百度云计算中心,园区占地约360亩地,总建筑面积约12万平方米,包括8个高标准模组,PUE是数据中心领域衡量能源效率的权威指标,阳泉数据中心凭借着是电气架构的改变和空调末端的改变,另外配合高温服务器和调优等措施使PUE低至1.1。百度阳泉数据中心是国内首个应用光伏发电的数据中心,还大量采用了风电清洁能源。除此之外阳泉数据中心还采用了高温服务器及新型的气流组织结合的零功耗的新型空调末端,充分利用了天然的冷源,全年免费冷却能达到96%。

在腾讯数据中心的自动化运维实践中,其自主开发了“Nebula”自动化平台,对 IT 系统、制冷系统进行全覆盖。目前,“Nebula”系统架构由四部分组成:数据中心服务管理门户、资源管理门户、运营管理门户以及管控门户,因此其精细化运营之路也主要从这四个维度来开展。

百度把AI技术引入到数据中心,冷水机组三种模式的运行通过AI自动判断,根据室外天气湿度、温度和负荷,切换制冷模式、预冷模式和节约模式,除此之外,AI还能实现智能预警,通过负载预判设备运行情况,给出维护策略。

当有报警时,报警会自动被送到事件处理模块中,引导相关人员完成故障分析和任务分工,完成故障设备隔离和恢复。其中频发问题会被系统送入问题管理模块,跟进解决,经验会被存储到运营知识库。例如在 2015 年天津 8·12 爆炸事件发生后,离爆炸中心不到 1.5 公里的腾讯天津滨海数据中心受损严重,在全部人员于两天内撤离的同时,“Nebula”系统则持续进行着远程无人值守,从而帮助腾讯将受影响的业务转移到深圳的数据中心,通过了实战的考验。

本文已标注来源和出处,版权归原作者所有,如有侵权,请联系我们。

在“DCD 腾讯合作伙伴峰会”上,腾讯数据中心平台研发总监高江也为大家分享了腾讯数据中心在安防及视频数据过滤、基础设施运营及监控报警方面的一些实践。

数据中心的视频安防系统,主要会用于事后的问题分析和追踪。在庞大的视频数据中,腾讯会通过机器学习和识别等技术将风扇转动等无用的画面数据进行过滤,对其中近三成的真正有意义的数据重点关注。在整个视频监控系统中,可以通过人像识别技术和智能化分析技术来判定视频中出现人物及行为的合法性。

数据中心的基础设施都是相互关联、互相影响的主体,一个设备发生故障很有可能会导致下游一系列设备连带形成异常。因此,腾讯将基础设施的模型建立起来,清楚地描述他们的关系,当其中某个设备产生问题则可以进行固定定位,从而把无用的报警信息或由主动操作产生的异常和报警信息屏蔽掉。这样,基础设施报警精准则大大提升。

通过对数据中心运维海量数据的分析,利用大数据建模,自动化地、智能化地挖掘出更多高价值的、运维人员认知范围外的故障模式与系统优化模式,可以进一步提升系统运维的效率;通过大数据机器学习,对大规模运维场景下的性能与故障规律分析、趋势预测及故障根因识别定位,可以提升机器自动化运维的能力,可以大大减少数据中心的人力投入。以 InfoQ 记者参观的青浦数据中心为例,园区内需要巡视、维护、调控人员极少,除了在某些监控室及厂房,基本上是属于无人看守状态。

在专访中,腾讯数据中心负责人钟远河也表示:“自动化是数据中心的必由之路,而实现自动化的第一步就是要采集数据,制定统一标准,并根据业务需求进行不同的工作角色分工。”

共建数据中心和谐生态

腾讯目前在全球布局了 20 个大区、31 个可用区的集成数据中心,拥有超过 700 个 CDN 节点。“在支撑腾讯云发展的过程中,我们发现云对数据中心的需求也在分化,比较典型的有,公有云、混合云、金融云、高防云。”钟远河提出。

在此背景下,腾讯数据中心根据业务特性,提供垂直细分领域的解决方案,在保障安全性的同时,助力数字经济的多样化发展。如黑石和混合云的数据中心专区,重点从客户 IT 设备与基础设施适配性需求考虑;而金融云的机房,要求高安全、高可用性、在技术架构上更偏保守;而腾讯的高防云和高防数据中心,定位于军用级、高防护、高可用,为中国企业的核心数据和信息打造一个坚固安全的保险柜。

原文来自微信公众号:细说云计算

本文由澳门威斯尼人平台登录发布于服务器&运维,转载请注明出处:澳门威斯尼人平台登录云总计火了,揭秘Tencent数据主旨市斤年建设及运维施行

相关阅读