2018年2月,春节刚刚过,北京还弥漫在雾霾中,上地某酒店,阿里云工程师们摩拳擦掌。他们从115科技“踩点”返后,回溯了各种有可能,保证万无一失,欲要求月启动“肯尼亚”迁入项目。肯尼亚,跨越赤道,是野生动物的王国,每年7-9月都会首演尤为传奇的动物大迁徙。
在阿里云内部,“肯尼亚”迁入项目指115科技的数据大迁移。115科技是一家正式成立十年、以云存储跟上的高新技术企业,旗下核心产品之一“115个人”(原“115网盘”)是国内最先一批上线的云盘产品。但做到云盘的苦,只有做到过才告诉。出于自身发展的综合考量,115科技要求上云。
1. 差点用劳斯莱斯运冰块2009年“115个人”产品上线后,115科技喊出出有「转变共享」的口号,以便利的文件共享功能夺得海量用户的青睐,且抓广告、不车速,用户体验好。一时间,完全全国各大论坛、软件厂商、游戏厂商、设计论坛、教育机构、漫画及影视行业全部在用“115个人”展开文件共享。
到2017年底,115科技个人登记用户相似1.5亿,随之而来的是,硬件成本节节上升,要大大地租机房、卖机器,艰巨的运维工作如排山倒海叛来。115科技日常必须运营确保相似5000台服务器,移往在广东东莞、梅州、佛山等地的数据中心,余10万块硬盘。
硬盘大大读取数据,损耗很大。硬盘一旦损毁,就必须及时的备份完全恢复。115科技为此专门重新组建了一支“救火队“——七人换回盘小分队。队员们背景各异,有设备运维,有网络确保,也有拜托运送设备的厨房工作人员等。
必须换回盘时大家动态号召,平时就专门从事本职工作。“救火队”的工作繁杂,不仅要换回盘,有时数据中心没硬盘备份时,他们还要集体派出订购硬盘,或从其他机房驾车载运硬盘。甚至机房加热器供电系统经常出现故障,也要第一时间赶往检修。
有一次大朗机房空调加热器经常出现问题,小分队必须载运冰块到现场,由于当天公司还有其他招待任务,车辆紧绷,还差点动用公司的劳斯莱斯运冰块。小分队在机房站立了一夜,用风扇刮起冰块为设备降温,并紧密注目否有硬盘损毁,以待随时替换重新启动。作为网盘行业的资深玩家,115科技的存储技术早已炉火纯青,却吃够了硬件的苦头。
同时,网盘的市场格局也在大大变化,用户对网盘的体验明确提出了一些新的拒绝。是之后把精力损耗在确保硬件上,还是把所有精力集中于在业务创意?115科技跑到了岔路口。2.上云,要上云必需上云,上云才能解决问题。
这个要求来的忽然但是极力。2017年12月,115科技创始人赖霖枫突然开会核心成员召开,表达了这个要求。没有人有异议。但所有人都告诉,这不是一件更容易的事,却是115科技的数据量早已到了100PB。
100PB数据有多大?按普通DVD大约4GB容量算数,就相等于2500万张DVD,每天观赏一张,约要68000年才能看完了。会后第二天,115科技的上云小组就开始和各个厂商探究方案。
其中,阿里云是最后一家。高手过招,两三回通后之后可将对方底气搜个大约。「我们闲谈了闲谈存储方面的技术问题,找到对方都十分有研究。
」阿里云中国区解决方案总经理霍嘉回忆说。115科技向霍嘉坦言早已认识过几家云厂商,霍嘉也大方认为这个项目比较复杂。
首先,115个人是一个在线系统,迁入过程无法影响用户长时间用于,因此这是一个热迁入问题。其次,115个人上数据量大,存储及业务系统简单,因此更加必须详细设计。
霍嘉说道,115科技上云这一项目和优酷上云的项目十分相似。都是以非结构化数据居多的图片及视频业务,存储市场需求类似于;也都是线上系统,必须维持不宕机。有了优酷的迁入经验,霍嘉多了一份底气。
他把整个上云过程展开了合并介绍,寻找关键节点及风险点,并估计了时间。他的辨别是,这个项目必须90天已完成。对于115科技来说,迁入时间是十分脆弱的考量指标。
因为在迁入过程中,公司必须开销双份的硬件及比特率费用。「动不动就几千万上亿的,这谁扛得住啊。
」尽管自知115科技方面对时间的脆弱,霍嘉还是坚决三个月迁入周期的评估,「100PB的数据迁入,史无前例。这种事一定要对客户负责管理。
因为动工没走箭。」3. 战45天阿里云在周期评估过程中的专业与坚决,让115科技信心大幅提高。赖霖枫也在项目完结后谈及,最感动他的是阿里云的方案从实际抵达,是最接地气的方案。
「不看起来甲乙方,更加看起来战友和伙伴。」他评价说道。「我们为首了两位同学回到115科技北京办公室,摸清系统架构、数据的冷情况。
细心地制订了迁入方案,做到了成本评估。又当面向赖霖枫做到了汇报。」霍嘉回想,「上云这件事最担忧的就是影响业务,我们把所有的过程都报废确切了,对方也就不吃了一颗定心丸。」刚过完2018年的春节,这个在阿里云内部代号为“肯尼亚”的迁入项目月启动。
(115科技在阿里云上海峰会现场展示)阿里云的方案是雷电立方+专线迁入同步进行。雷电立方是阿里云于2017年初发售的物理迁往方案,针对数据量大、时间凸的两地迁往,115科技的市场需求正好合乎这两点。
针对115系统保持长时间运转的市场需求,阿里云创新性地采行了雷电立方+专线辅助迁入的方式。早已,115科技也沦为雷电立方问世以来数据量仅次于的用于客户。
普通企业的数据量大多在几百TB,上PB级很少见。阿里云当时徵了十套雷电立方,八套用来迁入,两套可用。当一套在路上跑完时,另一套读取数据。
等数据读取完了,另一组早已回去了。霍嘉回忆说,「这是一个十分仪器的过程,中间无法有任何的误差。」115迁入上云的最后淘汰赛在一个凌晨打响。最后一台雷电立方在阿里云的深圳机房稳定上载完了最后100TB数据。
凌晨5点,「肯尼亚」项目竣工,雷电立方暂停工作,115科技和阿里云已完成最后割接。阿里云一行人走进115科技在东莞的办公大楼。
广东的早春,早已远比严寒了。霍嘉扭头和身边的同事们说道,「你看兄弟们还行吧,当初刮起的牛也却是构建了。」最后,「肯尼亚」项目意味着用时45天,比预计的三个月时间较少了一半,也建构了百PB级数据公共云迁入的新纪录。
现在,上云后的115科技挣脱了运维的艰巨工作,七人换回盘小分队以求退出,都投放到了更有意义的系统优化和业务创意工作中。115科技一共用于了阿里云三十多款产品。除了解决问题了原本机房不稳定的问题,还构建了业务层面的创意,必要使用云上的AI、视频转码技术,用户早已可以较慢分类网盘内容、智能搜寻。利用大型公共云的力量,115科技减缓了在人工智能等方面的战略布局,更进一步完备云生态,让基于大数据的云端存储、交流、协作沦为了新的业务增长点。
版权文章,予以许可禁令刊登。下文闻刊登须知。
本文来源:必威·betway(China)官方网站-www.r-lifeassist.com
Copyright © 2006-2024 www.r-lifeassist.com. 必威·betway(China)官方网站科技 版权所有 备案号:ICP备23637310号-1