<nav id="4uuuu"></nav>
  • <tr id="4uuuu"></tr>
  • <tr id="4uuuu"></tr>
  • <tfoot id="4uuuu"><dd id="4uuuu"></dd></tfoot>
    • <noscript id="4uuuu"><optgroup id="4uuuu"></optgroup></noscript>

      亚洲的天堂A∨无码视色,尤物久久免费一区二区三区,国产醉酒女邻居在线观看,9AⅤ高清无码免费看大片

      微信系統(tǒng)不崩的秘密

      任曉寧2021-04-10 10:45

      本報記者 任曉寧 北京報道

      微信為什么沒崩過?

      12億中國人都在使用微信,卻很少有人思考過這個問題。其實,微信也曾徘徊在瀕臨崩潰的邊緣,騰訊基礎架構(gòu)部運營管理支撐中心總監(jiān)鄒方明現(xiàn)在還記得2014年除夕,人們剛學會用微信發(fā)拜年視頻,流量直接爆掉,系統(tǒng)瀕臨崩盤,公司上下所有人的壓力都集中到他一個人身上,等他做出決定。他說,那是他最痛苦的時刻。

      直到現(xiàn)在,在微信使用量最大的時刻,比如除夕,或是元旦、七夕、中秋,或是情人節(jié),騰訊團隊也會提前幾個月籌備資源。前幾年的高峰期,負責騰訊紅包系統(tǒng)運維的肖攀甚至會拜一下QQ公仔,就像拜佛一樣,求系統(tǒng)不崩。

      現(xiàn)在,他們已經(jīng)積累了一整套保證系統(tǒng)不崩的方法論。

      騰訊10年維護微信系統(tǒng)不崩的故事,是一個從手忙腳亂到心平氣和的成長故事,是一個技術(shù)系統(tǒng)從無到有的故事,也是一個國民級用戶產(chǎn)品的技術(shù)秘密。騰訊技術(shù)團隊向經(jīng)濟觀察報講述了這些故事,他們構(gòu)建的系統(tǒng),使用的技術(shù),在運行中積累的經(jīng)驗教訓,對于其他公司,或可提供些許借鑒。

      瀕臨崩盤的時刻

      一刀切關(guān)閉系統(tǒng)、還是繼續(xù)尋找漏洞?是鄒方明必須立刻做出的判斷。

      他是騰訊的老人,2006年進入騰訊,負責技術(shù),一手搭建了QQ和微信的聊天圖片、視頻系統(tǒng)。但在2014年除夕微信流量爆發(fā)而瀕臨崩盤的時刻,他依舊承受不住這種壓力。“系統(tǒng)全方位崩盤,流量也爆了,前端的系統(tǒng)就好像洪水一樣的,后端的系統(tǒng)更脆弱,連著倒了三四個系統(tǒng)和平臺,不光我們的平臺倒了,底層存儲的其他部門其他系統(tǒng)也倒了。”

      體現(xiàn)在用戶側(cè)的感受是,用戶在朋友圈把視頻發(fā)出去了,但身邊朋友一個都沒看到。

      用戶投訴源源不斷而來,鄒方明需要立刻做出判斷。他可以花更多時間去查一下到底是什么原因?qū)е拢瑥氐捉鉀Q問題,或是干脆一刀割下去,先暫時限制視頻功能。“哪個方案能夠最快恢復服務,我事后在腦海里模擬了無數(shù)遍,也想不出哪一個更快。”

      鄒方明站在機房前,對著那臺顯示崩盤的電腦,身邊的運維看著他,手指放在鍵盤上等待指令,老板在辦公室一言不發(fā),產(chǎn)品團隊需要一個回復,公司外數(shù)以億計的用戶,所有人都在等待著他的指令。

      雖然只有十幾分鐘,但每一秒都是煎熬。

      鄒方明最終決定一刀切。至少切斷后,再次恢復,能給到用戶繼續(xù)使用的可能性。否則,不知道要排查多久才能真正找出問題。直到現(xiàn)在,他也不能說自己的選擇是最正確的,但那是最快解決問題的選擇。

      微信誕生早期,上面的時刻時有發(fā)生。2015年,微信紅包贊助春晚,除夕當天紅包量級從10萬級提升到10億級,負責運維的肖攀,買了個QQ公仔,插上兩根香,每當覺得心里不穩(wěn)妥,就去公仔前拜一拜,祈求千萬不要出事。

      微信后期,一套成熟的穩(wěn)定系統(tǒng)已經(jīng)形成,依舊有不可預料的事情發(fā)生。2020年2月,騰訊會議在一個月時間增長1000倍,騰訊云副總裁、騰訊基礎架構(gòu)部總經(jīng)理肖志立也遇到了難題,他的難題不是技術(shù)原因,而是物力資源跟不上。

      當時,因為疫情,運營商的BGP帶寬滿足不了、外網(wǎng)IP地址滿足不了,并且,由于設備供應商無法復工,設備也供應不了。

      肖志立給聯(lián)想打電話,詢問能不能給庫房供1萬臺機器,對方說不好意思,員工都回家了,疫情期間沒有辦法回來。

      直到最后,新機器也沒有送到。最終,還是只能死磕技術(shù),通過軟件的優(yōu)化,把之前一個單元支持100路的技術(shù),提升到支持200路,才解決了物理資源不足的難題。

      一個從無到有的系統(tǒng)

      12億用戶感知到的,是每天都在使用的微信這個產(chǎn)品。他們感知不到的地方,微信背后僅技術(shù)平臺就包括圖片平臺、音視頻傳輸平臺、紅包系統(tǒng)、小視頻平臺等等,這些平臺接入騰訊內(nèi)部超過90%的業(yè)務。

      平臺組合在一起,形成龐大的系統(tǒng),基本能解決已知與未知的問題。這些平臺的形成,不是一蹴而就的,而是經(jīng)歷了漫長的過程。

      圖片系統(tǒng)歷史最悠久,早在2006年的QQ時代就開始使用。當年,QQ用戶突破1000萬,上線了QQ空間相冊,產(chǎn)品很受歡迎,但對于技術(shù)團隊來說,一個首先面對的問題就是:撐不住了。存儲方案也好,流量方案也好,索引方案也好,都支撐不了用戶訴求。“整個底層存儲都已經(jīng)瘋掉了,”鄒方明來到這個部門時,恰好經(jīng)歷了這樣的時代。一些公司在近幾年贊助春晚或遇到突發(fā)事件時,突然發(fā)現(xiàn)的問題,騰訊在十幾年前也遇到過。現(xiàn)在微信、QQ系統(tǒng)的穩(wěn)定,是當年吃虧后積累的經(jīng)驗教訓。

      用戶對圖片的訴求,延伸出了騰訊第一代存儲系統(tǒng),衍生了TFS,之后有了相冊系統(tǒng),不過,當時,他們還沒有想到做技術(shù)平臺。

      不久,新矛盾爆發(fā)。QQ農(nóng)場火爆后,每個用戶都有很多頭像,但原有的相冊系統(tǒng)支撐不了圖像高IO(輸入輸出)。這種情況下,鄒方明把相冊系統(tǒng)做了簡單的分支,就叫頭像系統(tǒng)。

      頭像系統(tǒng)和相冊系統(tǒng),都是圖片,應該分開還是融合?內(nèi)部當時有些焦灼,經(jīng)過很長的PK,他們覺得,還是應該融合到一起。融合之后,騰訊有了第一個技術(shù)平臺,圖片平臺。

      相對于之前各自分離的系統(tǒng),平臺的優(yōu)勢在于成本。騰訊其他團隊也在做圖片服務,他們發(fā)現(xiàn),花了這么多年研發(fā)精力,還不如接入到圖片平臺中,把研發(fā)團隊的生產(chǎn)力解放出來。

      騰訊的其他平臺隨后逐漸誕生。

      2016年,視頻平臺誕生。2019年,音視頻傳輸平臺形成。期間還有紅包系統(tǒng)、文件系統(tǒng)、網(wǎng)盤系統(tǒng),用戶最核心的幾個場景平臺,都由基礎架構(gòu)部搭建完成。

      長期以來,騰訊在互聯(lián)網(wǎng)公司中都以產(chǎn)品力著稱,產(chǎn)品的背后,是技術(shù)平臺的助力。

      去年火爆的視頻號就是一個典型案例,一年時間,視頻號推出了一系列功能,產(chǎn)品人員提出功能需求后,技術(shù)人員第二天或者是第三天就能拿出方案,這離不開平臺的服務和支撐。“產(chǎn)品有想法時,研發(fā)人員能夠很快速做出一個模型,盡快做迭代和嘗試。”鄒方明解釋,“能夠在60分的基礎上去做加法,產(chǎn)品技術(shù)團隊可以把視角放在用戶喜歡玩的玩法上面,放在終端體驗的細節(jié)上面去,從而從整個研發(fā)的長周期中掙脫出來。”

      微信誕生10年,背后的系統(tǒng)也有所不同。2016年之前,系統(tǒng)處于性能不足階段,當時出現(xiàn)問題,無論是漏洞或是代碼問題,事件爆發(fā)的根本原因是,系統(tǒng)能力不足導致的故障。

      2016年之后,系統(tǒng)升級,此后再有熱點,或是再有突然事件,對于技術(shù)來說,就只是量級提高了,都在系統(tǒng)可以支撐的范圍內(nèi)。

      在云時代,系統(tǒng)的支撐能力又有了增加。QQ于2020年完全上云,整體都在云端。微信花了3年時間上云,今年會全部上云。上云的好處是,如果有突發(fā)情況要從其他的業(yè)務騰挪資源,速度快很多。“否則我們就得先把設備從A業(yè)務上下來,再添加到B業(yè)務去,再做測試驗證,這樣時間就長很多。”

      微信10年,系統(tǒng)的基礎建設主要朝著兩個主要的目標在做。“一個是系統(tǒng)的健康性,比如你的熔斷能力,自我恢復能力,每年我們都在找方法。另一個方向就是系統(tǒng)單位成本的承載能力。從字面上去解釋,因為我們的資源團隊、產(chǎn)品團隊,都會給出一個固定的成本,這固定的10000臺設備,能夠支撐100萬次請求,還是500萬次請求,是每年都在持續(xù)優(yōu)化和迭代的過程。我們會發(fā)現(xiàn),只要你的承載能力強了,就可以把每個危急時刻變成不危急。”鄒方明說。

      產(chǎn)品不崩的方法論

      不過,即使有了系統(tǒng),也不能完全保證不崩。尤其對于一款12億人使用的社交產(chǎn)品,任何時刻都有不可控性。

      直到現(xiàn)在,騰訊技術(shù)團隊也不敢打包票說系統(tǒng)完全可控。“推演也是算不過來的,總會算錯的。比如說零點全國發(fā)紅包的人到底有多少?公司發(fā)紅包的量到底有多少?這個東西說實話不是那么好估了,這個時候我們就會想,有沒有保底的大招,來使得這個訪問量控制在系統(tǒng)可接受的范圍之內(nèi),這是非常重要的保底措施。”肖志立說。

      崩盤之前,技術(shù)部門會提前預演,策劃好“劇本”,“劇本”是一種柔性控制,也可以統(tǒng)稱為降級。微信用戶有時在高峰期會覺得微信消息有延遲,或是朋友圈視頻分辨率降低,就是一種降級。

      當系統(tǒng)遭遇了遠超預估的訪問量,就要降級,比如朋友圈視頻平時一個視頻大概2兆,但高峰時刻可以先砍一刀,把2兆砍成1兆,讓更多的人有視頻可以看。

      在不可預判的業(yè)務場景,他們基本上都會以這種方法去應對。“高突發(fā)的時候,用戶不會用得那么爽,但能讓90%用戶覺得滿意,不至于說突然量超過預期了,然后就立刻不行了”。

      肖志立告訴記者,騰訊一直有一個海量之道的技術(shù)方法。在突發(fā)比較高時,始終有一個漏斗模型,“第一層先去頂住絕大部分的請求,把符合要求的再往下層漏,再往下層交易最重的系統(tǒng)。這樣能保證承擔的請求是真正需要的請求,而不是把前面所有的請求都打到后面去。”

      這個技術(shù)方法論被視為騰訊的保底大招,多年來屢試不爽。

      如今只道是尋常

      2021年春節(jié),騰訊基礎架構(gòu)部在一片祥和中度過。除夕5點半,肖志立把當時留守的幾十個兄弟拉到辦公室對面的一個餐廳聚餐,吃到6點半,回來守著機器一起度過了除夕夜。

      全程沒有任何驚險時刻,無驚無喜。

      肖志立依舊全程盯著。他每年春節(jié)前后都在,春節(jié)是最考驗微信的時刻,在他們技術(shù)內(nèi)部看來,平時吹什么牛,都不如扛過春晚的流量來的實在。“每次我也在想,我也不去敲代碼,也不去做指令,為什么我要在?我能夠感覺到就是崩盤了之后,大家都指著我去做‘要人命’的決定,出了故障我才有價值,沒出故障我就像一個閑人。”鄒方明已經(jīng)記不清自己守過了多少個春晚,只是覺得很感慨。

      在基礎架構(gòu)師的職業(yè)生涯里,非常重要的一點,就是在關(guān)鍵時刻做出關(guān)鍵決策。

      2018年之后,微信很少再有關(guān)鍵時刻。這一年,微信紅包的用戶量基本上接近于微信的用戶量,之后的增長基本上已經(jīng)平穩(wěn)。

      肖攀最近兩年也沒有再拜過QQ公仔了,“都比較有信心。”

      現(xiàn)在的系統(tǒng),已經(jīng)不再需要大的變動。并且多年春節(jié)經(jīng)驗后,團隊值班的手段和策略都是已經(jīng)完備和成熟的,還可以提前預判事件。比如今年,他們預測云年夜飯會提前導致一個小高峰,果然,當晚7點的流量是往年5倍,因為已經(jīng)提前預測,今年也平穩(wěn)度過。

      對于現(xiàn)在的騰訊技術(shù)團隊,不再有驚心動魄的故事發(fā)生。

      架構(gòu)師的經(jīng)驗教訓

      微信成立10年,騰訊技術(shù)團隊也跟著走了10年,他們經(jīng)歷高壓,經(jīng)歷崩潰,經(jīng)歷焦慮,到現(xiàn)在視為尋常,一路走來,他們見證微信用戶從0漲到12億用戶,與有榮焉。“做技術(shù)支撐的團隊,一定要有一個好的心態(tài),就是你不在聚光燈下,但是我們心里面知道今天在臺上的產(chǎn)品那么成功,跟我們是有很大關(guān)系的,自己的內(nèi)心要足夠強大,要相信這一點。”

      他們也摸索出了足夠多和業(yè)務部門溝通的方法。鄒方明經(jīng)常給團隊灌輸?shù)睦砟钍牵悄阌写_鑿的依據(jù)能證明你是對的,不然你就先聽業(yè)務部門的。

      目前,微信背后的技術(shù)系統(tǒng)已經(jīng)接近完善,“沒有特別明顯的缺陷和短板。”肖志立對此很自信。

      不過,技術(shù)團隊依舊存在焦慮感。其實,騰訊這支技術(shù)團隊一直很穩(wěn)定,騰訊內(nèi)部架構(gòu)幾經(jīng)大動,技術(shù)部門始終沒變。他們經(jīng)歷了文字互聯(lián)網(wǎng)時代、圖片互聯(lián)網(wǎng)時代,到了視頻互聯(lián)網(wǎng)時代,再到現(xiàn)在的實時音視頻互聯(lián)網(wǎng)時代,技術(shù)一直在演進,內(nèi)容越來越豐富,實時性越來越強。這對于背后系統(tǒng)承載能力的要求,對于穩(wěn)定性、延時的要求,也要比原來高很多,技術(shù)永無止境,他們也永遠等待攻克下一個難關(guān)。

      鄒方明還在持續(xù)學習中。他經(jīng)常參加線下活動,在一些論壇或峰會上,奔到現(xiàn)場面對面和業(yè)界大牛交流取經(jīng),“我們不能夠關(guān)著門做,你必須要到外面找一些可學習的點,業(yè)界的大牛很多,他們會有很多比較好的創(chuàng)意和方法論。”“你永遠不知道什么時候冒出一個新的東西。”肖志立很感慨,“作為支撐團隊,我們得有這種魄力和能力,能夠在彈藥不夠的情況下支持業(yè)務團隊打勝仗。”

       

      版權(quán)聲明:以上內(nèi)容為《經(jīng)濟觀察報》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟觀察報》社所有。未經(jīng)《經(jīng)濟觀察報》社授權(quán),嚴禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責任。版權(quán)合作請致電:【010-60910566-1260】。
      TMT新聞部資深記者
      關(guān)注并報道TMT(科技、傳媒、通信)領(lǐng)域重大事件,擅長行業(yè)分析、深度報道。
      聯(lián)系郵箱:renxiaoning@eeo.com.cn
      微信號:tangtangxiaomo
      亚洲的天堂A∨无码视色
      <nav id="4uuuu"></nav>
    • <tr id="4uuuu"></tr>
    • <tr id="4uuuu"></tr>
    • <tfoot id="4uuuu"><dd id="4uuuu"></dd></tfoot>
      • <noscript id="4uuuu"><optgroup id="4uuuu"></optgroup></noscript>