国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

面向大規模AI在線推理的可靠性設計
2018-10-30    UCloud云計算 宋翔

  概覽
  
  在 AI 項目中,大多時候開發者的關注點都集中在如何進行訓練、如何調優模型、如何達到滿意的識別率上面。但對于一個完整項目來說,通常是需求推動項目,同時,項目也最終要落到實際業務中來滿足需求。
  
  對于常用的 AI 訓練和機器學習工具如 TensorFlow,它本身也提供了 AI Serving 工具TensorFlow Serving。利用此工具,可以將訓練好的模型簡單保存為模型文件,然后通過的腳本在 TensorFlow Serving 加載模型,輸入待推理數據,得到推理結果。
  
  但與擁有較固定計算周期和運行時長的 AI 訓練不同,AI 推理的調用會隨著業務的漲落而漲落,經常出現類似白天高、夜間低的現象。且在大規模高并發的節點需求情況下,常規的部署方案,明顯無法滿足此類需求,此時需要使用更專業的 AI 推理模型和擴縮容、負載均衡等技術完成預測推理。
  
  UAI-Inference 采用類似 Serverless 的架構,通過請求調度算法、定制擴縮容策略,自動完成 AI 請求的負載均衡,實行節點動態擴容和回收,可提供數萬的 AI 在線推理服務節點。
  
  某AI在線推理一天內的請求訪問情況
  
  AI 推理(Inference)的在線執行有兩大關鍵因素:一是通過 GPU/CPU 對數據進行快速決策,二是對訪問請求的實時響應。下圖為某一 AI 在線推理場景 24 小時內的資源使用情況,其中,橫軸為時間、縱軸為用戶資源請求量,橙色線現表示資源配置情況。
 
  
  凌晨 00:00-8:00 點,用戶基本處于睡眠狀態,此刻的資源請求較少,閑置資源較多;8:00 以后,手機等設備使用量增多,推理訪問請求逐漸上升;直至中午,設備訪問達到高峰,請求量超過設定的資源量,系統紡問出現延遲;之后在線使用量降低,部分資源又將閑置……
  
  可以看到,一天內不同的時間段,訪問量會隨著用戶作息規律而出現相應的起伏,若是將資源配置設置過小,則會導致計算資源不足,系統吞吐量變低,致使訪問延遲。但若投入過多的配置,又會產生大量的閑置資源,增加成本。
  
  面向大規模的AI分布式在線推理設計與實現
  
  UAI-Inference 整體架構
  
  為了應對在線推理對實時擴縮容以及大規模節點的需求,UAI-Inference 在每一臺虛擬機上都部署一個 AI 在線服務計算節點,以類似 Serverless 的架構,通過 SDK 工具包和 AI 在線服務 PaaS 平臺,來加載訓練模型并處理推理(Inference)請求。整體架構如下:
  

  SDK 工具包:主要負責模型加載。包含接口代碼框架、代碼和數據打包模板以及第三方依賴庫描述模板。用戶根據 SDK 工具包內的代碼框架編寫接口代碼,準備好相關代碼和 AI 模型以及第三方庫列表,然后通過打包工具將訓練模型進行打包。
  
  任務打包完畢后,系統自動將業務部署在 AI 在線推理 PaaS 平臺上處理推理請求。這里,平臺每個計算節點都是同構的,節點具有相等的計算能力,以保證系統的負載均衡能力。此外,動態擴縮容、分布式容災等彈性可靠設計也是基于該平臺實現。
  
  在線推理實現原理
  
  在實現上,系統主要采用 CPU/GPU 計算節點來提供推理任務的基礎算力,通過 Docker 容器技術封裝訓練任務,內置 Django Server 來接受外部 HTTP 請求。下圖展現了處理請求的簡單原理與流程:
 
  
  在初始化過程中(init),Django Server 會先根據 conf.json 加載 AI Inference 模塊,然后調用該模塊的 load_model 將 AI 模型加載到 Django HTTP 服務器中;在處理推理請求時,Django 服務器會接受外部的 HTTP 請求,然后再調用 execute 函數來執行推理任務并返回結果。
  
  這里,采用容器技術的好處是可以將運行環境完全隔離,不同任務之間不會產生軟件沖突,只要這些 AI 服務在平臺節點上運行滿足延時要求,就可進行 AI 在線推理服務部署。
  
  功能特性
  
  UAI-Inference 適用于常見的大規模 AI 在線服務場景,如圖像識別、自然語言處理等等。整體而言,該系統具有以下功能特點:
  
  面向 AI 開發:通過預制的 NVIDIA GPU 執行環境和容器鏡像,UAI-Inference 提供基于 Docker 的 HTTP 在線服務基礎鏡像,支持 TensorFlow、Keras、Caffe、MXNet 多種 AI 框架,能快速 AI 算法的在線推理服務化。
  
  海量計算資源:擁有十萬核級別計算資源池,可以充分保障計算資源需求。且系統按照實際計算資源消耗收費,無需擔心資源閑置浪費。
  
  彈性伸縮、快速擴容:隨著業務的高峰和低峰,系統自動調整計算資源配比,對計算集群進行橫向擴展和回縮。
  
  服務高可用:計算節點集群化,提供全系統容災保障,無需擔心單點錯誤。
  
  用戶隔離:通過 Docker 容器技術,將多用戶存儲、網絡、計算資源隔離,具有安全可靠的特性。
  
  簡單易用:支持可視化業務管理和監控,操作簡單。
  
  在線推理的可靠性設計
  
  因為推理請求是隨著訪問量的變化而變化的,因此,在線推理的可靠性設計,考慮以下幾點:1)充足資源池,保證在高并發情況下,系統擁有足夠的計算資源使請求訪問正常;2)負載均衡:將請求合理的分配到各節點當中;3)請求調度算法:用于計算資源的實時調度;4)性能監控:查看用戶訪問狀態,為系統擴縮容做參考;5)高可用部署:保證在單節點宕機時,系統能夠正常運行。
  
  負載均衡
  
  UAI-Inference 為每個在線服務提供了自動負載均衡能力,當用戶提交同構、獨立的 AI 在線推理容器鏡像時,平臺會根據請求的負載創建多個計算節點,并使用負載均衡技術將請求轉發到計算集群中。
 
  
  如圖所示,負載均衡主要包括網絡層和轉發層。網絡層中,同一個交換機(IP)可以接多個后端節點,通過請求調度算法將請求分配到各個計算節點當中。調度算法可以采用Hashing、RR(Round Robin)、Shortest Expected Delay等,其中,Hashing 適用于長鏈接請求,Shortest Expected Delay 適用于短鏈接請求。目前,UAI-Inference 采用 RR 的方式在計算節點間調度請求。整個系統最底層是一個統一的資源池,用以保證充足的計算資源。
  
  動態擴縮容
  
  在實現擴容之前,需要通過監控了解各節點當前的在線推理狀態,這里,主要是通過實時收集節點的負載(CPU、內存)、請求的 QPS 和延時信息,來制定動態的擴容和縮容策略。
  
  系統狀態實時監控
  
  此外,UAI-Inference 系統將 HTTP 請求、延時和 HTTP 返回碼實時記錄成日志,然后通過數據統計來在圖形界面展示 HTTP 請求量、延時、成功率等信息。平臺會實時收集所有計算節點的 stdout 數據,并錄入日志系統,用戶可以通過觀察線上運行日志來了解線上運行狀態,并根據監控信息自動選擇擴容和縮容。
  
  高可用
  
  除了基本的擴縮容和負載均衡,我們也通過將計算節點集群化的方式,提供全系統容災保障。如下圖所示,系統會把整個服務切分成多個 set,部署在跨機房的某幾個機架或者區域里面,當某一個機房或者 set 宕機時,其他地區的在線推理處理還在進行。這種方式的好處是當出現單點故障時,其他區域的計算節點能夠保證整個在線推理請求的正常執行,避免因單節點故障導致的系統不可用。
  
  總結
  
  本文通過對 UAI-Inference 的實現原理、架構設計以及彈性擴縮容、負載均衡、高可用等可靠策略的介紹,講解了大規模、高并發在線推理請求時,UCloud 的部分解決策略和方案。希望能夠拋磚引玉,為其他開發者做AI在線推理部署時帶來新的思路。
  
  截止目前,UAI-Inference 提供了 CPU/GPU 數萬節點的在線推理服務。未來,我們會兼顧高性能在線服務和高性價比的在線服務兩個方向,同時提供針對 GPU 硬件和 CPU 硬件的優化技術,進一步提升在線服務的效率。同時也會著力于公有云和私有云的結合,后期將會推出私有云的在線推理服務。
  
作者 ·宋翔  
UCloud 高級研發工程師。負責 UCloud AI 產品的研發和運營工作,曾先后于系統領域頂級會議 Eurosys、Usinex ATC 等發表論文,在系統體系架構方面具有豐富的經驗。

熱詞搜索:

上一篇:人類遺傳信息違規出境處罰公開 基因大數據安全拷問
下一篇:藍盾視頻專網準入控制系統,實力守護視頻監控安全

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
久久天天躁狠狠躁夜夜av| 激情综合在线| 国产精品日韩一区二区三区| 91久久精品一区二区别| 欧美激情第一页xxx| 亚洲精品在线观| 欧美日韩国产专区| 午夜精品久久久久久久99樱桃| 国产精品视频你懂的| 久久国产66| 亚洲第一主播视频| 欧美日韩在线直播| 欧美在线黄色| 亚洲精品免费网站| 国产精品久久99| 欧美专区日韩视频| 亚洲日本无吗高清不卡| 国产精品扒开腿做爽爽爽视频 | 国产精品日韩一区二区| 久久久久国产成人精品亚洲午夜| 亚洲第一区在线观看| 国产欧美日本一区二区三区| 久久成人精品一区二区三区| 亚洲久久一区二区| 国产一区二区按摩在线观看| 欧美精品 国产精品| 久久精品视频在线| 亚洲视频中文| 亚洲国产婷婷| 国产欧美午夜| 欧美日韩另类视频| 免费观看30秒视频久久| 亚洲尤物视频网| 亚洲日韩欧美视频| 国产偷自视频区视频一区二区| 欧美精品v日韩精品v韩国精品v | 欧美午夜久久| 久久久久久高潮国产精品视| 亚洲午夜av电影| 亚洲欧洲精品一区| 玉米视频成人免费看| 国产日韩欧美电影在线观看| 欧美图区在线视频| 欧美精品v国产精品v日韩精品| 久久国产精品久久久久久| 亚洲一区视频在线| 亚洲午夜精品17c| 在线亚洲免费视频| 日韩视频在线一区二区三区| 亚洲国产一二三| 亚洲国产日本| 亚洲国产成人久久综合| 一色屋精品视频在线看| 黄色精品网站| 亚洲第一成人在线| 亚洲福利小视频| 亚洲电影欧美电影有声小说| 国产一区二区丝袜高跟鞋图片| 国产精品久久久免费| 国产精品美女久久久| 国产精品素人视频| 国产麻豆一精品一av一免费| 国产欧美一区二区三区在线看蜜臀| 亚洲免费在线观看视频| 亚洲国产精品小视频| 蜜臀av国产精品久久久久| 欧美亚洲免费电影| 免费成人av资源网| 久久手机免费观看| 久久久精品免费视频| 久久久久看片| 久久免费99精品久久久久久| 久久久五月天| 欧美大成色www永久网站婷| 欧美成人精品h版在线观看| 欧美xx视频| 欧美日韩国产综合一区二区| 国产精品一区在线观看你懂的 | 欧美在线3区| 久久国产福利| 久久夜色精品| 欧美日本国产精品| 国产精品v欧美精品v日本精品动漫| 国产精品红桃| 国产一区二区三区四区五区美女 | 国产精品爱啪在线线免费观看| 欧美日韩专区| 国产亚洲欧美一区二区三区| 激情欧美丁香| 亚洲午夜女主播在线直播| 亚洲欧美成人网| 狂野欧美激情性xxxx欧美| 欧美日韩视频在线一区二区| 欧美日韩精品久久| 国产精品视频久久久| 黄色小说综合网站| 99热在线精品观看| 欧美综合国产| 欧美区高清在线| 国产色综合久久| 国产手机视频一区二区| 国产精品国产三级国产普通话蜜臀 | 国产精品v日韩精品v欧美精品网站| 国产精品久久久久久久9999| 国产自产在线视频一区| 亚洲激情在线激情| 亚洲三级视频在线观看| 亚洲男人的天堂在线| 欧美肥婆在线| 国产一区二区久久精品| 一本一道久久综合狠狠老精东影业| 久久国产精品久久国产精品| 欧美日韩午夜精品| 在线观看欧美日本| 亚洲欧美电影在线观看| 欧美美女bb生活片| 91久久极品少妇xxxxⅹ软件| 亚洲尤物视频网| 欧美激情亚洲精品| 极品av少妇一区二区| 亚洲欧美国产制服动漫| 欧美黄色aaaa| 黄色成人在线观看| 韩国三级在线一区| 午夜精彩视频在线观看不卡| 欧美久久久久| 在线日韩电影| 久久嫩草精品久久久精品一| 国产精品老女人精品视频| 亚洲精品你懂的| 欧美va亚洲va香蕉在线| 亚洲国产高清视频| 久久久久久亚洲精品中文字幕| 国产精品劲爆视频| 亚洲网站视频福利| 欧美日韩日本网| 亚洲毛片视频| 欧美精品一区二区久久婷婷| 尤物yw午夜国产精品视频| 久久动漫亚洲| 在线观看视频一区二区| 亚洲欧美激情一区二区| 欧美日韩一区二区三区在线观看免 | 久久蜜桃精品| 国产一区在线看| 欧美伊人久久大香线蕉综合69| 国产精品美腿一区在线看 | 欧美在线短视频| 国产农村妇女精品一区二区| 99热这里只有精品8| 欧美大片在线观看| 亚洲裸体在线观看| 国产亚洲欧美在线| 久久精品五月婷婷| 在线观看中文字幕亚洲| 欧美成人网在线| 国产精品亚洲综合| 欧美一区午夜视频在线观看| 韩国一区二区三区在线观看| 久久这里有精品15一区二区三区| 亚洲高清中文字幕| 欧美日韩国产丝袜另类| 亚洲视频香蕉人妖| 国内在线观看一区二区三区| 欧美成人亚洲成人| 亚洲午夜精品一区二区| 葵司免费一区二区三区四区五区| 亚洲高清免费在线| 欧美午夜精品一区| 久久久久久久97| 99成人在线| 国产一区二区三区无遮挡| 欧美成人一区在线| 午夜久久tv| 亚洲激情成人在线| 国产精品日韩久久久久| 开元免费观看欧美电视剧网站| 国产精品一卡| 欧美成人综合在线| 欧美有码在线视频| 99国产一区二区三精品乱码| 国产欧美 在线欧美| 欧美成人精品一区二区三区| 亚洲视频狠狠| 亚洲人成亚洲人成在线观看图片| 国产精品久久久一本精品| 久久久久久夜精品精品免费| 99在线精品视频在线观看| 国内精品免费在线观看| 欧美色另类天堂2015| 久久婷婷麻豆| 久久精品人人做人人综合| 99re在线精品| 在线日韩av永久免费观看| 国产精品亚洲аv天堂网| 欧美区一区二| 欧美成人一区二区三区片免费| 亚洲区一区二区三区| 国产综合色精品一区二区三区| 欧美日韩国产一区二区三区地区 |