創澤機器人
CHUANGZE ROBOT
 
  當前位置:首頁 > 新聞資訊 > 機器人知識 > AI也會遭遇瓶頸 解析人工智能技術的存儲性能需求  
 

AI也會遭遇瓶頸 解析人工智能技術的存儲性能需求

來源:--      編輯:創澤      時間:2020/5/13      主題:其他   [加盟]
2020年對於很多人而言都是永遠值得銘記的一年,突如其來的新冠疫情幾乎改變了每個人的生活,它不僅給人類的經濟造成了重大損失,也給人類的健康帶來了巨大的威脅。麵對這難以對付的病毒,我們既看到了無數勇士的悲壯逆行,也看到了科技在整個抗疫鬥爭中所起到的關鍵作用,特別是其中的AI人工智能技術——通過AI技術我們可以加速疫苗的研發;通過AI技術,在眾多醫療終端設備以及大量的病人臨床數據中,我們能提煉出最佳的診斷方案,加速診斷的效率,提升診斷的效果。可以說,AI技術在這次關鍵的戰役中發揮出了重大的作用。

人工智能已經深入醫療、教育、工業到能源、金融等各個領域。

因此並不意外,在2020年第三屆軟件定義存儲峰會上,英特爾提出的主題是“突破內存與存儲瓶頸 釋放人工智能無限潛力”。畢竟在這場抗疫戰鬥中,英特爾不僅投入重金資助合作夥伴使用AI技術進行診斷、疫苗開發方麵的研究,還推動AI科技在醫學檢驗、醫療物資生產、疫情推演等多個領域加速落地,英特爾深知AI人工智能對人類的重要性。除了對抗新型病毒,AI人工智能技術其實也深入了人類生活的各個領域。英特爾公司中國區非易失性存儲解決方案事業部戰略業務開發總監倪錦峰先生在峰會上談到:“從醫療、教育、工業到能源、金融等等,每個行業都在以數字化的方式來尋求主動變革,我們可以預見的是,在不遠的將來,整個社會對數字化的服務需求將不斷地激增”。

AI人工智能技術將給存儲產品帶來重大挑戰

人工智能技術的數據管道主要分為采集、準備、訓練和推理四部分。每個部分需要讀寫不同類型的數據,工作負載也不盡相同。

“工欲善其事,必先利其器”,要想發揮出AI人工智能技術的最大威力,需要企業構建強有力的IT基礎設施。這個設施不僅需要強有力的處理器、FPGA、GPU,也需要高性能的存儲設備,否則就會如普通電腦一般,因為機械硬盤傳輸速度最慢,尋找數據的時間最長,往往會成為整個係統性能的瓶頸,即使是SATA/PCIe NAND SSD,很多時候也跟不上AI數據處理的需求。倪錦峰先生介紹到,無論用於哪個行業,人工智能的工作實際上主要由采集、準備、訓練和推理四部分組成。每個部分需要讀寫不同類型的數據,工作負載也不盡相同,將給存儲設備帶來較大的挑戰。

簡單地說,在整個人工智能執行過程中,IO的需求是不可預測、複雜多變的,它讀寫的數據主要有三個重要的特點:

第一是它的數據集大小,差異性非常大,在最初開始的采集階段是PB級別,到訓練階段是GB級別,到訓練好了執行的函數,相關的模型可能是KB級別;

第二它的工作負載也是複雜多變的,從最初百分之百的寫入到準備階段的50%讀、50%寫混合負載,到後麵的一些訓練、推理階段可能出現百分之百的讀,其中包括很多的隨機讀取操作;

第三是存儲模式也會有很多變化,從一開始順序化的數據流寫入,到後麵則是通過完全隨機的讀寫,來幫助建立準確的模型。

    

因此人工智能技術對存儲性能的要求是很苛刻的,用戶總是希望設備能滿足高吞吐量和低延時的需求,總是希望更多的數據能夠更加靠近處理器,以獲取及時的傳輸、執行,但用戶又會希望AI的基礎設施投資成本能在可控的範圍之內,可以說這是一個相互矛盾的需求,那麼對於用戶來說如何才能實現這個願望呢?

 

優化成本,提升性能

英特爾存儲產品構建分層存儲 

首先還是應對用戶使用的數據類型進行研究,倪錦峰先生向我們展示了英特爾經典的存儲金字塔圖。在應用中,並不是所有數據都會經常被用到,因此數據可以被分成熱數據、溫數據和冷數據等3個不同層次。熱數據即需要立馬進行處理的數據,例如銀行收到的轉賬請求,即時的地理位置等。溫數據是非即時的狀態和行為數據,例如用戶近期感興趣的話題,或用戶最近去過的地方等,冷數據則是不經常訪問的數據。

研究數據類型、數據使用所形成的工作負載,對數據進行分層,並使用最適合的設備來存儲數據可以提升存儲係統的性能,並降低成本。

如果全部使用DRAM內存來存儲這些數據,在性能上可能會表現突出,但也意味著用戶需要花費非常高昂的成本。因此更合理的是根據數據的類型、負載對它們合理地使用存儲設備。例如可以使用DRAM內存、英特爾傲騰持久內存來存儲熱數據,因為它們擁有很高的性能和超低的延遲,離CPU和GPU最近,能夠獲得及時的洞察。而英特爾傲騰固態盤搭配以英特爾為代表的TLC、QLC NAND固態盤,則憑借大容量、高性能適合用於熱、溫熱、溫存儲。這種分層設計的絕妙之處在於金字塔裏的每一個層級的數據、使用產品在容量和延時特性上正好有數量級的差距,這就使得用戶可以根據數據的類型、工作負載進行冷熱分層,並同時參考自己的預算,對性能的需求,對功耗的預期,來不斷地優化自己的存儲方案。

憑借不同於傳統NAND閃存的革命性材料,傲騰具有就地寫入、支持位尋址、低延遲等三大新特性。

那麼英特爾的存儲技術能否承擔起這一重任呢?從倪錦峰先生的介紹中,可以看到由於使用了不同於傳統NAND閃存的傲騰介質,傲騰持久內存、傲騰固態盤具有諸多新特性。首先是它支持就地寫入,寫入前不需要進行數據擦除。不像普通NAND閃存存在讀-修改-寫這個過程,因此它擁有更好的性能。同時在長時間寫入後,它也不會出現數據髒塊,不需要進行垃圾回收,因此傲騰產品可以很好地保持性能一致性,不會出現NAND固態盤用得越久、性能越差的問題。

與采用傳統NAND閃存的DC P4600SSD相比,傲騰固態盤DC P4800X的延遲更低、一致性更好,壽命長得多,效率更高。

其次是傲騰技術支持位尋址,可以提供超低的延遲,帶來更快的傳輸速度,畢竟AI人工智能技術的應用對存儲設備的容量和性能都有很高的要求。相比傳統NAND閃存,傲騰產品在性能上有質的提升,形象地比喻,就是將數據的載體從汽車升級為飛機。延遲方麵,它最好可以做到微秒級別,雖然和內存DRAM的不到0.1 微秒相比還是存在一定的差距,但是已遠遠好於NAND閃存的近百微秒的水平。英特爾數據顯示傲騰DC固態盤的訪問延遲不僅較傳統HDD、SATA SSD大幅降低,即便與同樣采用NVMe接口的NAND SSD相比,其優勢也是非常大的——與采用3D NAND 顆粒的英特爾DC P4600 SSD 相比,傲騰固態盤DC P4800X的讀取延遲在不同寫壓力、不同隊列深度下,低了8~63倍。

此外新介質大幅提升了傲騰產品的壽命,英特爾傲騰固態盤可以支持多達60個DWPD(每日全盤寫入次數),而大家所熟悉的英特爾P4600、P4610這樣的高性能、高壽命的NAND固態盤,隻能支持3個DWPD左右,英特爾傲騰固態盤的進步是非常可觀的。

人工智能技術的數據管道可以通過使用英特爾傲騰持久內存、傲騰固態盤、QLC 3DNAND固態盤,進行合理搭配來提升任務執行的效率,並降低成本、功耗。

同時從AI數據通道中的采集、整理、訓練、推理四個階段,可以看到各階段對存儲的要求是非常高的,需要有持續、一致的吞吐量,以及同樣一致、持續、超低的延遲,這些需求正是傲騰產品所擅長的,再加上英特爾QLC 3D NAND SSD所擁有的大容量(已可實現單盤32TB)、高性能特性,通過這樣一個完美的結合,可以幫助改善客戶對數據的融合,提升軟件定義存儲解決方案的性能,幫助用戶為即將到來的人工智能時代的數據爆發做好相應的準備。

 

大幅提升效率

英特爾存儲方案體現實際價值

采用傲騰固態盤後,VMWare vSAN、hadoop、CEPH等各個存儲係統的性能都獲得了大幅提升。

根據倪錦峰先生介紹,在實際使用中,不少平台改用英特爾傲騰產品後,都獲得了很好的效果。如百度在2018年發布了基於英特爾傲騰固態盤加英特爾QLC 3D NAND固態盤的存儲解決方案,這一方案大幅提升了AI人工智能、大數據、雲計算的存儲性能。在AI的一個訓練場景中,這一方案相比原來的HDD機械硬盤方案可以獲得21倍的性能提升以及96%的延遲下降,同時降低TCO多達60%。在VMWare vSAN分布式存儲係統中,將高性能緩存從NAND PCIe固態盤換成英特爾的傲騰固態盤後,其虛擬機密度提升了60%,同時係統整合率能夠提升30%;在hadoop分布式架構中,當用戶使用英特爾傲騰固態盤作為hadoop的臨時數據緩存後,其吞吐量或性能可以提升40%左右。

 

而在CEPH分布式存儲係統中,當用戶使用英特爾傲騰固態盤替換了傳統的NAND固態盤,作為元數據(metadata)緩存和journal盤後,其延遲可以降低50%左右,同時IOPS性能獲得了40%左右的提升。在微軟的Azure Stack HCI雲平台上,當用戶將英特爾傲騰固態盤作為緩存盤後,則能使每個係統、每個節點所能夠支持的虛擬機數量提升60%左右,同時虛擬機的跑分也能夠提升約80分。此外,現在也有很多國內公司正在使用英特爾傲騰技術來進行存儲解決方案的創新,包括浪潮、VMWare、XSKY、QingCloud等眾多合作夥伴。

 

讓存儲更接近計算資源讓存儲兼得高性能與穩定性


英特爾公司中國區非易失性存儲解決方案事業部戰略業務開發總監倪錦峰先生接受了采訪

從以上的技術講解、案例可以看到,英特爾解決方案之所以能有如此突出的表現,主要依賴的是性能接近內存的傲騰存儲產品。而在前不久舉行的2020英特爾中國年度戰略“紛享會”上,英特爾也提出了近內存計算的概念,那麼這是否代表著未來的存儲趨勢?幸運的是,筆者在此次大會上還獲得了采訪英特爾公司中國區非易失性存儲解決方案事業部戰略業務開發總監倪錦峰先生的機會。倪錦峰先生認為在這個數據爆發的時代,特別是當5G技術發展成熟之後,所產生的大量數據無法通過網絡全部彙集到數據中心,所以部分數據必須要在邊緣進行計算,這就需要存儲和計算在邊緣端融合在一起,隻有高效的存儲性能才能幫助邊緣端快速完成計算。 

而在數據中心裏,則存在不少壓縮、解壓縮等具有規律性、重複性、依賴內存的計算需求,如果使用傳統的執行方式將消耗很多CPU計算資源和DRAM內存資源。英特爾的中長期目標則是將計算和存儲融合在一起,使得存儲和計算更加靠近。比如英特爾中國研究院宋繼強院長提到的方案是將FPGA與存儲架構融合在一起,存儲係統可以滿足類似實時計算的要求,比如壓縮、解壓縮、AI訓練等。同時存儲係統的參與也能有效降低用戶對CPU、內存資源的需求,從而降低成本。而性能接近內存的傲騰介質的確比較合適承擔這一重任。

顯然傲騰突出的性能是實現近內存計算的關鍵,那麼企業在長時間使用傲騰時,是否需要進行額外的維護、保養呢?倪錦峰先生則表示對於傳統的NAND閃存固態盤來說,可能需要這樣的工作。畢竟傳統SSD的讀-修改-寫機製會導致垃圾數據堆積,造成性能下降,同時垃圾回收等會帶來額外的壽命損耗。傳統SSD之所以後續會出問題,一是因為垃圾堆積沒有有效處理,二是因為NAND閃存用的時間越長,它的壞塊就會越多,因此需要做很多壞塊的管理工作,壞塊越多,冗餘空間越來越少,性能也會越差。


而傲騰產品沒有寫入放大的問題,同時可擦寫能力非常高,壽命有量級差異,所以它的整個生命周期裏是沒有性能衰減的問題。同時傲騰產品都經曆了嚴格的性能和可靠性驗證,包括模擬了惡劣負載情況下工作5年的測試,即加速老化測試。英特爾有大量的數據證明,傲騰產品在整個生命周期裏麵性能是一致、持續穩定的。

傲騰將成加速AI人工智能技術的“催化劑”


在本文截稿時,新冠疫情仍沒有結束,人類仍在與之戰鬥。但我們堅信沒有一個冬天不能過去,沒有一個春天不會到來,AI新興技術必將助力人類更快地戰勝疫情,加速推動社會的數字化和智能化的發展。而要加速AI技術的發展,像傲騰這樣讓數據更靠近CPU,性能接近內存的新技術必不可少。而憑借更大的存儲容量和優異的性價比,英特爾QLC3D NAND也將成為取代HDD機械硬盤陣列的一個新選擇。毫無疑問,傲騰技術與QLC 3D NAND技術的結合,將成為AI人工智能技術的“催化劑”,我們也期待著這瓶“催化劑”能讓AI人工智能技術發展得更快,並創造出更多的成果,為人類造福。


創澤智能機器人
創澤智能機器人
中國智能服務機器人領軍企業,涵蓋商用、家庭、特種等多用途的智能機器人產品體係,十幾年行業應用解決方案提供商



自動化所提出神經元群體間側向交互的卷積脈衝神經網絡模型

基於梯度反向傳播的脈衝神經網絡(SNN)訓練方法逐漸興起。在這種訓練方法下,SNN能夠在保留神經元內部動力學的同時獲得較好的性能

基於激光雷達的SLAM(激光SLAM)研究

Cartographer跨平台和傳感器配置,MC2SLAM實時激光裏程計係統,LeGO-LOAM種輕量級和地麵優化的激光雷達裏程計和建圖方法,SUMA++開源的基於語義信息的激光雷達SLAM係統

學一個忘一個?人工智能遭遇“災難性遺忘”,克服“失憶”有何良策

人工智能為什麼會產生“災難性遺忘”?目前,解決災難性遺忘的方案有哪些?難點在哪?來看看專家怎麼說

抗疫“智”先鋒!創澤消毒機器人技高一籌!

創澤智能消毒機器人到山東省胸科醫院、濟南市傳染病醫院、濟南市疾病預防控製中心投入新冠肺炎消毒戰鬥

泰政辦字〔2020〕29號 泰安市人民政府辦公室關於加快推進5G產業發展的實施意見

到2022年年底,全市建設5G基站10000個,5G技術、產品、服務在智能製造、文化旅遊、城市治理、公共服務等領域廣泛應用,培育5G產業鏈優勢企業5家以上、5G產業試點示範項目20個以上,形成一批5G應用創新成果,5G產業生態體係逐步完善。

江蘇省:關於加快新型信息基礎設施建設 擴大信息消費的若幹政策措施

蘇政辦發〔2020〕31號,索引號:014000319/2020-00199,江蘇省增強經濟發展新的支撐力和新動能,現提出政策措施

2020年山東省瞪羚企業十大領軍人物名單

2020年瞪羚企業十大領軍人物:朱平,李勇,肖才根,王學文,鄭淑全,苗健,程終發,張景偉,王仁鴻,陳夢夢

2020年山東省瞪羚企業自主創新十強名單

2020年瞪羚企業十強名單:創澤智能,山東儒房,煙台雲灃,山東嘉源,山東新創,山東中安,朗朗教育,山東開創,泰安市康宇,靑島乾運

濟南新材料產業園投資促進局來創澤智能機器人集團對接交流

2020年3月6日,鄭穎義局長,曲凱部長等一行4人與創澤集團董事長,副總侯月映等公司高層進行了對接交流

中國經濟活力回升 希望正重返中國市場

今日頭條,人民網,新華網,每日郵報等知名媒體,報道創澤集團疫情複工後的生產場景

自動化所提出神經元群體間側向交互的卷積脈衝神經網絡模型

基於梯度反向傳播的脈衝神經網絡(SNN)訓練方法逐漸興起。在這種訓練方法下,SNN能夠在保留神經元內部動力學的同時獲得較好的性能
 
資料獲取
新聞資訊
== 資訊 ==
» 國標《智慧城市 智慧多功能杆 服務功能與
» 人工智能之數據挖掘2020年第9期
» 噴霧消毒殺菌機器人
» 中國通信學會發布《全球人工智能基礎設施戰
» 創澤集團受邀參加工信部 AI 精準賦能中
» 人工智能案例 依圖科技:不斷崛起的AI
» 2020年麵向人工智能新基建的知識圖譜行
» 破解AI工程化難題,AI中台助力企業智能
» 淺析我國消防機器人發展現狀與趨勢 | 山
» 【華為出品】智能體白皮書2020
» “先行示範•智贏未來” 創澤
» 創澤集團牽頭起草的全國首個《應用於滅菌消
» 創澤集團智能機器人新品發布會!多款自主研
» 人工智能人才發展報告:亞太地區創新與招聘
» 創澤集團智能機器人“創創”受邀參加進博會
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

安防巡檢機器人

安防巡檢機器人

人工智能垃圾站

人工智能垃圾站

== 信息推薦 ==
 

機器人招商  Disinfection Robot   消毒機器人公司  機器人應用  智能垃圾站  消毒機器人價格  消毒機器人廠家  機器人政策  教育機器人  迎賓機器人  機器人開發  清潔機器人  消毒機器人  講解機器人  安防巡檢機器人  霧化消毒機器人  紫外線消毒機器人  地圖 
版權所有 © 必威主頁     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

機器人
Baidu
map