器之心報道
機器之心編輯部
ICML 全稱是 International Conference on Machine Learning,由國際機器學習學會(IMLS)舉辦,是計算機人工智能領域的頂級會議。
今年的 ICML 大會已是第 41 屆,目前正在奧地利維也納舉行。在剛剛進行的開幕式上,一年比一年火熱的 ICML 公布了今年的大會數據與獎項信息。
本屆主會議共收到有效論文投稿 9473 篇,其中有 2610 篇論文被錄用,錄用率為 27.5%,其中包含 144 篇 oral,191 篇 spotlight。
被接收論文的主題關鍵詞為:大語言模型、強化學習、深度學習、圖神經網絡、機器學習、聯邦學習、擴散模型、Transformer、LLM、表示學習、生成模型…… 這些關鍵詞也代表了當前 AI 領域最為熱門的研究方向。
除了這些數據,大會現場還公布了今年的時間檢驗獎與最佳論文。賈揚清十年前在伯克利期間共一完成的論文 DeCAF,獲得了今年的時間檢驗獎。而相比于去年的 6 篇,今年有 10 篇研究獲得最佳論文,其中包含前段時間爆火的 Google DeepMind 世界模型 Genie、視頻模型 VideoPoet 等。
時間檢驗獎
關于 DeCAF 獲獎,賈揚清在朋友圈表示,「從今天的用詞來說,DeCAF 應該是視覺領域的 foundation features 和 deep embedding,也讓計算機視覺領域有了一個 generalizable feature。DeCAF 的工作后來又催生了通用的物體檢測框架 R-CNN,高性能異構計算的框架 Caffe,間接促成了伯克利和 NVidia 合作編寫了第一代的加速框架 CuDNN,雅虎實驗室創作的大規模分布式訓練 CaffeOnSpark,等一系列工作,奠定了伯克利在深度學習浪潮當中的領先地位?!?/span>
論文:DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition
作者:Jeffrey Donahue、Yangqing Jia、Oriol Vinyals、Judy Hoffman、Ning Zhang、Eric Tzeng、Trevor Darrell
機構:UC Berkeley & ICSI, Berkeley, CA, USA
論文鏈接:https://arxiv.org/pdf/1310.1531
研究團隊評估了從在大規模、固定的目標識別任務集上以完全監督方式訓練的深度卷積網絡的激活中提取的特征是否可以重新用于新的通用任務。這些通用任務可能與最初訓練的任務有顯著不同,且可能沒有足夠的有標簽或無標簽數據來常規地訓練或調整深度架構以適應新任務。他們研究并可視化了深度卷積特征在各種任務(包括場景識別、領域適應和細粒度識別挑戰)中的語義聚類。研究者比較了依賴網絡不同層次來定義固定特征的效果,并報告了在若干重要視覺挑戰上顯著優于現有技術的新結果。他們發布了 DeCAF,這是一種深度卷積激活特征的開源實現,包含所有相關的網絡參數,以便視覺研究人員能夠在一系列視覺概念學習范式中進行深度表示的實驗。
最佳論文
論文 1:Scaling Rectified Flow Transformers for High-Resolution Image Synthesis
作者:Patrick Esser, Sumith Kulal, Andreas Blattmann, Rahim Entezari, Jonas Müller, Harry Saini, Yam Levi, Dominik Lorenz, Axel Sauer, Frederic Boesel, Dustin Podell, Tim Dockhorn, Zion English, Robin Rombach
機構:Stability AI
論文地址:https://proceedings.mlr.press/v235/esser24a.html
機器之心報道:Stable Diffusion 3論文終于發布,架構細節大揭秘,對復現Sora有幫助?
這篇論文正是 Stable Diffusion 3 的論文。與之前的版本相比,Stable Diffusion 3 生成的圖在質量上實現了很大改進,支持多主題提示,文字書寫效果也更好了。
Stable Diffusion 3 模型架構。
擴散模型通過將數據的前向路徑反轉為噪聲來從噪聲中創建數據,已成為一種強大的生成建模技術,適用于圖像和視頻等高維感知數據。Rectified Flow(RF)是一種最新的生成模型公式,它將數據和噪聲連接在一條直線上。盡管其具有更好的理論特性、概念簡單,但它尚未被明確確立為標準實踐。
該研究改進了現有的噪聲采樣技術,通過將 RF 模型偏向于感知相關的尺度來訓練它們。通過大規模研究,該研究表明與用于高分辨率文本到圖像合成的現有擴散公式相比,這種方法具有優越的性能。
此外,該研究還提出了一種基于 Transformer 的新型架構,用于文本到圖像的生成,該架構對兩種模式使用單獨的權重,并實現圖像和文本 token 之間的雙向信息流,從而改善文本理解、人類偏好評級等。該研究證明,該架構遵循可預測的擴展趨勢,并觀察到驗證損失隨著模型大小和訓練步驟的增加而平穩降低。
改進的多模態擴散 Transformer:MMDiT 塊。
論文 2:Genie: Generative Interactive Environments
作者:Jake Bruce, Michael Dennis, Ashley Edwards, Jack Parker-Holder, Yuge Shi, Edward Hughes 等
機構:Google DeepMind、不列顛哥倫比亞大學
論文地址:https://arxiv.org/pdf/2402.15391.pdf
該論文定義了生成式 AI 的全新范式 —— 生成式交互環境 ——Genie(Generative Interactive Environments)。Genie 是一個 110 億參數的基礎世界模型,可以通過單張圖像提示生成可玩的交互式環境。
機器之心報道:剛剛,谷歌發布基礎世界模型:11B參數,能生成可交互虛擬世界
Genie 架構中的多個組件基于 Vision Transformer (ViT) 構建而成。值得注意的是,由于 Transformer 的二次內存成本給視頻領域帶來了挑戰,視頻最多可以包含 (10^4 ) 個 token。因此,谷歌在所有模型組件中采用內存高效的 ST-transformer 架構,以此平衡模型容量與計算約束。
Genie 包含三個關鍵組件(如下圖所示):
1) 潛在動作模型(Latent Action Model ,LAM),用于推理每對幀之間的潛在動作 ;
2) 視頻分詞器(Tokenizer),用于將原始視頻幀轉換為離散 token ;
3) 動態模型,給定潛在動作和過去幀的 token,用來預測視頻的下一幀。
為了實現可控的視頻生成,谷歌將前一幀所采取的動作作為未來幀預測的條件。然而,此類動作標簽在互聯網的視頻中可用的很少,并且獲取動作注釋的成本會很高。相反,谷歌以完全無監督的方式學習潛在動作。
論文 3:Considerations for Differentially Private Learning with Large-Scale Public Pretraining
作者:Florian Tramèr, Gautam Kamath, Nicholas Carlini
機構:蘇黎世聯邦理工大學、滑鐵盧大學、Google DeepMind
論文地址:https://arxiv.org/abs/2212.06470
通過利用在大型公共數據集上預訓練的非私有模型的遷移學習功能,可以顯著提高差分私有機器學習的性能。該論文質疑使用大型網絡抓取數據集是否應被視為差分隱私保護。
該研究認為:將這些在網絡數據上預訓練的模型設置為「私有」模型可能會損害并削弱公眾對差分隱私的信任。除了使用公共數據的隱私考慮之外,該研究進一步質疑了這種范式的實用性。該研究仔細檢查了現有的機器學習基準是否適合衡量預訓練模型泛化到敏感領域的能力,這些領域在公共網絡數據中可能很難得到體現。
此外,該研究注意到部署大模型可能會造成隱私的凈損失,因為需要將私有數據外包給計算能力更強的第三方。
論文 4:Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution
作者:Aaron Lou、Chenlin Meng、Stefano Ermon
機構:斯坦福大學、Pika Labs
論文地址:https://proceedings.mlr.press/v235/lou24a.html
盡管擴散模型在許多生成建模任務中表現出色,但在自然語言等離散數據領域卻未能達到預期效果。標準的擴散模型依賴于成熟的得分匹配理論,但將其推廣到離散結構的嘗試并未帶來相同的經驗收益。
在這項工作中,研究團隊通過提出得分熵這一新穎的損失來彌補這一差距。得分熵自然地將得分匹配擴展到離散空間,無縫集成以構建離散擴散模型,并顯著提升性能。
在實驗中,他們在標準語言建模任務上測試了得分熵離散擴散模型(SEDD)。在可比的模型規模下,SEDD 優于現有的語言擴散范式(困惑度降低 25-75%),并且與自回歸模型競爭,特別是在性能上超過了 GPT-2。此外,與自回歸模型相比,SEDD 能夠在不需要分布退火技術(如溫度縮放)的情況下生成真實文本(生成困惑度比未退火的 GPT-2 高出約 6-8 倍),可以在計算量和質量之間進行權衡(以 32 倍更少的網絡評估實現相似的質量),并且支持可控的填充(匹配核采樣質量,同時允許除從左到右提示之外的其他策略)。
論文 5:Probabilistic Inference in Language Models via Twisted Sequential Monte Carlo
作者:Stephen Zhao、Rob Brekelmans、Alireza Makhzani 、Roger Grosse
機構:University of Toronto、Vector Institute
論文地址:https://proceedings.mlr.press/v235/zhao24c.html
大語言模型(LLMs)的眾多能力和安全技術,包括 RLHF、自動紅隊測試、提示工程和填充,可以視為從由給定獎勵或潛在函數定義的非規范化目標分布中采樣。在這項工作中,作者利用順序蒙特卡洛(SMC)的豐富工具箱來處理這些概率推理問題。特別是,他們使用學習到的扭曲函數來估計每個時間步長上潛在的預期未來值,從而能夠在推理時的計算集中在有希望的部分序列上。
研究者提出了一種新穎的對比方法來學習扭曲函數,并與軟強化學習的豐富文獻建立了聯系。作為扭曲 SMC 框架的一個補充應用,他們提出了一種方法,使用新的雙向 SMC 界限在對數分區函數上評估語言模型推理技術的準確性。這些界限可用于估計推理分布與目標分布之間的雙向 KL 散度。他們應用推理評估技術,證明扭曲 SMC 在從預訓練模型中采樣不良輸出(對無害訓練和自動紅隊測試很有用)、生成具有不同情感的評論以及執行填充任務方面是有效的。
論文 6:Debating with More Persuasive LLMs Leads to More Truthful Answers
作者:Akbir Khan、John Hughes、Dan Valentine、Laura Ruis、Kshitij Sachan、Ansh Radhakrishnan、Edward Grefenstette、Samuel Bowman、Tim Rockt?schel、Ethan Perez
機構:倫敦大學學院、Speechmatics、MATS、Anthropic、FAR AI
論文地址:https://proceedings.mlr.press/v235/khan24a.html
將大語言模型(LLMs)與期望行為對齊的常見方法在很大程度上依賴于人工標注數據。然而,隨著模型變得越來越復雜,它們將超越人類的專業知識,而人類評估的角色將演變為非專家監督專家。基于此預期,研究者提出了一個問題:較弱的模型能否評估較強模型的正確性?他們設置了類似的情景來研究這個問題:其中較強的模型(專家)擁有回答問題所需的背景信息,而較弱的模型(非專家)缺乏這些信息。研究者選擇了辯論作為測試方法 —— 即讓兩個 LLM 專家各自為不同的答案辯護,由非專家選擇最終答案。
研究團隊發現辯論有效地幫助了非專家模型和人類回答問題,分別實現了 76% 和 88% 的準確率(原始基線分別為 48% 和 60%)。
此外,以無監督方式優化專家辯手的說服力,提高了非專家在辯論中識別真相的能力。此結果在缺乏真值標簽的情況下,通過辯論對齊模型的可行性提供了參考。
論文 7:Information Complexity of Stochastic Convex Optimization: Applications to Generalization, Memorization, and Tracing
作者:Idan Attias、Gintare Karolina Dziugaite、Mahdi Haghifam、Roi Livni、Daniel Roy
機構:本?古里安大學、多倫多大學、DeepMind 等
論文地址:https://proceedings.mlr.press/v235/attias24a.html
在這項工作中,作者研究了在隨機凸優化(SCO)背景下記憶與學習之間的相互作用。他們通過學習算法揭示其訓練數據點的信息來定義記憶,并使用 Steinke 和 Zakynthinou(2020)提出的條件互信息(CMI)框架來量化這些信息。
該研究的主要結果是精確刻畫了學習算法的準確性與其 CMI 之間的權衡,回答了 Livni(2023)提出的一個開放問題。本文表明,在 L2 Lipschitz–有界設置和強凸性條件下,每個具有過度誤差 ? 的學習者,其 CMI 分別下界為 Ω(1/?2) 和 Ω(1/)。作者 進一步設計一個對手,展示了記憶在 SCO 問題中不可或缺的作用,該對手能夠在特定的 SCO 問題中準確識別出大量訓練樣本。最后,他們列舉了結果的若干影響,例如基于 CMI 的泛化界限的限制以及 SCO 問題中樣本的不可壓縮性。
論文 8:Measure Dataset Diversity, Don't Just Claim It
作者:Dora Zhao、Jerone Andrews、Orestis Papakyriakopoulos、Alice Xiang
機構:斯坦福大學、Sony AI(英國倫敦)、慕尼黑工業大學、Sony AI(美國西雅圖)
論文地址:https://arxiv.org/html/2407.08188v1
機器學習(ML)數據集通常被認為是中立的,但它們本質上包含了抽象且有爭議的社會構建。數據集策展人經常使用諸如多樣性、偏見和質量等價值負載術語來描述數據集。盡管這些術語被廣泛使用,但它們缺乏明確的定義和驗證。該研究團隊的研究通過分析 135 個圖像和文本數據集中的 “多樣性” 來探討這一問題的影響。借鑒社會科學,應用測量理論中的原則來確定考慮因素,并提供有關數據集中多樣性的概念化、操作化和評估的建議。他們的研究結果對 ML 研究具有廣泛的影響,倡導在數據集構建中處理價值負載屬性時采用更細致和精確的方法。
論文 9:VideoPoet: A Large Language Model for Zero-Shot Video Generation
作者:Dan Kondratyuk、Lijun Yu、Xiuye Gu、Jose Lezama、 Jonathan Huang、Grant Schindler、Rachel Hornung、Vighnesh N Birodkar、Jimmy Yan、Ming-Chang Chiu、Krishna Somandepalli、Hassan Akbari、Yair Alon、Yong Cheng、Joshua V Dillon、Agrim Gupta、Meera Hahn、Anja Hauth、David Hendon、Alonso Martinez、David Minnen、Mikhail Sirotenko、Kihyuk Sohn、Xuan Yang、Hartwig Adam、Ming-Hsuan Yang、Irfan Essa、Huisheng Wang、David Ross、Bryan Seybold、Lu Jiang
機構:谷歌、卡內基梅隆大學
論文地址:https://proceedings.mlr.press/v235/kondratyuk24a.html
項目鏈接:http://sites.research.google/videopoet/
機器之心報道:視頻生成可以無限長?谷歌 VideoPoet 大模型上線,網友:革命性技術
研究團隊發布了 VideoPoet,這是一種能夠從多種條件信號合成高質量視頻的語言模型。VideoPoet 采用僅解碼器的 Transformer 架構,處理包括圖像、視頻、文本和音頻在內的多模態輸入。
訓練協議遵循大語言模型(LLMs)的流程,包括兩個階段:預訓練和任務特定適應。在預訓練階段,VideoPoet 在自回歸 Transformer 框架內結合多模態生成目標的混合。預訓練的 LLM 作為基礎,可以適應一系列視頻生成任務。他們展示了該模型在零樣本視頻生成方面的最新能力,特別是生成高保真運動的能力。
論文 10:Stealing part of a production language model
作者:Nicholas Carlini、Daniel Paleka、Krishnamurthy Dvijotham、Thomas Steinke、Jonathan Hayase、A. Feder Cooper、Katherine Lee、Matthew Jagielski、Milad Nasresfahani、Arthur Conmy、Eric Wallace、David Rolnick、Florian Tramer
機構:OpenAI、Google DeepMind、蘇黎世聯邦理工學院、華盛頓大學、麥吉爾大學
論文地址:https://arxiv.org/pdf/2403.06634
該論文提出了一種全新的攻擊 AI 模型的方法。它能夠從 OpenAI 的 ChatGPT 或谷歌的 PaLM-2 的黑盒生成式語言模型中,精準提取信息。這種方法能侵入 Transformer 的嵌入投影層(這是模型理解語言的關鍵部分),只需要通過 API 訪問權限,通過一個網站或應用程序,和模型聊天就能讓它「破防」?;谡撐闹械姆椒?,研究者破解了了 GPT 系列兩個基礎模型 Ada 和 Babbage 的整個投影矩陣的整個投影矩陣,如隱藏維度這樣的關鍵信息也直接破獲:一個為 1024,一個為 2048。他們還攻破了 gpt-3.5- turbo 的隱藏維度,如果想要恢復模型的整個投影矩陣,成本不會超過 2000 美元。研究者提出了一系列防御措施和緩解策略,以防范此類攻擊的發生。
產動漫風愈刮愈烈,從《大圣歸來》到《大魚海棠》,每一部國產動漫的片子都備受熱評,網評有好有壞,有吐槽有質疑也有贊揚,最近大熱的《大魚海棠》更是被指抄襲,罵聲一片。目前正在東南衛視和石獅電視臺熱播動畫,國內首創 ”全年齡層雙段式” 原創IP《靈石茂險王》是世茂斥巨資打造的一部走心的良心動畫,竟也難逃指責被指抄襲。
現在眾多網友說滿屏中國風的《大魚海棠》抄襲千與千尋,東南衛視熱播的原創IP動畫《靈石茂險王》也被指模仿。
近年來國產原創動漫已經有了飛速發展,但跟日本和歐美相比還處于學習階段,學習別人長處是成長的過程而并非模仿,這一點不能被忽略。原創IP《靈石茂險王》吸取了很多優秀動漫的長處,而被誤認為模仿,實屬冤枉。
《靈石茂險王》場景插畫——南之山谷山路&叢林
《靈石茂險王》人物原設——天空之城人物
《靈石茂險王》——Q版莎莎造型
首創“全年齡層 雙段式”結構
<iframe align="center,center" allowtransparency="true" frameborder="0" height="250" hspace="0" id="iframeu2148927_0" marginheight="0" marginwidth="0" scrolling="no" src="http://pos.baidu.com/vcxm?rdid=2148927&dc=2&di=u2148927&dri=0&dis=0&dai=1&ps=2883x694&dcb=BAIDU_SSP_define&dtm=HTML_POST&dvi=0.0&dci=-1&dpt=none&tsr=0&tpr=1468576714875&ti=%E5%9B%BD%E6%BC%AB%E9%A2%91%E9%A2%91%E8%A2%AB%E6%8C%87%E6%8A%84%E8%A2%AD%EF%BC%8C%E5%8E%9F%E5%88%9B%E3%80%8A%E7%81%B5%E7%9F%B3%E8%8C%82%E9%99%A9%E7%8E%8B%E3%80%8B%E4%B8%8D%E5%B9%B8%E8%BA%BA%E6%9E%AA%20-%20%E6%B6%88%E8%B4%B9%E6%8C%87%E5%8D%97%20-%2021CN.COM&ari=2&dbv=2&drs=1&pcs=2378x1170&pss=2379x3149&cfv=0&cpl=32&chi=1&cce=true&cec=UTF-8&tlm=1468576714&rw=1170<u=http%3A%2F%2Flife.21cn.com%2Fzaojiao%2Fshopping%2Fa%2F2016%2F0714%2F15%2F31288600.shtml&ecd=1&psr=1920x1080&par=1920x1050&pis=-1x-1&ccd=24&cja=true&cmi=48&col=zh-CN&cdo=-1&tcn=1468576715&qn=ef45db10d4bdecfc&tt=1468576714814.72.154.158" style="display: block; border: 0px; vertical-align: bottom; margin: 0px;" vspace="0" width="250"></iframe>
《靈石茂險王》是國內首創“全年齡層、雙段式”結構動畫,同時擁有3D和2D“大茂小劇場”、Q版兩種視覺表達形式來滿足不同年齡層的觀眾,每集22分鐘,前19分鐘針對7-14歲兒童的寓教于樂式的3D科幻冒險類動畫片,后3分鐘滿足3-6歲小朋友觀影需求的2D卡通小劇場。此模式的優點在于,既延展了傳統卡通片單一的表現形式,又將IP價值最大化地呈現給觀眾。
不可否認,在當今日漫歐漫撐起半邊天的現況下。國漫走得尤其艱辛。但我們不得不承認的是,國產動畫越來越用心?!鹅`石茂險王》是世茂集團精心打造的一部優質動畫。在傳統地產轉型之余,發展以優質的IP作為靈魂,為國產動漫的發展獻出自己的一份力量,是世茂集團的初衷。
不過有吐槽有質疑,這說明觀眾對國產動畫的要求越來越高,也說明觀眾們越來越重視我們自己的動畫。《靈石茂險王》這部優質原創IP動畫將在全國各大少兒衛視陸續開播,陪伴小朋友們開啟歡樂的假期模式,這是值得我們關注的一部原創動畫!
對于我國的動漫產業以及這些正在努力為國產動漫做貢獻的人們,請我們少一份冷漠與吐槽,給予多一份理解和支持。
望著,盼望著,春天來了,Vega的腳步又近了。然而據小道消息稱,Vega最早也要在5月份才能與大家見面,為了安撫A飯們迫切的心情,AMD在4月中旬的這個時候正式為大家帶來了Polaris 10的升級版產品——Radeon RX 580作為Vega發布前的“開胃菜”。該卡同樣使用Polaris核心,不過已經由Polaris 10升級為Polaris 20,并且公版的外觀和散熱方式照比之前有所改變,神似藍寶石的RX 400超白金系列,從單渦輪扇換成了雙開放式風扇,不過整體風格還是跟之前一樣。
此前我們已經對全新的RX 500系列顯卡進行了全面的曝光,這些曝光均已被證實:該卡擁有和RX 480相同的GCN 4.0架構,同樣具備2304個流處理器,顯存配置也是一樣的256-bit 8Gbps GDDR5,也就是說從硬件參數上看,RX 580和RX 480是沒有什么區別的。正如前面說的,RX 580是RX 480的升級版產品,因此核心沒什么變化也是正常的,重點是看AMD對全新的RX 580進行了怎樣的優化。
藍寶石 RX 580 超白金 OC 限量版
說起RX 580和RX 480最大的不同自然就是頻率方面,RX 580的核心頻率可達1340MHz,照比RX 480提升了11%,非公版提升更為明顯,率先寄到我們這里的藍寶石 RX 580 超白金 OC 限量版的頻率高達1450MHz,照比RX 480公版提升了20%以上!此外,RX 580無論是公版還是非公版的PCB均經過全面優化,最直觀的一處就是供電接口:公版的外接供電由RX 480的6pin升級為8pin,而我們手里這塊藍寶石非公版采用的則是8+6pin,當然,強化供電除了為了避免去年“偷電門”事件的再度發生,由于頻率的升高,更充足的供電也能保證顯卡在高頻下工作的穩定性。
照比R9 380X和GTX 970提升非常明顯
距離上一次AN兩家發布甜點級新卡才過去不到一年,所以兩家都沒有準備像去年一樣的革命性產品,AMD推出了RX 480的升級版RX 580,而NVIDIA發布了GTX 1060的顯存超頻版GTX 1060 9Gbps,二者都只能算是去年的小改良版。兩款新卡對于那些去年已經購買了RX 480或GTX 1060的人來說升級的意義不大,但對于那些還在使用GTX 960、R9 380這樣的甜點卡的玩家來說,今年這兩款卡似乎可以成為他們下手的目標。所以我們第一時間為大家帶來了RX 580的首測文章,告訴那些還在猶豫的朋友這款卡究竟值不值得買。
更順滑的高清游戲體驗
在開始測試之前我們先說一下參測顯卡,吉吉我為了精確體現Radeon RX 580的實力,選擇了一塊GTX 1060以及一塊RX 480作為主要對比對象??紤]到我們所用的RX 580為藍寶石的頂級非公版產品,我們選擇的GTX 1060為微星的GTX 1060 GAMING X,同樣是市面上的頂級非公版GTX 1060之一。RX 480我們選擇的是藍寶石RX 480海外版,是一款市面上比較有代表性的RX 480非公版產品。那么接下來就讓我們通過全方位的游戲和軟件測試,來看看新升級的Polaris會有怎樣的實力。
Radeon RX 580視頻
http://www.iqiyi.com/w_19rtyitl7p.html?source=
頻率再創新高
Radeon RX 580采用14nm FinFET “Polaris 20”核心,核心面積為232平方毫米,共包含57億個晶體管?;贕CN 4.0架構的該核心共有2304個流處理器,運算單元數量為36個,TMUs總數量為144個,ROPs數量為32個,四個帶寬為64bit的雙通道顯存控制器組成了總量為256bit的顯存控制單元,大小為8GB。
顯 卡 規 格 比 較 表 | ||||
顯卡型號 | RX 480 | RX 580 | R9 380X | GTX 1060 |
首發限價 | ¥1999 | ¥1899 | ¥1799 | ¥1999 |
GPU代號 | Polaris 10 | Polaris 20 | Antigua | GP106 |
GPU工藝 | 14nm | 14nm | 28nm | 16nm |
GPU晶體管 | 5.7B | 5.7B | 5B | 4.4B |
著色器數量 | 2304 | 2304 | 2048 | 1280 |
單精度浮點 | 5.8 T | 6.2 T | 4 T | 4.4T |
ROPs數量 | 32 | 32 | 32 | 48 |
紋理單元數量 | 144 | 144 | 128 | 80 |
核心頻率 | 1120MHz | 1257MHz | ?MHz | 1506MHz |
boost頻率 | 1266MHz | 1340MHz | 970MHz | 1709MHz |
架構 | GCN 4.0 | GCN 4.0 | GCN 1.2 | Pascal |
顯存頻率 | 2000 MHz | 2000 MHz | 1425 MHz | 2002 MHz |
內存位寬 | 256 bit | 256 bit | 256 bit | 192 bit |
內存帶寬 | 256 GB/s | 256 GB/s | 182 GB/s | 192 GB/s |
內存類型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
內存容量 | 8/4 GB | 8/4 GB | 4 GB | 6 GB |
注:表中售價均為官方首發限價
我們可以看到,Radeon RX 580的默認核心頻率已經幾乎與RX 480的boost頻率持平,而Boost頻率則是高達1340MHz,比RX 480高了74MHz,這個頻率是目前所有A卡中最高的。RX 580顯存帶寬為256GB/s,默認Pixel Fillrate能力達到了42.9 Gpiexls/S,默認Texture Fillrate能力為193 Gtexels/S。憑借高頻和龐大的運算規模,RX 580擁有6.2 TFLOPS的高單精度浮點運算能力,照比RX 480又提升了0.4T。
Polaris 20架構圖
GCN 4.0架構Polaris 20芯片由以下主要的部分組成:
1、基于三星的14nm FinFET工藝,照比之前的28nm工藝,為每個CU單元帶來15%的性能提升,以及高達2.8倍的能耗比提升。
2、與“Fiji”相同的宏觀并行結構,36組CU單元被分為4個Shader Engines,每個Shader Engines包含9組CUs。每個CU的Shader效率照比前代提升了15%,同時幾何引擎也有所改進。
3、與Shader Engines一一對應的4組Geometry Unit(幾何處理單元)以及4組Rasterizer(光柵化單元)。
4、ACE異步計算單元的總量為4組,同時,還有2組全新的,為異步運算設計的HWS加入到架構中。HWS用來更好地對硬件資源進行調度,提高異步運算效率。
5、二級緩存是之前的2倍,在降低顯存帶寬需求的同時改善電源效率,在顯存運行上更節能。
RX 580和RX 570詳細參數
上表是RX 580和RX 570的詳細參數,我們可以看到,隨著頻率的提升,兩張卡的單精度浮點運算性能、像素填充率和紋理填充率均有明顯上升,不過TDP也水漲船高,RX 580照比RX 480漲了35W,RX 570照比RX 470漲了30W。
Radeon Chill技術介紹
在去年年末,AMD發布了雞血驅動Radeon Software Crimson ReLive Edition 16.12.1,該驅動為玩家帶來了一個全新的功能——Radeon Chill,該技術可以說是“超出想象的節能手段”。Radeon Chill會實時監控游戲狀態,在玩家沒有操作鼠標、鍵盤時自動降低幀率,一旦檢測到玩家的操作,顯卡會立即恢復之前的高性能運行狀態。也就是說,Radeon Chill的原理是降低操作間隙時的幀數,而保持有操作時的幀數,這樣在無形中降低了顯卡功耗,又不影響玩家的操作體驗。
Radeon Chill功能設置在AMD驅動設置中,玩家需要依次點擊全局設置——全局WattMan——Chill,打開全局開關,之后便可以開啟Radeon Chill,只要你所玩的游戲支持該功能。在該功能發布之初,共有18款游戲支持該功能,但遺憾的是Radeon Chill目前只能支持DX9和DX11游戲,想要在DX12游戲中使用該功能還需要AMD后期的升級。
Radeon ReLive功能介紹
Radeon ReLive的主要功能是屏幕錄制,開啟后可以錄制高清流暢的游戲畫面,但對硬件性能的影響很小。官方測試在開啟錄制功能后,游戲幀數只下降3-4%,對于喜歡分享游戲畫面以及直播玩家來說該功能非常實用。通過一個易于訪問的游戲工具欄,玩家可以無縫播放ReLive錄制內容,并且快速方便地自定義設置,自定義場景布局等等。
Radeon FreeSync 2技術介紹
AMD于今年年初正式推出了FreeSync 2技術,不過它跟FreeSync相比并不是替代的關系,而是會與FreeSync并存,因為二者的技術出發點并不一樣。FreeSync的目的是消除游戲畫面撕裂、卡頓,保證流暢性,FreeSync 2則主要是加入了對HDR10渲染顯示的支持,可以讓普通顯示器也獲得HDR高清效果,而且支持在SDR/HDR兩種模式間自動切換。該技術可以讓顯示器獲得相比于sRGB色域超過2倍的亮度和色彩表現力,并且支持即插即用、低幀率補償,延遲還非常低。FreeSync 2同前一代相比增加了漸進式刷新率遞增功能,使得幀數率平滑增加或減少,提供更平滑的最終用戶體驗。
藍寶石RX 580超白金限量版拆解
由于我們測試使用的是藍寶石 RX 580 8G D5 超白金 OC 限量版這款顯卡,因此我們對這款卡進行了拆解。
顯卡風扇設計
藍寶石 RX 580 超白金 OC 限量版顯卡擁有兩枚9.5cm直徑的雙滾珠靜音軸承風扇,雙滾珠軸承有效減少運動時的磨損,靜音運行的同時使用壽命得到了大幅提升。重新設計的翼型葉片提升進風量同時有效降低風噪。第三代IFC風扇智能啟停技術,允許用戶自定義風扇啟停的溫度檔位,在全方位營造通風散熱環境的同時,還能找到散熱與噪音間的平衡點,適合DIY玩家們的入手。
可更換藍光LED風扇
藍寶石 RX 580 超白金 OC 限量版顯卡的風扇采用單螺絲固定的快拆設計,去掉一顆螺絲就能整個拆除,方便用戶對風扇進行單獨清洗維護。此次的限量版RX 580就附贈了兩枚藍光LED風扇,玩家可以根據自己的喜好更換風扇,讓你的顯卡更炫更有個性。
散熱模塊設計
藍寶石 RX 580 超白金 OC 限量版顯卡采用2根8mm熱管+2根6mm熱管,搭配大面積純銅底座和高密度散熱鰭片,為顯卡帶來良好的散熱效果。另外,顯存和供電的散熱整合到散熱模塊中,并附有導熱貼,為顯卡帶來全方位的散熱。
顯卡背板設計
藍寶石 RX 580 超白金 OC 限量版顯卡擁有一塊全金屬背板,背板不僅可以起到裝飾作用,更能有效保護PCB免受外力傷害。背板上的不規則形狀導氣孔可以有效排出熱量,搭配NITRO Free Flow定向導流技術,可有效減少顯卡積熱產生的高溫。
顯卡PCB設計
藍寶石 RX 580 超白金 OC 限量版顯卡采用比公版更長更大的PCB設計,面積更大的PCB可以容納更多電器元件。全新的超白金系列顯卡采用了效能更強的第四代黑鉆電感,擁有相比普通電感高25%的電磁轉換效率以及低10%的運行溫度。電感在線圈內部內置了散熱片,可有效的抑制高頻嘯叫。另外,搭配壽命高達16000小時的16K全固態黑金電容,給予顯卡更高的運行穩定性。
顯卡核心
藍寶石 RX 580 超白金 OC 限量版顯卡采用了14nm FinFET工藝打造,基于GCN4.0架構的Polaris 20核心,外觀看上去和Polaris 10一樣。
顯卡供電設計
藍寶石 RX 580 超白金 OC 限量版顯卡采用6+1相供電設計,可以為顯卡提供充足的電量,充足的電量供應是顯卡性能的保證,更是顯卡超頻實力的體現。
顯卡供電接口設計
考慮到高頻下穩定工作以及超頻的需要,藍寶石 RX 580 超白金 OC 限量版顯卡配備的是8+6pin供電,不同于公版的8pin設計,能夠為顯卡額外提供75w的電力,而且卡口朝向PCB背面,方便電源線插拔。
視頻接口設計
藍寶石 RX 580 超白金 OC 限量版顯卡為玩家提供2*DP+2*HDMI+DVI的全接口組合,能夠保證兼容目前市面上大部分顯示器的同時也能夠滿足需要多屏幕輸出的玩家的需求。另外,雙HDMI接口的設計也是考慮到了兼容目前正流行的VR設備,方便VR玩家使用。
BIOS切換開關
藍寶石 RX 580 超白金 OC 限量版顯卡擁有一個開關,用來在2組BIOS間自由切換,一邊是靜音模式(1411MHz),另一邊式游戲模式(1450MHz),滿足玩家的不同需求。
信仰燈呼吸效果示意圖
其他非公版產品賞析
藍寶石 RX 580 超白金 OC
藍寶石 RX 580 超白金 OC
藍寶石 RX 580 超白金 OC
XFX訊景 RX 580 8G 深紅
XFX訊景 RX 580 8G 深紅
XFX訊景 RX 580 8G 深紅
迪蘭 RX 580 Red Devil
迪蘭 RX 580 Red Devil
迪蘭 RX 580 Red Devil
迪蘭 RX 580 X-Serial
迪蘭 RX 580 X-Serial
迪蘭 RX 580 X-Serial
銘瑄 RX 580 JetStream 8G
銘瑄 RX 580 JetStream 8G
測試平臺環境一覽
為保證測試能夠發揮顯卡的最佳性能,本次測試平臺采用全新7代酷睿芯——Intel酷睿i7-7700K處理器、華碩Z270芯片組主板、阿斯加特DDR4-2133 32GB雙通道內存、安鈦克1000w鈦金電源組建而成。詳細硬件規格如下表所示:
測 試 平 臺 軟 硬 件 配 置 | ||
核心配件 | ||
CPU | Intel | 酷睿i7-7700K |
主板 | 華碩 | ROG MAXIMUS XI APEX |
核芯顯卡 | Intel | HD 630 |
內存 | 阿斯加特 | LEORICE DDR4-2133 32GB x2 |
硬盤 | 浦科特 | PX-512M6S+ |
電源 | 安鈦克 | HCP 白金版-1000 |
系統及驅動程序 | ||
操作系統 | Microsoft Windows 10 | |
主板驅動 | Intel芯片組驅動 | |
顯卡驅動 | NVIDIA GeForce Game Ready Driver(381.65 WHQL)AMD Radeon Software Crimson ReLive(17.10 Press Beta) | |
DirectX環境 | DirectX 12 | |
幀數監控 | Fraps 3.5.1 |
參測主板:華碩 ROG MAXIMUS IX APEX
參測N卡:微星 GTX 1060 GAMING X 6G
在測試成績方面,理論性能測試用得分來衡量性能,數值越高越好;游戲性能測試用游戲自帶Benchmark及游戲中平均幀數來衡量性能,數值同樣越高越好。
理論性能測試:3DMark FireStrike
首先進行的是用來衡量顯卡理論DX11性能的3DMark FireStrike測試,選擇模式為Extreme,對應的是2K分辨率,測試結果如下:
3DMark FSE GPU成績
在3DMark FireStrike Extreme測試中,RX 580表現不錯,得分超過頂級非公版GTX 1060約200分,超過RX 480約12%,性能提升較為明顯。接下來我們測試一下該卡的理論DX12性能,使用的是3DMark Time Spy,對應的同樣是2K分辨率,結果如下:
3DMark TS GPU成績
在3DMark Time Spy測試中,RX 580的GPU得分依舊稍稍超過GTX 1060,超過RX 480約10%。最后我們來測試一下顯卡的VR性能,使用的是SteamVR Performance Test,測試結果如下:
SteamVR保真度結果
在VR性能測試中,三款卡都達到了VR Ready的級別,但RX 580照比GTX 1060還是有一定的差距,保真度低了1.3,差不多是15%,而照比RX 480則是有著7%以上的提高。
綜上所述,RX 580的DX11和DX12性能均稍稍領先GTX 1060,但VR性能還是差了一些。同RX 480相比,RX 580的提升還是比較全面的,理論性能平均提升幅度為10%左右,符合以往升級版之于初版顯卡的提升水平。當然,理論性能只是一方面,接下來我們就進行重頭戲游戲測試,看看RX 580又會有著怎樣的表現。
DX12游戲性能測試
在游戲性能測試環節,我們選取了4款DX12游戲和4款DX11游戲進行測試,測試分辨率為1080p和2K。在測試中關閉垂直同步,選用適當的抗鋸齒和特效,用游戲內自帶benchmark或Fraps記錄下平均幀數,首先是DX12游戲的測試,結果如下:
《殺出重圍:人類分裂》幀數對比
在《殺出重圍:人類分裂》的測試中,RX 580技壓群雄,領先GTX 1060約13%,領先RX 480約10%(領先幅度結果為2個分辨率下領先幅度之和除以2得出的值)。
《殺手6》幀數對比
從《殺手6》的測試結果可以看出,RX 580繼續保持領先,領先GTX 1060約5%,領先RX 480約8%。該游戲此前一直對A卡優化較好,但后期對N卡也進行了全面的優化,AN卡可謂是優勢相當,再加上我們使用的是頂級非公版GTX 1060,這就導致RX 480稍稍落后于GTX 1060。
《古墓麗影:崛起》幀數對比
在《古墓麗影:崛起》的測試中,RX 580繼續領先,但領先對手的幅度有所縮減,領先GTX 1060約2%,領先RX 480約10%。
《戰錘:全面戰爭》幀數對比
最后是《戰錘:全面戰爭》的測試,測試中RX 580領先GTX 1060約6%,領先RX 480約4%,優勢不是很明顯。
總結一下,在DX12游戲測試中,RX 580在各項游戲中的表現都是最好的,領先GTX 1060約7%,領先RX 480約8%。如果說RX 480與GTX 1060比是各有千秋的話,RX 580則是毫無疑問的完勝,哪怕優勢體現在幀數上僅僅是2-3幀。
DX11游戲性能測試
測試完三款卡的DX12游戲性能,我們再來看一下它們在DX11游戲中的表現,最終測試結果如下:
《全境封鎖》幀數對比
首先是《全境封鎖》的游戲幀數對比,從結果可以看出,RX 580全面領先其余兩款顯卡,領先GTX 1060約6%,領先RX 480約10%。
《孤島驚魂:原始殺戮》幀數對比
接下來是《孤島驚魂:原始殺戮》的游戲幀數對比,從結果可以看出,RX 580終于出現了落后GTX 1060的情況,在1080p下落后后者約4%,但在2K下還是稍稍領先。此外,RX 580領先RX 480約11%,領先較為明顯。
《幽靈行動:荒野》幀數對比
《幽靈行動:荒野》是剛剛發布的硬件殺手級大作,所以我適當降低了特效,將特效設置為“高”。從結果可以看出,RX 580依舊領先,超過GTX 1060約2%,超過RX 480約8%。
《守望先鋒》幀數對比
最后是《守望先鋒》的幀數對比,我們可以看出,即使RX 580照比RX 480有了約8%的提升,其還是落后于GTX 1060,落后幅度約為6%。由于暴雪的游戲一向對N卡優化較好,所以RX 580落后GTX 1060也算是意料之內的事。
雙卡交火性能測試
測試過單卡后我們該來測試雙卡交火的性能了,大家都知道,A卡的交火效率一向很高,猶記得RX 480首發時其雙卡交火表現甚至可以在某些項目中勝過GTX 1080,所以這次吉吉我也是非常好奇兩塊RX 580能夠達到怎樣的效果。由于篇幅和時間所限,我們選擇的測試項目只是3DMark FireStrike以及3DMark Time Spy,測試結果如下圖:
3DMark FSE GPU分數為12656分
3DMark TS GPU分數為8590分
我們此次交火所用的兩塊卡分別是藍寶石 RX 580 超白金 OC 限量版以及XFX訊景 RX 580 深紅,兩者的核心頻率均為1450MHz。通過結果可以看出,RX 580 CF的FSE得分為RX 580單卡的1.93倍,TS得分為單卡的1.94倍,提升非常明顯。
RX 580雙卡交火性能對比
通過測試結果可以看出,RX 580 CF的成績僅僅落后GTX 1080 Ti約7.5%,但領先GTX 1080有20.5%!兩塊RX 580的價格不超過4000元,其性能與同等價位的GTX 1080比超出了20%,與價格5700元的GTX 1080 Ti比落后不到10%,可見單從理論性能看,RX 580的雙卡平臺是非常有性價比的。
顯卡功耗及溫度測試
溫度方面我們將繼續采用FurMark來進行測試,考慮到不同游戲之中,顯卡的負載率不同,尤其是低分辨率和高分辨率的負載率差異會讓顯卡的功耗完全無法測算平均數值。因此我們需要采用Furmark這樣的權威性烤機軟件,讓GPU芯片之中每一個運算單元完全滿載,充分發揮供電最大化的狀態才能得出準確的成績。
顯卡烤機溫度為76℃
滿載溫度方面我們是采用Furamrk拷機,讓顯卡達到滿載狀態,然后根據GPU-Z顯示的數值來測量溫度。我們將參數設定為1280*1024分辨率,開啟8*MSAA??緳C30分鐘以上,最終顯卡的滿載溫度為76℃,最終核心頻率穩定在1450MHz,未出現降頻狀況。
參測顯卡溫度對比
由于我們此次使用的三款卡均為非公版顯卡,因此烤機溫度僅供參考。從圖上可以看出,GTX 1060的表現最為良好,烤機溫度不過66℃,RX 480的溫度照比RX 580要低一些,雖然RX 580的散熱要強于RX 480,但RX 580的芯片發熱量遠大于RX 480,因此溫度還是要高一些的。
各卡功耗對比
待機功耗方面,所有參測顯卡所在平臺的功耗均在50w左右,這說明在空載狀態下,參測顯卡的耗電程度是差不多的;而滿載平臺功耗方面,由于TDP的不同,呈現出了明顯的差異。首先,RX 580、RX 480和GTX 1060的TDP分別為185W、150W和120W,測試結果顯示RX 580的功耗比RX 480高37W左右,比GTX 1060高63W左右,基本符合各卡對應的TDP差距值。
是時候升級你的顯卡了
通過上面的測試可以發現,RX 580的確是目前2000元左右游戲性能最強的顯卡,稍稍領先于對手家的GTX 1060,但領先幅度僅為5-7%左右。與第一代Polaris RX 480相比,其有著8-10%的性能提升,相當于提升了一個性能級,表現還是不錯的。從游戲幀數來看,RX 580已經可以在幾乎所有大作中做到1080p下特效全開,除了一些優化成問題的顯卡殺手級游戲,而且在2K分辨率下也可以達到45幀以上這樣一個較為流暢的幀數,因此對于那些喜愛單機游戲的普通玩家來說,一塊RX 580已經足夠滿足你的需求了。
2000元價位極致性能之選
不過我相信一定會有玩家吐槽,就10%左右的性能提升,我為什么要買RX 580?就這個問題我來簡單說明下:首先,RX 580的針對人群是那些還在使用GTX 960或R9 380這樣的老甜點卡的人,因為研究顯示,顯卡的生命周期為一年半,就以R9 380為例,其在2015年完全可以應付市面上大多數游戲,但換到今天,絕大多數游戲大作的入門要求都是RX 480或RX 470了,R9 380的性能顯然已經跟不上時代的腳步了。
有82%的GPU達不到VR Ready的需求
除此之外,從2016年開始,VR全面爆發,而VR Ready的入門需求就是RX 470或GTX 1060 3G,老一代的R9 380和GTX 960顯然達不到運行VR應用的最低要求,因此對于那些用著老甜點但還想使用VR設備的玩家來說,升級到RX 580是非常有必要的。再有就是新技術的使用,如4K實時串流、HDR、單線5K輸出等,這些都是全新的Polaris顯卡才具備的特性,要想體驗只能升級顯卡。
許多新特性只有新卡才能支持
優點顯而易見,但缺點也是不容忽視的,RX 580最大的缺點就是功耗太高,185W的TDP都快趕上NVIDIA旗艦級的GTX 1080了,但性能照比后者卻有著近50%的差距,那么為什么同樣是1x nm,N卡能做到頻率遠超A卡,TDP卻要小于后者?其實這正是由于工藝不同所導致的。NVIDIA除GTX 1050/1050 Ti外,使用的都是臺積電的16nm FinFET工藝,而AMD這邊由于訂不到貨,用的是三星的14nm FinFET。雖然三星的制程看似更低,但其14nm無論良率還是效能均不及臺積電的16nm工藝,其導致的結果就是Polaris家族的頻率一直沒能超過1.5GHz,但Pascal則可以自動超頻至近2GHz。
全新進化的Polaris家族
雖然TDP增長了35W,但好在各AIB廠商均對散熱進行了強化,因此溫度上并沒有高很多,甚至有的顯卡照比RX 480還有所降低,所以玩家在實際使用時并不會覺得很受影響。除了RX 580外,AMD還同時發布了RX 570、RX 560以及RX 550,前兩款顯卡不用多說,就是RX 470和RX 460 1024sp的升級版,而RX 550則是采用全新的Polaris小核心,流處理器數量為512個,面向網吧等入門級市場,其照比上代的R7 250有著2倍的性能提升,是入門級產品中的亮眼新秀。
專為玩家打造
從綜合指標來看,RX 580和GTX 1060是相當的,前者的優點是游戲性能稍強、價格稍低,缺點是功耗溫度較高、VR性能稍弱,后者則正好相反,因此兩者可以說是不相上下。正如我們前面說的,RX 580只是Vega發布前的預熱前菜,由于剛剛升級了架構和制程,AMD不可能在不到一年的時間里做到既能調教好Vega,又能讓RX 500照比RX 400有個大升級,所以RX 580誕生的最大意義就是取代性能上與GTX 1060相當的RX 480,哪怕只是比對手強了一點點,還是可以讓那些執著于性能,卻選擇困難的玩家們有個明確的目標,這也恰恰是AMD多年來的一貫作風。
*請認真填寫需求信息,我們會在24小時內與您取得聯系。