【Nvidia GTC China 2019】
📌 近期的英偉達 GTC 產品展示中,就能明顯看出他們的戰略已經朝向 AI 前進(此次硬體產品只有一項),並且努力打造一個生態鏈,做出差異化,讓與 Nvidia 合作的廠商,越來越難脫離 Nvidia 的服務!
而關於這個戰略方向,與文中提到的 CUDA,其實我在之前的文章就有提到,主要是針對三月那場 GPU 技術大會(GTC19)做介紹!
有興趣的都可以看這篇文章,我也有稍微分析當時的股價 👉 https://rayskyinvest.org.in/2019科技公司們所掌握的最新人工智慧技術有哪些NVIDIA
長久關注我的朋友就會知道,其實我是 AI 背景也熱衷於 AI 技術,因此撰寫的文章會從蠻多未來性的技術做分析,因此會提到不少專有名詞,但我會盡量用最淺顯易懂的方式去讓大家了解,並且解釋這些技術將會有哪些應用!
#Nvidia
#英偉達
#輝達
#STEVEN
-
如果與大家一起討論投資資訊,歡迎加入 eToro(e投睿) - 亞洲投資討論區(歐美股、大麻股、科技股、外匯、黃金、石油、區塊鏈、加密貨幣)
同時也有2部Youtube影片,追蹤數超過6萬的網紅大人的玩具,也在其Youtube影片中提到,跪求有空的朋友 為影片加上字幕(中文即可) 萬分感謝 https://www.youtube.com/timedtext_cs_panel?tab=2&c=UC1FmA48qj1YOYQ5I6j4l6YA 如果覺得我介紹的不錯,歡迎贊助我的開箱影片(Please support my video ...
「cuda介紹」的推薦目錄:
- 關於cuda介紹 在 雷司紀的小道投資 Facebook 的最佳解答
- 關於cuda介紹 在 原價屋coolpc Facebook 的最佳解答
- 關於cuda介紹 在 原價屋coolpc Facebook 的最讚貼文
- 關於cuda介紹 在 大人的玩具 Youtube 的最佳貼文
- 關於cuda介紹 在 Zer0br1ne Youtube 的最讚貼文
- 關於cuda介紹 在 [分享] CUDA 程式設計(4) -- 硬體規格簡介& 넠… 的評價
- 關於cuda介紹 在 CUDA学习笔记(一)之CUDA安装及GPU硬件介绍 - Darren 的評價
- 關於cuda介紹 在 NVIDIA 平行運算工具與使用技巧簡介 - YouTube 的評價
- 關於cuda介紹 在 [分享] CUDA 程式設計(1) -- 簡介 - Mo PTT 鄉公所 的評價
cuda介紹 在 原價屋coolpc Facebook 的最佳解答
【開箱】75W功耗,圖靈50群俠登場!MSI GTX1650 GAMING X 4G/VENTUS XS 4G新品上市。
http://www.coolpc.com.tw/phpBB2/viewtopic.php?f=71&t=258553
NVIDIA 圖靈GTX1650最低階上市啦!還記得先前替大家介紹過的GTX1660Ti/1660系列顯示卡嗎?沒有RT和TENSOR Core,擁有12奈米圖靈架構以及Adaptive Shading渲染技術、更低功耗,並在拉高效能的同時還能夠維持低耗電量的表現,看的出來圖靈全新GTX16系列顯示卡非常的厲害!今天原價屋要帶來微星的GTX1650 GAMING X 4G以及GTX1650 VENTUS XS 4G OC顯卡,採用全新圖靈架構設計,擁有896 CUDA Cores、4GB 128bit GDDR5記憶體...#原價屋開箱
cuda介紹 在 原價屋coolpc Facebook 的最讚貼文
【#原價屋開箱】讓你看清一筆一畫!Quadro P620 專業繪圖卡新登場。
http://www.coolpc.com.tw/phpBB2/viewtopic.php?f=71&t=248399
先前開箱介紹過的Nvidia Quadro Pascal系列繪圖顯示卡,這回帶來亞太地區授權通路麗臺科技所推出,Pascal架構的Quadro P620入門階級繪圖顯示卡,搭載512個CUDA 平行運算核心、2GB GDDR5記憶體、記憶體頻寬最高可達80GB/s、1.386Tlops FP32單精度運算效能、4個Mini-DisplayPort 1.4插槽、支援4個4K和5K螢幕輸出,剛踏入設計這塊的人可能會有疑問,一般遊戲卡也能拿來繪圖使用,為什麼還需要繪圖卡呢?....
cuda介紹 在 大人的玩具 Youtube 的最佳貼文
跪求有空的朋友
為影片加上字幕(中文即可)
萬分感謝
https://www.youtube.com/timedtext_cs_panel?tab=2&c=UC1FmA48qj1YOYQ5I6j4l6YA
如果覺得我介紹的不錯,歡迎贊助我的開箱影片(Please support my video Channel) PayPal : jkc1974@gmail.com
開箱介紹:Nintendo Switch 遊戲機 ニンテンドースイッチ~ by 大人的玩具
賣場
http://class.ruten.com.tw/user/index00.php?s=18xtoys
FB
https://www.facebook.com/18Xtoys
任天堂Switch(日語:ニンテンドースイッチ,英語:Nintendo Switch)是任天堂出品的電子遊戲機,於2017年3月3日在日本、北美、歐洲和香港發售,同年12月1日在韓國與台灣發售。擁有可拆卸控制器和可分離式主機,遊戲載體使用了專用卡匣。主機處理器使用了NVIDIA客制的Tegra X1系統晶片,這是任天堂首次採用NVIDIA的系統晶片。[2]開發期中的主機於2015年3月17日以「NX」代號首次公布,在2016年10月20日首次於網路影片上公開正式名稱任天堂Switch和其造型。[4]
目錄 [隱藏]
1 硬體
1.1 主機和底座
1.2 手柄
1.3 硬體規格
2 軟體
2.1 系統
2.1.1 任天堂Switch線上服務
2.1.2 任天堂eShop
2.2 遊戲
3 沿革
4 評價
4.1 發售前
4.2 發售後
4.3 商業評論
4.4 銷售成績
5 事件
5.1 正式發表會前
5.1.1 假任天堂Switch惡搞事件
5.2 正式發售前
5.2.1 「任哥吉拉」事件
5.2.2 主機提前洩漏事件
5.2.3 Joy-Con失去與主機本體連接
5.3 正式發售後
5.3.1 卡匣「口感」
5.3.2 左Joy-Con感應不良問題
5.3.3 任天堂對產能致歉
6 法律糾紛
7 參考資料
8 外部連結
硬體
主機和底座
任天堂Switch主機、底座和Joy-Con手柄控制器
任天堂Switch混合了家用主機和便攜式遊戲機的概念,主體為一個類似平板電腦的裝置,採用了JDI生產的6.2英吋的多觸點顯示屏,解析度為1280x720像素;像素密度為236.87ppi。[5][6]內置32GB儲存空間,並支援Micro SD(SDHC、SDXC)儲存卡作為擴充。採用了USB Type-C型介面作為充電介面,可直接插上充電器充電,也可以放入底座內充電;此外該介面也負責主機與底座之間的畫面、聲音的資料傳輸。主機內置了一個主動散熱風扇和導熱管,目的是使處理器不會因為過熱降低效能,其出風口在主機上方。[7]
任天堂Switch的底座(Switch Dock)可以透過HDMI輸出1920x1080像素的畫面;底座還可以為Switch主機充電;底座上還有3個USB介面(2個USB2.0、1個USB3.0),但目前官方沒有給出用途範例;根據一些媒體的測試,用戶可以透過底座的USB介面連線鍵盤等硬體外設。[8]
手柄
任天堂Switch主機(上)與左右分開的Joy-Con控制器(下)
任天堂Switch的遊戲手柄「Joy-Con」是兩個採用了可分離式設計的手柄,可插在主機主體兩側以類似Game Boy Advance的形態進行遊戲,也可從主體上拆下後獨立作為兩個控制器進行雙人遊戲,還可以裝到外設「Joy-Con Grip」上合成一個傳統樣式的手柄控制器。[9][10][11][12]隨主機附贈的「Joy-Con Grip」沒有為Joy-Con手柄充電的功能,而單獨銷售的「Joy-Con Grip」則包含有為手柄充電的功能。[13]左右兩個Joy-Con手柄都內建了體感控制功能,並且還配備了被稱為「HD振動」的振動反饋裝置,可以給予玩家更細膩的反饋。此外,左側的Joy-Con手柄上包括了一個螢幕擷取按鍵,在發售時只能用於螢幕截圖,更新系統4.0.0後新增視訊錄製功能;右側的Joy-Con手柄中內建了讀取amiibo玩偶的NFC晶片和被稱為「IR Camera」的紅外線傳感器。[14][15]值得一提的是Joy-Con手柄是任天堂自FC遊戲機以來首次取消傳統的十字鍵,改為任天堂Game & Watch最初的分離式方向鍵。[16]
任天堂Switch Pro Controller
除主機附帶的Joy-Con外,玩家還可另購任天堂Switch Pro手柄。Pro手柄還是繼續使用傳統的十字鍵,不過相較於Wii U的手柄,它在鍵位上也有一定變化,最明顯的是右搖杆和ABXY按鍵位置對調,向Xbox系列手柄的按鍵布局靠攏。[17][18]該手柄為任天堂Switch專用,無法在其他任天堂家用遊戲機上使用。此外,Pro手柄右搖杆的主機板處還刻有隱藏的文字以感謝玩家。[19]
硬體規格
任天堂Switch的處理器使用了NVIDIA客制的Tegra X1系統晶片及其內建的GeForce顯卡,這是任天堂首次採用NVIDIA的處理器和顯卡。此前任天堂的家用主機從任天堂GameCube到Wii U都採用了IBM的處理器以及ATI和AMD顯卡。[2]根據遊戲媒體的評測,任天堂Switch使用的Tegra X1處理器為20奈米製造工藝,有4核心ARM Cortex-A57架構中央處理器以及4顆ARM Cortex-A53架構處理核心;[20]圖形處理器採用了基於Maxwell微架構的256核心CUDA,圖形處理器會根據主機處於便攜狀態或插入底座的不同情況進行差異化運算,在便攜狀態下運算頻率為307.2MHz,而插入底座後會提升至768MHz到921MHz。[21][22]主機記憶體為4GB LPDDR4。[23]
任天堂Switch主機的內建儲存空間為32GB,可使用microSD進行擴充,最高支援microSDXC標準,最大支援2TB容量;[24]主機在初始系統1.0.0時只能支援到microSDHC標準,發售同日提供的系統2.0.0更新使其可支援microSDXC標準。[25]
任天堂Switch的遊戲載體採用了任天堂掌上遊戲機系列上一直使用的卡匣而非自任天堂GameCube以來家用主機一直使用的光碟;值得一提的是,為了防止嬰幼兒誤吞卡匣,任天堂在生產卡匣時加入了無毒的苦味劑苯甲地那銨。[26]任天堂Switch繼續支援自家的有近場通訊的玩偶Amiibo。[27]任天堂Switch主機本體內建了4310mAh的鋰電池,但電池不可更換;而根據遊戲的不同,主機續航時間從2.5小時至6小時不等,例如玩《薩爾達傳說 曠野之息》電量最多能持續3小時。[28]
軟體
系統
主條目:任天堂Switch系統軟體
作業系統基於FreeBSD。[29]在任天堂Switch的系統框架中,任天堂隱藏了一個紅白機遊戲《高爾夫》,遊戲可以透過Joy-con操控。根據媒體和玩家分析,該彩蛋是為了向已故的前任社長岩田聰致敬,他是《高爾夫》唯一一名程式設計師。[30]此外任天堂Switch不會再支援Wii U和任天堂3DS上的遊戲社群交流網路服務「Miiverse」;而任天堂3DS系列機型上獨特的「擦肩通訊」功能也不會出現在任天堂Switch上。[31][32]
任天堂Switch線上服務
主條目:任天堂Switch線上服務
任天堂Switch採用叫做「Nintendo Switch Online Services」的新網路服務。2017年3月3日發售時為免費服務,計劃於2018年開始進行收費。屆時只有付費用戶可以透過任天堂Switch線上服務進行網路連線遊戲和語音聊天,獲得每月免費Virtual Console遊戲和限定優惠折扣,此外亦有免費用戶也可使用的基礎功能。這種線上服務有點類似於微軟推出的Xbox Live。[33][34]
任天堂eShop
主條目:任天堂eShop
在任天堂eShop所下載的任天堂Switch遊戲將不會綁定主機,而是綁定帳號,放棄了長久以來任天堂將遊戲綁定主機的政策。[35]玩家可任意修改自己的任天堂帳號所在國家或於同一台主機上登陸多個不同國家的任天堂帳號,來方便地購入只在其他國家發行的遊戲,或是選擇在價格最低廉的國家購入遊戲。這一政策在方便玩家的同時,亦被認為會一定程度上影響當地發行商的利益。截至2017年10月,南非與墨西哥等國eShop因有多個遊戲價格較其他國家eShop低廉而受到玩家關注。
遊戲
主條目:任天堂Switch遊戲列表和暢銷任天堂Switch遊戲列表
任天堂Switch並不是Wii U和任天堂3DS的後續機種,所以不會相容任天堂之前推出的Wii U或任天堂3DS上的遊戲,這結束了任天堂自Wii以來的家用主機可以相容上世代主機遊戲的歷史,也是任天堂首次在可攜式遊戲機上停止相容上一世代型號的遊戲。[36]同時任天堂Switch也是任天堂自FC遊戲機以來首個取消遊戲軟體鎖區的家用主機,也是繼任天堂DS後任天堂再次在可攜式遊戲機上沒有鎖區。[37]
第一款確認在製作的任天堂Switch遊戲是史克威爾艾尼克斯的《勇者鬥惡龍XI 追尋逝去的時光》,遊戲在2015年7月28日正式公布,並稱將計劃登陸當時還被稱作NX的任天堂Switch。[38]而任天堂本社第一款確認登陸新主機的遊戲是《薩爾達傳說 曠野之息》,遊戲原先是Wii U平台獨占。[39]在任天堂Switch正式公布後,育碧宣布旗下的《舞力全開2017》將會登陸任天堂Switch。[40]任天堂Switch的首部宣傳片中出現了《上古卷軸V:無界天際》的畫面,貝塞斯達表示很樂於與任天堂展開合作,但當時公司還沒有確認哪款作品會登陸任天堂Switch,直到2017年1月13日的發表會才正式確認該遊戲會在2017年秋季發售,這也是貝塞斯達首次在任天堂硬體平台上製作遊戲。[41][42]而SEGA也確定將在2017年發售開發代號為「Project Sonic 2017」的《音速小子》系列新作也將會登陸任天堂Switch。[43]2017年5月,卡普空宣布《魔物獵人XX》正式登陸任天堂Switch平台。該作可幾乎完整繼承3DS版的存檔。除了任天堂Switch版玩家可面連/網連之外,不同平台玩家也可以透過網連一同合作狩獵。[44][45]

cuda介紹 在 Zer0br1ne Youtube 的最讚貼文
● [Let's play!] Minecraft: Home Base Server 系列 #2 - Home in Home Base
遲來的第二集~
介紹下我間冇咩人知既屋先~~
下一集~ 又係礦洞歷險~
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Follow me!
● Facebook Page: http://facebook.com/Zer0br1ne
● instagram: http://instagram.com/zhitsun
● Twitter: http://twitter.com/ShitSunL
● Twitch: http://twitch.tv/zer0br1ne
● RaidCall: 10202562
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
● 成員名單:
【Home Base 家庭成員名單】
Garson: http://youtube.com/GarsonGV
永樂 : http://youtube.com/TheOneLockChannel
嘉寶: http://youtube.com/c0810891
黑仔: http://youtube.com/Ph0enixB1ack
企鵝: http://youtube.com/PenguinK1A
TD Tsun: http://youtube.com/tdtsun
翼 WingsThunder: http://youtube.com/wingsthunder
水母JellyFish: http://youtube.com/jellyfish01486
承 Seng: http://youtube.com/deepseakseng
亓子 KitsKKO: http://youtube.com/KitsKKGameLife
水月歌: http://youtube.com/adayiu0v0
易拉架 Elijah: http://youtube.com/immortalobjects
Kason: http://youtube.com/kason1995
茶壺: http://youtube.com/jackdontlie
Zer0br1ne: http://youtube.com/johnXzer0
● Credit:
● Music:
● Production music courtesy of Epidemic Sound
タカオマサキさん - うきうきピアノジングル01
● 本人並不擁有任何音樂版權, 並無意侵害任何版權
● for entertainment purposes only, no copyright infringement is intended

cuda介紹 在 CUDA学习笔记(一)之CUDA安装及GPU硬件介绍 - Darren 的推薦與評價
一、CUDA安装与环境配置. ... CUDA学习笔记(一)之CUDA安装及GPU硬件介绍 ... thread:一个CUDA的并行程序会被以许多个threads来执行。 ... <看更多>
cuda介紹 在 NVIDIA 平行運算工具與使用技巧簡介 - YouTube 的推薦與評價

本次影片將 介紹 #平行程式的工具與使用技巧,讓專案在#多節點與#多GPU 下效能暴增,加快AI 專案開發與部署。深入瞭解GPU 程式加快HPC 研究 ... ... <看更多>
cuda介紹 在 [分享] CUDA 程式設計(4) -- 硬體規格簡介& 넠… 的推薦與評價
※ [本文轉錄自 VideoCard 看板]
作者: a5000ml (咖啡裡的海洋藍) 看板: VideoCard
標題: [分享] CUDA 程式設計(4) -- 硬體規格簡介 & 採購參考
時間: Wed Oct 8 22:57:51 2008
這禮拜把安裝和硬體規格介紹完, 下禮拜就要開始進入 CUDA 程式了 ^^,
如果有什麼需要幫忙, 歡迎寫信給我.
※ 第四章 硬體規格簡介
這單元中簡介硬體規格, 做為採購上的參考, 最後在附錄列出目前市面上常見的規格.
NV 的 GPGPU 主要以計算能力版本(Compute Capability), 做為硬體和軟體上的規範,
形成不同世代的區隔, 而實際產品上, 影響最大「理論效能」的因素來自
(1) 多處理器數目 (MP, multiprocessors)
(2) 處理器時脈 (PC, Processor Clocks)
除此之外, 記憶體的差異往往影響了「實際效能」, 太差的記憶體頻寬可能導至「實際
效能」甚至不到「理論效能」的 5%, 這些都是採購上要注意的事項。
◆ 多處理器 (MP, Multiprocessors)
GPGPU 是以「多處理器」 為群組, 每個多處理器有 8 個單精確浮點數的「串流處理器」
(SP, Stream Processor) 負責運算, 這些串流處理器就是我們平常說的「核心」.
所以像 GTX 280 有 30 個 MP, 裡面就有 30 x 8 = 240 個 SP 核心, 在不切換執行緒的
情況下, 可以同時處理 240 個單精確的運算.
而在 Compute 版本 1.3 之後每個多處理器裡面又塞入 1 個雙精確浮點數的處理器,
稱為 (DP, Double precision stream Processor). 所以 GTX 280 有 30 個 DP 核心.
◆ 計算能力版本 (Compute Capability)
表示 GPGPU 的計算能力, 包含暫存器個數, 內部記憶體大小, 指令支援, 網格和區塊
大小等各式規範, 具有向下相容性, 到目前為止發展到 1.3 版, 其摘要如下:
Compute 1.0
每個 MP (多處理器)的 32 位元暫存器為 8,192 個。
每個 MP 的共享記憶體為 16 KB, 分散成 16 個 bank 存取。
總共的常數記憶體大小為 64 KB。
每個網格最多的區塊數目為 65,535 個 (max gridDim)。
每個區塊最多的執行緒數目為 512 個 (max blockDim)。
dim3 blockDim 的各維度上限為 (512,512,64)
每個 MP 的 texture 快取為 6~8 KB。
每個 MP 的常數記憶體快取為 8 KB。
執行纜 warp 大小為 32 個執行緒。
每個 MP 有 8 個 SP, 可以在 4 個 clocks 之內執行完一個 warp。
每個 MP 最大的進行中區塊數目為 8 (active blocks)。
每個 MP 最大的進行中執行纜數目為 24 (active warps)。
每個 MP 最大的進行中執行緒數目為 768 (active threads, 24x32)。
(其它關於 texture 細節...)
Compute 1.1
在顯示卡記憶體上支援 32-bit 的 atomic 整數運算。
Compute 1.2
在顯示卡記憶體上和共享記憶體上支援 64 bits 的 atomic 整數運算。
MP 的 32 位元暫存器增為 16,384 個。
支援 warp vote 指令。
Compute 1.3
支援雙精確浮點數的運算。
◆ 運算效能估計
運算效能一般採用「每秒能執行的浮點運算次數」GFlops (Giga float operations per
seconds)來衡量, NV 的 GPGPU 最大效能可用下面公式估計:
單精確倍數 (增速因子為 3, 每個多處理器有 8 個單精確的串流處理器)
GFlops = 多處理器數目 x 8 x 3 x 處理器頻率(GHz)
(其中 3 是因為管線化因素所造成的「增速因子」)
範例
GTX 280 30 x 8 x 3 x 1.296 = 933 (GFlops)
8800 Ultra 16 x 8 x 3 x 1.500 = 576 (GFlops)
9600 GT 8 x 8 x 3 x 1.625 = 312 (GFlops)
Tesla S1070 30 x 8 x 3 x 1.440 = 1037 (GFlops/GPU)
雙精確倍數 (增速因子為 2, 每個多處理器只有 1 個雙精確的串流處理器)
GFlops = 多處理器數目 x 1 x 2 x 處理器頻率(GHz)
(只有 compute 1.3 的版本才有雙精確倍數)
範例
GTX 280 30 x 1 x 2 x 1.296 = 77.8 (GFlops)
Tesla S1070 30 x 1 x 2 x 1.440 = 86.4 (GFlops/GPU)
一般來說, 這種最大效能是達不到的, 因為我們還需要從記憶體中載入或儲存資料,
位址轉換和執行緒定位計算, 條件分支指令, 各執行緒之間同步和交換資料, 以及
內部記憶體競爭問題, GPU 做的工作並非單純直線型地只做浮點運算而己, 通常
達到最大效能的 1/3 或 1/4, 就已經很驚人了。
◆ 記憶體頻寬估計
記憶體頻寬通常用每秒傳輸的資料量來衡量 GB/s (giga-bytes per seconds),
其最大頻寬, 可用下面公式估計
記憶體頻寬(GB/s) = 記憶體介面寬度(bits) x 記憶體時脈頻率(GHz) / 8 x 2
其中 /8 是因為 1 個 byte 有 8 個 bits。
x2 是因為雙通道。
範例
GTX 280 512 x 1.107 / 8 x 2 = 141.7 (GB/s)
8800 Ultra 384 x 1.080 / 8 x 2 = 103.7 (GB/s)
8800M GTX 256 x 0.800 / 8 x 2 = 51.2 (GB/s)
通常在工程或科學計算上 GPGPU 的運算效能會受限於記憶體頻寬, 拿 GTX 280 做例子,
它每秒可計算 933G 個單精確浮點數, 而僅能載入 35.4G 個單精確浮點數 (每個單精確
浮點數佔用 4 bytes, 所以 141.7/4=35.4 ), 平均每個浮點數要計算 26.3 次才能用盡
GPGPU 的運算資源 (933G/35.4G=26.3), 這還沒有算輸出呢, 因為輸出也佔記憶體頻寬,
若考慮進來, 每個載入的浮點數起碼要計算 30~50 次才能用盡運算資源, 這樣的要求
有點過高, 為什麼呢?舉常見的向量內積為例, 它需要謮取 2 條向量, 輸出一個數字,
只有輸出一個浮點數不佔頻寬, 而兩條向量要佔兩倍頻寬, 所以用盡運算資源的要求是
每個浮點數載入要進行 52.6 次運算 (933G/(35.4G/2)=52.6), 然而向量中每個元素只
做一個乘法, 然後再做一個加法而己, 單元運算次數為 2, 所以最優的實際運算效能
僅能達 GPGPU 最大運算能力的 2/52.6 = 3.8%, 也就是 933 x 3.8% = 35.5 GFlops.
這就是記憶體頻寬對實際運算效能產生的限制, 事實上還有其它的限制, 包括記憶庫衝突
(bank conflict)等, 使得實際效能還會再下降。 ps.這裡指的載入是顯示卡記憶體到
GPGPU 的暫存器或晶片內部的快速記憶體(快取或共享記憶體之類)。
※名詞解釋
(1) 暫存器 (register) 處理器中存放變數的地方, 大多數指令皆是以此為單元進行操作,
其速度為所有記憶單元中最快, 可視為近乎零延遲。GPGPU 中的暫存器
數量超多, 屬於 RISC 架構。
(2) 共享記憶體 (shared memory) 多處理機時, 會有一塊所有處理機都看得到的記憶體,
稱為共享記憶體, 用來共享或交換資料用, 交換資料時必需要同步所有
處理機, 避免因先後序不可預期而導至資料存取錯誤。
(3) 精簡指令集電腦 (RISC, Reduced Instruction Set Computer), 將指令集精簡,
記憶體存取上採用簡單的 load/save 指令來橋接, 其優點有指令平行
執行度更好, 製造上更容易, 並且可以放入更多的暫存器和快取,
提昇系統效能, 相對者為 CISC。
(4) 複雜指令集電腦 (CISC, Complex Instruction Set Computer), 傳統的電腦設計,
需要什麼功能就加什麼指令, 並且容許運算元是記憶體, 缺乏指令的
正交性, 指令平行化不易, 造成晶片面積浪費, 效能不易提昇, 以前
的 Intel x86 CPU 就是一例, 但現今的 Intel CPU 已採用微指令,
將核心改為 RISC 架構.
(5) 單精確浮點數 (single precision float) 使用 4 個 byte 來記錄一個浮點數的
規範, 在 C 語言裡面的型別是 float。
(6) 雙精確浮點數 (double precision float) 使用 8 個 byte 來記錄一個浮點數的
規範, 在 C 語言裡面的型別是 double。
(7) 雙通道 (dual channel) 利用兩個互補的記憶體控制器,讓溝晶片與記憶體模組
之間的頻寬變成兩倍的技術。
(8) 記憶體介面寬度 (Memory Interface Width) 記憶體匯流排屬於並列式傳輸, 一次
可以同時存取到的 bit 數稱為介面寬度。
(9) 記憶庫 (Memory bank) 將記憶體分散成數個獨立的群組儲存, 並可借由多個獨立
的記憶體控制器來提昇整體的頻寬。
(10) 記憶庫衝突 (bank conflict) 當同時要存取的資料位於同一記憶庫, 稱為記憶庫
衝突, 此時就要排隊等待而造成延遲.
※附錄:規格表
項目標記
MP. 多處理器數目 Number of Multiprocessors
Comp. 計算能力版本 Compute Capability
Mem. 記憶體大小 Memory Size
PC. 處理器時脈頻率 Processing Clocks
MC. 記憶體時脈頻率 Memory Clocks
MI. 記憶體介面寬度 Memory Interface Width
MB. 記憶體頻寬 Memory Bandwidth
顯示卡系列
------------------------------------------------------------------------------
GeForce MP. Comp. Mem(MB) PC(MHz) MC(MHz) MI(bit) MB(GB/s)
------------------------------------------------------------------------------
GTX 280 30 1.3 1024 1296 1107 512 141.7
GTX 260 24 1.3 896 1242 999 448 111.9
------------------------------------------------------------------------------
9800 GX2 16x2 1.1 512x2 1500 1000 256 64.0
9800 GTX 16 1.1 512 1688 1100 256 70.4
9800 GT 14 1.1 512 1500 900 256 57.6
9600 GSO 12 1.1 384 1375 800 192 38.4
9600 GT 8 1.1 512 1625 900 256 57.6
9500 GT 4 1.1 256/512 1400 800 128 25.6
------------------------------------------------------------------------------
8800 Ultra 16 1.0 768 1500 1080 384 103.7
8800 GTX 16 1.0 768 1350 900 384 86.4
8800 GTS 12 1.0 640/320 1200 800 320 64.0
8800 GT 14 1.1 512 1500 900 256 57.6
8800 GS 12 1.1 384 1375 800 192 38.4
8600 GTS 4 1.1 256 1450 1000 128 32.0
8600 GT 4 1.1 256 1190 700 128 22.4
8500 GT 2 1.1 256 900 400 128 12.8
8400 GS 2 1.1 256 900 400 64 6.4
------------------------------------------------------------------------------
8800M GTX 12 1.1 512 1250 800 256 51.2
8800M GTS 8 1.1 512 1250 800 256 51.2
8700M GT 4 1.1 512 1250 800 128 25.6
8600M GT 4 1.1 512 950 700 128 22.4
8600M GS 2 1.1 512 1200 700 128 22.4
8400M GT 2 1.1 512 900 600 128 19.2
8400M GS 2 1.1 256 800 600 64 9.6
8400M G 1 1.1 256 800 600 64 9.6
------------------------------------------------------------------------------
高速運算工作站系列
------------------------------------------------------------------------------
Tesla MP. Comp. Mem PC(MHz) MC(MHz) MI(bit) MB(GB/s)
------------------------------------------------------------------------------
S1070 30x4 1.3 4Gx4 1440 800 512 102.0
C1060 30 1.3 4G 1296 800 512 102.0
S870 16x4 1.0 1.5Gx4 1350 800 384 76.8
D870 16x2 1.0 1.5Gx2 1350 800 384 76.8
C870 16 1.0 1.5G 1350 800 384 76.8
------------------------------------------------------------------------------
Workstation 顯示卡系列
------------------------------------------------------------------------------
Quadro MP. Comp. Mem(MB) PC(MHz) MC(MHz) MI(bit) MB(GB/s)
------------------------------------------------------------------------------
Plex 1000 S4 16x4 1.0
Plex 1000 IV 16x2 1.0 1.5Gx2
------------------------------------------------------------------------------
FX 5600 16 1.0 1.5G 800 384 76.8
FX 4600 12 1.0 768 700 384 67.2
FX 3700 14 1.1 512 800 256 51.2
FX 1700 4 1.1
FX 570 4 1.1
FX 370 2 1.1
NVS 290 2 1.1
------------------------------------------------------------------------------
FX 3600M 12 1.1
FX 1600M 4 1.1 512 800 128 25.6
FX 770M 4 1.1 512 800 128 25.6
FX 570M 4 1.1 256 700 128 22.4
FX 360M 2 1.1 256 600 64 9.6
FX 370M 1 1.1 256 600 64 9.6
NVS 140M 2 1.1
NVS 135M 2 1.1
NVS 130M 1 1.1
------------------------------------------------------------------------------
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.45.212.85
※ 編輯: a5000ml 來自: 114.45.212.85 (10/08 23:20)
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.45.209.219
... <看更多>