[Ph�n t�ch] Kiến tr�c đồ hoạ của card GeForce GTX 680

Romano · 03-27-2012

Cuối th�ng 3 l� giai đoạn thế giới chuyển qua cung Bạch Dương (Aries), cung ho�ng đạo ti�n phong trong 12 cung. Th�ng 3 năm nay, giới c�ng nghệ phần cứng chứng kiến sự xuất hiện của card đồ hoạ GTX 680 từ NVIDIA. Cũng như cung Bạch Dương, GTX 680 đ�nh dấu một bước tiến mới về năng lực đồ hoạ d�nh cho game. Nhưng điều g� l�m n�n sức mạnh đấy? Ch�ng ta sẽ t�m hiểu ở b�i ph�n t�ch sau.

Với h�ng t� kết quả benchmark từ nhiều site phần cứng tr�n thế giới, kh�ng c� g� để nghi ngờ năng lực gaming dẫn đầu của GTX 680. Dĩ nhi�n vẫn c� một số trường hợp GTX 680 k�m hơn HD 7970, song số lượng ấy kh�ng đ�ng kể. GTX 680 l� trường hợp đặc biệt sau nhiều năm, c�c testlab ho�n to�n c� đủ tự tin để n�i rằng : "h�y mua n� nếu bạn muốn chiếc card đơn nh�n mạnh nhất hiện nay". Hai chi tiết thuyết phục kh�c : gi� đề nghị của GTX 680 hiện thấp hơn 50 USD so với HD 7970 v� chiếc GeForce d�ng �t điện hơn đối thủ Radeon !

Nhưng l�m sao một con chip đồ hoạ (GPU) với 3,54 tỷ transistor (GTX 680) lại c� thể tốt hơn con chip 4,31 tỷ trans (HD 7970) ? V� l�m sao con chip 3,54 tỷ trans n�y lại mạnh gấp 1,5 lần con chip 3 tỷ trans (GTX 580) cũng của ch�nh NVIDIA ? L�m sao NVIDIA c� thể "nh�t" 1536 nh�n đồ hoạ (SP / CUDA Core) v�o 3,54 tỷ trans trong khi "chỉ được" 512 SP v�o 3 tỷ trans ? C�u trả lời : Kiến tr�c!

Điểm lại kiến tr�c Ferm

C�c fan của AMD v� NVIDIA hẳn kh�ng lạ với c�i t�n Fermi. Đấy l� kiến tr�c đồ hoạ của d�ng card GeForce 400 & 500. Tuy vậy, kiến tr�c Fermi thực ra c� 2 phi�n bản : Fermi GF100 (hoặc GF110) v� Fermi GF104 (hoặc GF114). Kh�c biệt ? Ở Fermi GF100, một SM c� 32 SP. Ở Fermi GF104, một SM c� 48 SP. Điều n�y c� nghĩa "mật độ" SP tr�n GF104 cao hơn so với GF100. Hay n�i c�ch kh�c, một SM GF104 c� thể xử l� được nhiều luồng dữ liệu hơn so với một SM GF100 tại c�ng mức xung.

Sơ đồ khối của GF114.

Nhưng bạn đặt c�u hỏi : tại sao NVIDIA kh�ng thiết kế SM của GF100 cũng nhiều SP như của GF104 ? Kh�c nhau để l�m g� ? Trả lời : v� GF104 để nhắm v�o game, c�n GF100 nhắm v�o GPGPU / HPC. GPGPU / HPC l� c�c ứng dụng khai th�c GPU để thực hiện t�nh to�n thay cho CPU, v� dụ như c�c si�u m�y t�nh (SC). Top 10 SC hiện nay c� 3 hệ thống (thứ 2, thứ 4 v� thứ 5) hiện đang d�ng GPU của NVIDIA. Trong đ� 2 hệ thống đứng thứ 2 v� thứ 4 d�ng chip GF100 (C2050). Danh s�ch c�c card Tesla (cho HPC) của NVIDIA hiện kh�ng c� model n�o d�ng chip GF104.

Tuy vậy, GF104 lại l� con chip kh� mạnh phổ biến trong d�ng card GeForce (cho game) hiện tại của NVIDIA.

SP nhiều gấp 4, hiệu năng gấp đ�i

Ở b�i preview trước, t�i c� đề cập vấn đề số SP của GTX 680 (hay GK104) gấp 3 lần GTX 580 (GF110) hoặc 4 lần GTX 560 Ti (GF114) nhưng hiệu năng chỉ gấp 1,5 lần GTX 580 hoặc 2 lần GTX 560 Ti. V� sao c� điều "kỳ lạ" n�y ? Đấy l� chưa t�nh xung nhịp của GTX 680 l�n đến 1 GHz c�n GTX 580 chỉ c� 772 MHz v� GTX 560 Ti l� 822 MHz !

Vấn đề nằm ở chỗ : NVIDIA đ� thực hiện một thay đổi c� thể xem l� đ�ng kể nhất từ GeForce 8000 : loại bỏ xung shader. Thực ra, kh�ng hẳn "bỏ", m� xung shader của GK104 l�c n�y bằng đ�ng xung GPU. Nếu bạn lật lại những thế hệ card GeForce trước đ�y của NVIDIA, bạn sẽ thấy xung shader từ GeForce 8000 lu�n cao hơn rất nhiều so với xung GPU. Đặc biệt với thế hệ Fermi, xung shader lu�n gấp đ�i xung GPU. C� nghĩa nếu GTX 580 c� xung GPU 772 MHz th� c�c shader của n� lại đang chạy ở mức 1.544 MHz ! Rất cao phải kh�ng n�o?

Cấu tạo SMX của GK104.

Do vậy, mặc d� GK104 c� đến 1536 SP, gấp 4 lần con số 384 SP của GF114, nhưng hiệu năng của n� chỉ gấp đ�i con chip n�y (v� xung shader GK104 bằng xung GPU, c�n xung shader GF114 gấp đ�i xung GPU). V� điều n�y cũng g�p phần giải th�ch tại sao card NVIDIA vốn c� �t SP hơn card AMD : v� xung shader b�n AMD cũng bằng xung GPU.

Đến đ�y, bạn đang tự hỏi : tại sao NVIDIA phải l�m như thế ? Phải chăng NVIDIA đang "tiến l�i" ? "Nhồi" �t SP hơn th� đỡ tốn silicon / transistor hơn chứ ? V� lời giải đ�p c� thể sẽ khiến bạn bất ngờ ...

Nhiều SP hơn nhưng die nhỏ hơn

Bạn đang đọc nhầm? Kh�ng! Bạn đọc đ�ng từng chữ đấy! GK104 c� nhiều SP hơn nhưng die lại nhỏ hơn GF104 lẫn GF100. Dĩ nhi�n kh�ng thể bỏ qua "c�ng lao" của tiến tr�nh b�n dẫn 28nm của TSMC so với tiến tr�nh 40nm: c�ng lượng transistor một die 28nm chỉ bự bằng 1/2 die 40nm (28nm x 28nm = 40nm x 40nm / 2). Die GK104 c� k�ch thước 294mm2 @ 28nm. Trong trường hợp được sản xuất tr�n tiến tr�nh 40nm, k�ch thước của n� c� thể v�o 600mm2 ! Cho bạn tiện tham khảo, die GF100 c� k�ch thước 520mm2.

Nhưng ngay cả khi GK104 được sản xuất tr�n node 40nm, bạn vẫn kh� l�ng h�nh dung được l�m sao NVIDIA c� thể "nh�t" 1536 SP v�o trong một diện t�ch vốn chỉ "vừa" với khoảng 600 SP ? "Ma thuật" g� ở đ�y?

Die chip GK104 c� k�ch thước 294mm2.

"Ma thuật" ở chỗ: c� rất nhiều thứ tr�n tấm silicon kh�ng d�ng để l�m SP. Một trong c�c l� do ch�ng ta nhắc lại kiến tr�c Fermi ở tr�n l� : n� sinh ra cho GPGPU. Đối với GPGPU, một trong c�c th�nh phần quan trọng nhất l� c�c bộ điều lịch (scheduler) v� năng lực dấu phẩy động 64-bit (FP64). Vai tr� của scheduler c� thể so s�nh với c�c quản l� vi�n (supervisor) trong một c�ng ty, nh� m�y: bạn c� thể c� nhiều nh�n c�ng (worker) nhưng thiếu c�c quản l� c� tr�nh độ th� hiệu suất sử dụng lao động sẽ kh�ng cao. C�n FP64 c� � nghĩa trong việc t�nh to�n ch�nh x�c (nghi�n cứu khoa học, x�y dựng m� h�nh ...), hầu hết game kh�ng cần năng lực n�y.

Trong GPGPU, rất dễ c� sự xuất hiện bất ngờ c�c tiến tr�nh ngoại bi�n (thực chất GPGPU rất giống với c�c thuật to�n tr�n CPU - general computing). Một số tiến tr�nh bị lệ thuộc to�n tử v�o c�c tiến tr�nh ph�i sinh kh�c. Điều n�y khiến cho tốc độ xử l� GPGPU nhanh hay chậm sẽ lệ thuộc scheduler. C�n với gaming, hầu như c�c tiến tr�nh c� thể dự đo�n được v� c�c studio l�m game c� quan hệ s�u sắc với NVIDIA lẫn AMD. Nhờ mối quan hệ n�y m� hiệu năng game thường được cải thiện dần sau mỗi lần ph�t h�nh driver (software) mới. Nhưng với GPGPU, chỉ c� c�c scheduler vật l� (hardware) mới thực sự hiệu quả.

Kepler d�ng cơ chế điều lịch đơn giản hơn c�c thế hệ trước.

Bao nhi�u silicon được d�nh cho scheduler vật l� thực sự ch�ng ta kh�ng r�. Song bạn c� thể nh�n qua kiến tr�c GCN của AMD l�m v� dụ. Từ Cayman (HD 6970) chuyển l�n Tahiti (HD 7970) l� sự ch�nh lệch giữa 2,64 v� 4,3 tỷ transistor (60%), nhưng chỉ l� giữa 1536 v� 2048 SP (33%). Rất nhiều silicon đ� AMD đầu tư v�o scheduler vật l�. V� điều n�y tạo ra một con chip cực mạnh về GPGPU như bạn từng thấy.

Cấu tạo CU trong kiến tr�c GCN của AMD.

Vậy l� c�u trả lời "ma thuật" đ� r� : NVIDIA cắt giảm một lượng lớn silicon d�nh cho scheduler vật l� v� FP64 tr�n GK104 (c�ng với một số th�nh phần li�n quan kh�c). Kết quả l� một con chip chỉ "tốn" 3,54 tỷ trans nhưng lượng SP l�n đến 1536 !

V� �t hao điện hơn

Đặc t�nh n�y kh�ng chỉ do node 28nm (tất nhi�n vẫn c�). N� c� nguy�n nh�n "s�u xa" hơn ở yếu tố "xung shader". Như đề cập ở tr�n, từ GeForce 8000 cho đến GeForce 500, NVIDIA �p dụng mức xung shader cao hơn GPU rất nhiều. Một quy luật đơn giản: muốn đạt xung cao th� điện �p đầu v�o transistor phải lớn (v� ngược lại). C�c shader trước đ�y của NVIDIA đều c� mức xung khi fullload tr�n 1 GHz, v� cần rất nhiều điện. Đ�y cũng l� nguy�n nh�n khiến cho card NVIDIA vẫn thường bị ch� ở khoản hao điện (so với card AMD).

Xung thấp hơn, �t ti�u thụ điện hơn.

Việc NVIDIA cho xung shader bằng với nh�n GPU tr�n GK104 đ� loại bỏ điều tr�n. Chi tiết n�y đồng thời cho ph�p nh�n GPU đạt được xung cao hơn (do kh�ng bị hạn chế bởi xung shader). Nếu trước đ�y GTX 580 chỉ c� thể �p xung (OC) l�n 1,5 GHz th� chỉ trong ng�y ra mắt, GTX 680 đ� c� thể OC l�n 1,9 GHz !

Dĩ nhi�n, kh�ng c� g� "miễn ph�" m� kh�ng phải "đ�nh đổi". NVIDIA phải nhồi gấp 4 lần lượng SP so với GF104 để c� được hiệu năng gấp đ�i. V� NVIDIA phải cắt giảm lượng silicon cho scheduler vật l�. Chi tiết n�y khiến GK104 trở n�n rất yếu k�m trong GPGPU. Trong nhiều ph�p benchmark GPGPU, GTX 680 thậm ch� k�m cả GTX 580. Điều n�y đặt ra nghi hoặc cho giới HPC: con chip Kepler tiếp theo của NVIDIA sẽ như thế n�o? NVIDIA hiện đang c� một chỗ đứng lớn trong l�ng HPC. C�c kh�ch h�ng của NVIDIA đang mong đợi Kepler đạt được hiệu năng (GPGPU) cao hơn Fermi. GK110 - con chip Kepler tiếp theo - sẽ l� một chủ đề th� vị, song ch�ng ta sẽ kh�ng b�n ở đ�y.

Tr�nh điều khiển nhớ tốt hơn

NVIDIA c� thể l�m ra những GPU rất mạnh, nhưng họ vẫn thường theo sau AMD về c�c chip nhớ DRAM. Trong cộng đồng c�ng nghệ, AMD thường được biết đến như h�ng ti�n phong về c�c chuẩn nhớ đồ hoạ mới. Kh�ng qu� thậm xưng khi n�i rằng GDDR5 do ch�nh AMD l�m ra. Khi NVIDIA vẫn loay hoay với GDDR3 th� AMD đ� c� kinh nghiệm với GDDR4 & 5. Ngay cả khi tiến l�n sử dụng GDDR5, tốc độ c�c chip DRAM m� NVIDIA khai th�c được thường thấp hơn nhiều so với AMD. Một trong c�c l� do khiến hiệu năng GeForce sụt đi so với Radeon khi tiến l�n độ ph�n giải cao cũng đến từ đ�y : hụt băng th�ng nhớ.

Nhưng đến với Kepler, NVIDIA đặt ra mục ti�u : cải thiện tr�nh điều khiển nhớ (IMC) trong lần đầu ti�n v� vượt qua đối thủ ở lần tiếp theo. Kết quả l� một khối IMC kh� lớn v� hiệu quả cực kỳ ấn tượng : chỉ với giao tiếp 256-bit nhưng GK104 đạt được băng th�ng nhớ tương đương với GF100 vốn c� giao tiếp nhớ 384-bit. Kh�ng chỉ thế, c�c kết quả OC mới nhất cho thấy IMC của GTX 680 cực kỳ mạnh mẽ : vượt tr�n 7 GHz !

Turbo, eh ... GPU Boost

Người d�ng CPU Intel v� AMD hẳn từng c� nghe qua Turbo Boost / CORE (gọi tắt turbo). T�nh năng OC tự động n�y sẽ gi�p CPU của bạn đạt được mức xung cao hơn mặc định trong trường hợp ứng dụng kh�ng tận dụng hết hiệu quả đa luồng. Do kh�ng d�ng "hết" hiệu quả n�y, c� một phần TDP của chip kh�ng được khai th�c m� cả AMD v� Intel đều thấy "ph�". NVIDIA cũng nhanh ch�ng bắt lấy � tưởng n�y v� họ sinh ra GPU Boost (b�n GPU AMD cũng c� t�nh năng tương tự l� Power Tune, song Power Tune kh�ng "tự động" như turbo hay GPU Boost).

Romano · 03-27-2012

C�ch thức hoạt động như đ� n�u: khi xử l� c�c game c� hiệu suất khai th�c GPU thấp, phần TDP "thừa" sẽ được c�c bộ điều khiển (controller) VRM t�nh to�n v� tự động tăng điện �p (Vcore, Vdd) để GPU c� thể đạt mức xung cao hơn, từ đ� cải thiện hiệu năng game (th�ng qua lượng fps). Dưới đ�y l� bảng một số mức xung v� điện �p m� AnandTech ghi nhận được khi benchmark GTX 680:

Mặc d� vậy, GPU Boost c� vẻ kh�ng hiệu quả khi gaming l� bao. Kết quả so s�nh giữa khi kh�ng bật (-16%) v� c� bật (Stock) của AnandTech cho thấy bạn hầu như kh�ng nhận ra được kh�c biệt n�o giữa ch�ng. Kể cả khi bạn khai th�c GPU Boost ở mức tối đa th� ch�nh lệch n�y cũng chỉ v�i %:

Tại sao GPU Boost ph�t huy k�m ? C� 2 l� do :

- Kiến tr�c chip : một kiến tr�c với hiệu năng tr�n từng MHz cao sẽ tăng lượng fps nhiều hơn

- Hiệu quả khai th�c chip của game : những game vốn đ� khai th�c tốt GPU th� lượng TDP "thừa" rất �t. Nếu quan hệ giữa game studio v� nh� sản xuất GPU vốn đ� tốt th� gần như kh�ng c� khoảng "thừa" n�o để tận dụng tiếp

Những t�nh năng kh�c

Những thứ liệt k� sau đ�y thực ra kh�ng li�n quan đến kiến tr�c của Kepler. Song v� ch�ng xuất hiện c�ng l�c với sự ra mắt của GTX 680 n�n ch�ng ta điểm qua để hiểu th�m xem ngo�i năng lực game, NVIDIA c�n đem đến cho người d�ng những g� kh�c.

Adaptive V-Sync

Hầu hết c�c FPS gamer c� thể từng nghe qua V-Sync, một t�nh năng gi�p "ổn định" mức fps khi chơi. C�c benchmark thường chỉ n�u ra mức fps trung b�nh (avg) m� card đạt được. Nhưng điều ảnh hưởng đến đ�i mắt của gamer lại l� 2 gi� trị tối đa (max) v� tối thiểu (min), nếu ch�nh lệch giữa min v� max qu� lớn sẽ g�y ra hiện tượng x� h�nh (tear) khiến gamer thấy rất kh� chịu.

V-Sync sinh ra với mục đ�ch giới hạn lại mức ch�nh lệch tr�n, thường v�o giữa 30 v� 60 fps (với điều kiện card phải c� khả năng đạt min > 30 fps v� max > 60 fps). Song n� vẫn c� nhược điểm : khi card chỉ xuất được < 60 fps th� V-Sync lập tức "k�o" xuống c�n 30 fps. Đặc điểm n�y phần n�o vẫn g�y bực bội cho gamer (nhưng vẫn �t hơn so với hiện tượng x� h�nh). V� NVIDIA khắc phục nốt vấn đề n�y bằng c�ch loại giới hạn "min" : v� dụ card xuất ra 52 fps th� thứ được hiển thị tr�n m�n h�nh vẫn l� 52 fps. T�nh năng n�y về căn bản l� một phần của driver, kh�ng thuộc bản chất kiến tr�c GPU.

FXAA & TXAA

Khử răng cưa (AA) v� lọc đẳng hướng (AF) l� 2 phương ph�p truyền thống nhằm n�ng cao chất lượng h�nh ảnh trong game. Tuy vậy kh�ng c� g� "miễn ph�" : mức fps sẽ bị giảm đi khi �p dụng c�c thuật to�n n�y. Trong nhiều năm, cả AMD lẫn NVIDIA vẫn lu�n nghi�n cứu ra c�c thuật to�n mới (chủ yếu l� AA) nhằm vẫn giữ chất lượng h�nh ảnh ở mức cao m� chỉ "hao hụt" một �t hiệu năng đồ hoạ. Đến với lần n�y, NVIDIA giới thiệu 2 cơ chế AA mới : FXAA v� TXAA.

Từ tr�n xuống : AA off, MSAA 4x, FXAA.

TXAA thực ra kh�ng phải ho�n to�n mới, n� l� sự kết hợp của nhiều cơ chế AA trước đ�y. Kết quả l� một cơ chế cho hiệu năng tương đương (TXAA1) với MSAA 8x hoặc cao hơn (TXAA2), nhưng mức "hao hụt" hiệu năng chỉ ngang với MSAA 2x hoặc 4x. Trong khi đ� FXAA mang lại chất lượng h�nh ảnh tốt hơn MSAA 4x, tuy nhi�n "c�i gi� phải trả" về hiệu năng l� bao nhi�u th� ch�ng ta kh�ng được r�, chỉ biết rằng : wow, rất tuyệt !

Từ tr�n xuống : AA off, MSAA 4x, TXAA.

Một vấn đề "nhỏ" của FXAA v� TXAA l� hiện chưa c� game n�o khai th�c được ch�ng. Sẽ cần nhiều thời gian để NVIDIA l�m việc với c�c game studio v� t�ch hợp ch�ng trong c�c bản driver mới.

Bindless Textures

Nếu l�c ra mắt HD 7970, AMD c�ng bố về Partially Resident Textures (PRT) như l� một phương ph�p để tiết kiệm băng th�ng nhớ đối với nhu cầu về texture th� nay với GTX 680, NVIDIA cũng c� đ�n đ�p trả. Tuy về bản chất đều l�m tăng tốc độ nạp texture, nhưng c�ch thức thực hiện ho�n to�n kh�c nhau.

C�ch thức hoạt động của PRT.

Với AMD, ứng dụng đồ hoạ sẽ "băm" một khối texture lớn (megatexture) ra nhiều mảnh (64 KB). Sau đấy chọn ra c�c mảnh thực sự cần thiết đối với luồng xử l� v� nạp v�o c�c shader, gi�p tiết kiệm đ�ng kể băng th�ng nhớ (v� kh�ng nạp c�c mảnh thừa). Với NVIDIA, theo "truyền thống", shader sẽ truy cập đến texture th�ng qua một bảng tra cứu (binding table). Điều n�y l�m hạn chế số lượng texture m� c�c shader c� thể c�ng truy cập trong một l�c (128 mẫu với c�c thế hệ trước). Tiến l�n Kepler, NVIDIA bỏ qua bước tra cứu n�y v� truy cập trực tiếp v�o bộ nhớ để đọc texture. Nhờ đ�, về l� thuyết c�c shader Kepler c� thể đọc được c�ng l�c > 1 triệu mẫu texture.

Bindless Texture của NVIDIA.

Hiển thị đa m�n h�nh

Việc một GPU c� thể xuất t�n hiệu ra 2 m�n h�nh kh�c nhau vốn đ� c� từ l�u. Song dường như nhiều nh� sản xuất "qu�n" rằng người d�ng c� thể sẽ cần nhiều m�n h�nh hơn n�n họ hầu như kh�ng thay đổi năng lực n�y của GPU (chỉ trừ một số card đồ hoạ chuy�n dụng mới c� t�nh năng n�y). Rồi AMD thực sự g�y "shock" cho rất nhiều kh�ch mời khi lần đầu ti�n ra mắt d�ng card HD 5000 c�ch đ�y 3 năm : Eyefinity. Lần đầu ti�n một chiếc card chơi game c� thể xuất tối thiểu c�ng l�c t�n hiệu ra 3 m�n h�nh kh�c nhau. Với một số phi�n bản kh�c, AMD c� thể đẩy con số n�y l�n 6 hoặc thậm ch� l� 12 m�n h�nh c�ng l�c!

Trong 3 năm qua, NVIDIA kh�ng c� g� đ�p trả lại Eyefinity. Họ vẫn c� thể xuất ra 3 m�n h�nh nhưng lại cần đến 2 card GeForce hoạt động ở chế độ SLI mới l�m được. Ngo�i ra NVIDIA chỉ dừng được đến 3 m�n h�nh, kh�ng hơn. V� h�m nay, thế hệ card Kepler đ� khắc phục điểm yếu đ� của NVIDIA : 4 m�n h�nh c�ng l�c. Mặc d� con số n�y vẫn k�m phi�n bản Eyefinity 6 v� 12 của AMD, song "muộn c�n hơn kh�ng". Với bước đi n�y của NVIDIA, c�ng với thiết kế GPU tr�n Ivy Bridge sắp tới của Intel, hy vọng trong thời gian tới việc chơi tr�n nhiều m�n h�nh sẽ trở n�n phổ biến hơn v� c�c gamer sẽ c� cảm gi�c "kh�ng gian như thật" nhờ g�c nh�n trong game được cải thiện đ�ng kể.

Tổng hợp th�ng số kỹ thuật

B�n luận d�ng d�i như thế, đ� đến l�c ch�ng ta cần "r�p nối" c�c th�nh phần lại để ra một con chip ho�n chỉnh.

Th�nh phần cơ bản nhất của GK104 l� SMX như đ� n�i ở phần trước (l� sự gh�p nối của nhiều SM từ kiến tr�c Fermi). 1 SMX gồm 192 SP (hoặc nh�n CUDA), 16 bộ Load / Store, 16 SFU, 1 PolyMorph Engine, 4 Warp Scheduler, 8 Dispatch Unit, L1 Cache 64 KB v� 8 TMU. L�n cấp độ cao hơn, ch�ng ta c� GPC : gồm 2 SMX v� 1 Raster Engine. Mỗi GPC li�n kết với 1 tr�nh điều khiển nhớ (MC) 64-bit v� 8 ROP. Ở cấp độ to�n con chip, GK104 c� 4 GPC v� từ đấy c� đ�n 4 MC 64-bit tạo th�nh giao tiếp nhớ 256-bit, 4 nh�m ROP tạo th�nh tổng 32 ROP c� chung L2 Cache 512 KB. Tất cả dữ liệu ra v�o 4 GPC, 4 MC v� 32 ROP lẫn L2 Cache được ph�n phối bởi GigaThread Engine v� giao tiếp PCI Express (PCIe) 3.0.

Từ đ�y, ch�ng ta c� thể dự đo�n phi�n bản Kepler cấp thấp hơn (giả định GK106) sẽ c� th�ng số như n�o. Nhiều khả năng GK106 sẽ c� 2 GPC với 4 SMX v� 2 MC tạo th�nh giao tiếp nhớ 128-bit, lượng ROP c�n 16 đơn vị v� L2 Cache chỉ c�n 256 KB. Tất nhi�n GK106 vẫn cần một GigaThread Engine (nhỏ hơn) v� giao tiếp PCIe 3.0 để "n�i chuyện" với CPU.

Ở đ�y, ch�ng ta sẽ mượn lại kết quả benchmark từ AnandTech để thấy được hiệu năng của GTX 680:

Kết quả benchmark game

Kh�ng qu� kh� để thấy GTX 680 hầu như dẫn đầu trong mọi chiếc card đơn nh�n hiện c� (trừ một số k�m HD 7970). Tuy vậy nếu bạn để � kỹ hơn, sức mạnh của GTX 680 hầu như chỉ bằng 2,3 lần (hoặc thấp hơn) GTX 560 Ti. C�n nhớ phần "SP gấp 4, hiệu năng gấp 2" chứ ? Kết hợp với ch�nh lệch về xung 1006 / 822 = 1,22, về l� thuyết GTX 680 sẽ nhanh hơn GTX 560 Ti 2,45 lần. V� chỉ cần thế GK104 trở th�nh GPU mạnh mẽ nhất cho game trong số c�c GPU hiện tại.

Crysis Warhead

Metro 2033

Dirt 3

Romano · 03-27-2012

Total War - Shogun 2

Batman - Arkham City

Portal 2

Battlefield 3

StarCraft II

The Elder Scrolls V - Skyrim

Civilization V

Năng lực điện to�n

Mặc d� card đồ hoạ vốn ban đầu sinh ra để cho game 3D. Song theo thời gian sức mạnh của ch�ng ng�y c�ng đ�ng kể, vượt xa cả những CPU x86 mạnh nhất c�ng thời. Chỉ chơi game c� phần n�o l�ng ph� nguồn sức mạnh to lớn ấy. Do vậy m� cả AMD lẫn NVIDIA đều đang cổ su� cho GPGPU, một h�nh thức điện to�n dựa tr�n c�c GPU, nhằm tăng tốc qu� tr�nh xử l� thay cho việc d�ng CPU truyền thống. V� c�u hỏi được đặt ra ở đ�y : hiệu năng game của GTX 680 c� tương đương với năng lực điện to�n ?

C�u trả lời dường như kh� r� : GTX 680 kh�ng mạnh ở GPGPU, n� thậm ch� k�m cả GTX 580. V� l� do kh� đơn giản : NVIDIA kh�ng định hướng cho n� th�nh một sản phẩm mạnh về GPGPU, rất nhiều th�nh phần cần thiết cho GPGPU bị cắt giảm đi khi thiết kế GK104, ch�ng được thay bằng lượng SP khổng lồ chỉ để tăng năng lực gaming l�n mức tối đa, như ch�ng ta đ� ph�n t�ch ở tr�n.

Nhiệt độ, độ ồn, ti�u thụ điện

Bằng việc bỏ đi xung shader so với c�c thế hệ GPU trước, giờ đ�y NVIDIA ho�n to�n c� khả năng l�m ra những chiếc card c� mức ti�u thụ điện tương đương với AMD. �t transistor hơn Tahiti nhưng d�ng chung node 28nm, kh�ng c� g� ngạc nhi�n khi GK104 m�t hơn, d�ng �t điện hơn v� nhờ đấy hoạt động �m �i hơn (do quạt kh�ng phải quay nhiều).

Kết luận

Nếu bạn l� một gamer, qua hết thảy những g� n�u tr�n, bạn gần như tự trả lời được n�n chọn mua chiếc card n�o giữa GTX 680 v� HD 7970. Một chi tiết th� vị hơn: NVIDIA ch�o gi� GTX 680 thấp hơn 50 USD so với HD 7970. Nghe rất tuyệt phải kh�ng ? Song c� một điều khiến bạn chưa h�i l�ng: hiện chẳng c�n chiếc GTX 680 n�o cho bạn x�ch về nh�, kể cả đặt h�ng online từ Mỹ. L� do l� TSMC (h�ng gia c�ng chip) kh�ng cung cấp đủ lượng GK104 cho NVIDIA. Do vậy rất c� thể 2 thậm ch� 3 th�ng tới, Việt Nam ch�ng ta mới c� GTX 680 v� gi� c� thể cao hơn rất nhiều so với gi� gốc (v� nguồn cung rất hạn chế).

Ngo�i ra, n�i đi cũng phải n�i lại, d� HD 7970 k�m hiệu năng game hơn GTX 680, song đấy vẫn l� chiếc card mạnh ... thứ 2 hiện nay. Kh�ng phủ nhận được rằng ngo�i GTX 680 th� chẳng c�n model đơn nh�n n�o mạnh hơn HD 7970. Nhược điểm duy nhất của chiếc card Radeon l� gi� th�nh của n�. Hy vọng với sự ra mắt của GTX 680, AMD sẽ nhanh ch�ng hạ gi� c�c model HD 7900 trong thời gian sắp tới. B�n cạnh đ�, năng lực GPGPU l� một điểm mạnh cho sản phẩm của AMD. Ch�ng ta c� thể n�i gọn: GTX 680 - cực đỉnh về game, HD 7970 - tuyệt về game, tuyệt cả GPGPU.
cnet

Tin n�ng nhất 24h qua	Tin n�ng nhất 3 ng�y qua	Tin n�ng nhất 7 ng�y qua
Tin n�ng nhất 30 ng�y qua	Albums	Total Videos Online

Tranh luận s�i nổi nhất 7 ng�y qua	Tranh luận s�i nổi nhất 14 ng�y qua	Tranh luận s�i nổi nhất 30 ng�y qua
10.000 Tin mới nhất	Tin tức Hoa Kỳ	Tin tức C�ng nghệ

Super News	School Cooking Traveling Portal	Enter Portal
Series Shows and Movies Online	SERIES ONLINE 1	SERIES ONLINE 2

HOME	Breaking News	VN News	VietOversea	World News	Business News	Other News	History
Car News	Computer News	Game News	USA News	Mobile News	Music News	Movies News	Sport News
DEM	GOP	Phim Bộ	Phim Lẻ	Ca Nhạc	Thơ Ca	Help Me	Sport Live
Stranger Stories	Comedy Stories	Cooking Chat	Nice Pictures	Fashion	School	Travelling	Funny Videos
NEWS 24h	HOT 3 Days	NEWS 3 Days	HOT 7 Days	NEWS 7 Days	HOT 30 Days	NEWS 30 Days	Member News