Pascal là sự kế thừa cho kiến trúc Maxwell, được giới thiệu bởi Nvidia vào năm 2016. Chúng tôi sử dụng bài viết này để xem các tính năng của kiến trúc GPU cũng như sự khác biệt so với Maxwell.

Pascal đã được giới thiệu bởi Nvidia trong năm 2016 của GTC vào tháng 4 trong chip GP100 lớn. Hiện tại, thiết bị này chỉ được sử dụng cho thẻ Tesla P100 chuyên nghiệp dành cho máy chủ. Chúng ta sẽ thấy phiên bản tiêu dùng đầu tiên, GP104, trong GeForce GTX 1080 và 1070 vào tháng 5. Các chip này được sản xuất trong một quy trình FinFET 16 nm mới của TSMC, đây là một cải tiến lớn so với các GPU 28 nm cũ. Phiên bản mới được công bố GeForce GTX 1050 Ti và 1050 được sản xuất trong Finnfet 14 nm tại Samsung.

Kiến trúc vi mô của chip Pascal là sự tiến bộ của Maxwell và vẫn tập trung nhiều vào tính hiệu quả. Đây là thiết kế modun và có thể được sử dụng trong máy tính bảng (Tegra, chưa được xác nhận) lên đến các card đồ họa máy chủ lớn (Tesla với GP100). Tùy thuộc vào mô hình, nó có thể sử dụng từ 1 đến 60 bộ xử lý đa luồng (SM), có thể thay đổi một chút. Mô hình GP100 hàng đầu (dành cho máy chủ) được 64 lõi cho mỗi SM. Ngoài ra còn có thêm các đơn vị “Double Precision” (DP) chuyên dụng. Các phiên bản nhỏ hơn cho máy tính để bàn và máy tính xách tay miễn các đơn vị DP và nhận được 128 lõi cho mỗi SM.
nvidia 1

GP104, được sử dụng cho GTX 1080 và GTX 1070, được trang bị 4 GPC (Bộ xử lý đồ hoạ), 20 bộ xử lý đa luồng (SM) và 8 bộ điều khiển bộ nhớ (= 256-bit). Mỗi SM có 128 (CUDA) cores, 256 KB Register File Buffer, bộ nhớ chia sẻ bộ nhớ 96 KB, bộ nhớ cache L1 48 KB và 8 đơn vị kết cấu.

Cải thiện hiệu quả

Nhờ vào tiến trình FinFET 16 nm mới và cải tiến nội bộ, hiệu quả đã tăng lên rõ rệt so với Maxwell. Các trình chiếu sau đây cho thấy Nvidia đã nâng cao hiệu quả đáng kể trong tất cả các phạm vi tiêu thụ năng lượng, đặc biệt ở các vùng cao hơn.

Tối ưu hóa kiến trúc cho đồng hồ cao cấp

Ví dụ một lần nữa là máy tính để bàn GTX 1080. Nó có thể dễ dàng overclock tới hơn 2 GHz thông qua việc làm mát không khí và đồng hồ do đó cao hơn nhiều so với GTX 980 cũ (1216 MHz mà không cần ép xung). Theo mặc định, đồng hồ của 1080 đã cao hơn 40% so với GTX 980. Chỉ riêng kết quả của quá trình 16 nm, theo Nvidia.

Cũng có những điều chỉnh cho thiết kế chip và board cho bộ nhớ GDDR5X nhanh trong các mô hình hàng đầu.

Cải thiện bộ nhớ nén

Cũng như nén nén 2: 1, thế hệ thứ tư của Đồng hồ Nén màu Delta cũng có thể nén 4: 1 và 8: 1. Các chip cũng có thể tự động thử các loại nén khác nhau và chọn tốt nhất. Tính trung bình này cải thiện việc nén bằng một yếu tố 1,2x so với GTX 980 trong quá trình chơi game (được chọn bởi Nvidia). Kết hợp với băng thông cao hơn của VRAM GDDR5X của GTX 1080, chúng tôi thậm chí còn tăng băng thông bộ nhớ 1.7x.
nvidia

Trong GPU thế hệ Maxwell, khối lượng công việc chồng chéo (tính toán và đồ hoạ) được thực hiện với phân vùng tĩnh của GPU. Tuy nhiên, phân vùng này chỉ có thể được thay đổi sau khi cả hai khối lượng công việc đã hoàn thành. Nếu một trong hai khối lượng công việc đã hoàn thành trước cái khác, thì không thể sử dụng toàn bộ GPU, nhưng chỉ giới hạn trong phần được phân bổ. Sự phân bổ này bây giờ đã trở nên năng động với Pascal và do đó có thể sử dụng tất cả các tài nguyên GPU.

GPU Tăng 3,0

GPU Boost có thể làm tăng đồng hồ của GPU cho đến khi nó đạt được một mục tiêu nhiệt độ định trước. Ngoài các cải tiến Nâng cao khác, GPU Boost 3,0 giờ đây còn có các hiệu chỉnh tần số điểm thay thế cho mỗi điện thế. Bạn có thể tìm đường cong hoàn hảo cho mỗi điểm điện áp cho mỗi thẻ thông qua máy quét của bên thứ ba và do đó chọn đồng hồ Boost cao hơn (ép xung GPU).

Đồng thời đa chiếu

Khối Projection Đồng thời là một đơn vị phần cứng mới, nằm bên trong PolyMorph Engine ở cuối đường ống hình học và ngay phía trước của Đơn vị Raster. Như tên của nó ngụ ý, đơn vị Multi-Projection Đồng thời (SMP) có trách nhiệm tạo ra nhiều phép chiếu của một luồng hình học đơn lẻ. Nó có thể tính đến 16 dự phóng khác nhau ở cùng quan điểm và hai với khoảng cách khác nhau trên trục x. Công nghệ này có thể được sử dụng để giám sát nhiều màn hình với các góc độ hiển thị khác nhau, tai nghe VR hoặc màn hình cong.

Các tính năng Video và Cổng Hiển thị

Pascal cũng đã giới thiệu cải tiến về tính năng video. GP104 bây giờ có thể mã hóa HEVC 10-bit và giải mã HEVC 10-bit và 12-bit. Thậm chí phát lại video VP9 cũng được tăng tốc bởi phần cứng (4K 120 Hz 320 Mbps). Kết hợp với phần cứng bảo mật bổ sung, lần đầu tiên Pascal được chứng nhận là PlayReady 3.0 (SL3000) và do đó cho phép phát lại 4K Netflix trong Windows 10. Một tính năng mới nữa là hỗ trợ HDR cho HDMI 2.0b và DisplayPort 1.4 (TV đầu tiên đã có sẵn, màn hình được mong đợi vào năm 2017).

GPU GP104 vẫn có thể truyền bốn màn hình cùng một lúc, nhưng HDMI 2.0b (Maxwell HDMI 2.0) và DisplayPort 1.4 (“Ready”, lên đến 7680×4320 @ 60 Hz thông qua hai cổng DP 1.3) là những tính năng mới.

Tóm lược

Kiến trúc Pascal mới của Nvidia không chỉ đơn giản là một cái Die-Shrink của kiến trúc Maxwell thành công mà còn giới thiệu nhiều sự tối ưu và các tính năng mới. Các bài kiểm tra hiệu năng của chúng tôi về máy tính để bàn GTX 1080 xác nhận sự gia tăng hiệu năng và hiệu quả của thế hệ mới. Đồng thời Multi-Projection tập trung vào thực tế ảo. GPU Boost 3.0 giúp cho hiệu năng cao hơn từ GPU khi ép xung. Tuy nhiên, tính năng cải tiến và tính năng video cũng sẽ có lợi cho các chip máy tính xách tay.