Nvidia có hai tính năng nổi bật trên các card đồ họa sê-ri RTX 30 và sê-ri RTX 40: dò tia và DLSS. PlayStation 5 và Xbox Series X đều đã làm rất tốt việc giới thiệu cho hầu hết mọi người về phương pháp dò tia, nhưng DLSS vẫn còn hơi mơ hồ. Nó hơi phức tạp một chút, nhưng nó cho phép bạn chơi trò chơi ở độ phân giải cao hơn được ảo hóa, duy trì độ chi tiết cao hơn và tốc độ khung hình cao hơn mà không phải đánh thuế nhiều vào card đồ họa của bạn. Nó mang đến cho bạn những điều tốt nhất trên thế giới bằng cách khai thác sức mạnh của máy học và với sự ra đời của DLSS 3, công nghệ thậm chí còn mạnh mẽ hơn nữa.
Nhưng câu chuyện còn nhiều điều hơn thế nữa. Sau đây là mọi thứ bạn cần biết về DLSS, cách thức hoạt động và những gì nó có thể làm cho trò chơi trên PC của bạn.
DLSS là gì?
DLSS là viết tắt của siêu mẫu học sâu. Bit “siêu lấy mẫu” đề cập đến một phương pháp khử răng cưa giúp làm mịn các cạnh răng cưa hiển thị trên đồ họa được kết xuất. Tuy nhiên, đối với các hình thức khử răng cưa khác, SSAA (khử răng cưa siêu lấy mẫu) hoạt động bằng cách hiển thị hình ảnh ở độ phân giải cao hơn nhiều và sử dụng dữ liệu đó để điền vào các khoảng trống ở độ phân giải gốc.
Phần “học sâu” là công thức bí mật của Nvidia. Sử dụng sức mạnh của máy học, Nvidia có thể đào tạo các mô hình AI bằng các bản quét có độ phân giải cao. Sau đó, phương pháp khử răng cưa có thể sử dụng mô hình AI để điền thông tin còn thiếu. Điều này rất quan trọng, vì SSAA thường yêu cầu bạn hiển thị cục bộ hình ảnh có độ phân giải cao hơn. Nvidia thực hiện điều đó ngoại tuyến, cách xa máy tính của bạn, mang lại lợi ích của việc lấy mẫu siêu lớn mà không cần chi phí tính toán.
NVIDIA DLSS – Thuật toán xử lý hình ảnh so với Mô hình nghiên cứu AI
Điều này hoàn toàn có thể thực hiện được nhờ các lõi Tensor của Nvidia, chỉ có trong GPU RTX (ngoài các giải pháp trung tâm dữ liệu, chẳng hạn như Nvidia A100). Mặc dù GPU dòng RTX 20 có lõi Tensor bên trong, nhưng RTX 3060, 3060 Ti, 3070, 3080 và 3090 đi kèm với lõi Tensor thế hệ thứ hai của Nvidia, mang lại hiệu suất trên mỗi lõi cao hơn.
Các card đồ họa mới nhất của Nvidia từ dòng sản phẩm RTX 40-Series đưa các lõi Tensor lên thế hệ thứ tư. Điều này làm cho DLSS boost thậm chí còn mạnh mẽ hơn. Nhờ công cụ tensor dấu phẩy động 8 bit mới, thông lượng của các lõi đã tăng gấp 5 lần so với thế hệ trước.
Nvidia đang dẫn đầu về lĩnh vực này, mặc dù tính năng Siêu phân giải FidelityFX mới của AMD có thể mang lại một số cạnh tranh gay gắt. Ngay cả Intel cũng có công nghệ siêu lấy mẫu của riêng mình được gọi là Intel XeSS hoặc Intel Xe Super Sampling. Thêm về điều đó sau.
DLSS thực sự làm gì?
DLSS là kết quả của một quá trình toàn diện dạy thuật toán AI của Nvidia để tạo ra các trò chơi đẹp hơn. Sau khi kết xuất trò chơi ở độ phân giải thấp hơn, DLSS phỏng đoán thông tin từ cơ sở kiến thức về đào tạo hình ảnh có độ phân giải siêu cao để tạo ra một hình ảnh trông giống như đang chạy ở độ phân giải cao hơn. Ý tưởng là làm cho các trò chơi được hiển thị ở 1440p trông giống như chúng đang chạy ở các trò chơi 4K hoặc 1080p trông giống như 1440p. DLSS 2.0 cung cấp độ phân giải gấp bốn lần, cho phép bạn kết xuất trò chơi ở 1080p trong khi xuất chúng ở 4K.
Các kỹ thuật siêu phân giải truyền thống hơn có thể dẫn đến hiện tượng giả và lỗi trong hình ảnh cuối cùng, nhưng DLSS được thiết kế để xử lý những lỗi đó nhằm tạo ra hình ảnh thậm chí còn đẹp hơn. Trong những trường hợp thích hợp, nó có thể mang lại hiệu suất nâng cao đáng kể mà không ảnh hưởng đến giao diện của trò chơi; ngược lại, nó có thể làm cho trò chơi trông đẹp hơn.
Trong khi các trò chơi DLSS đầu tiên như Final Fantasy XV mang lại những cải thiện về tốc độ khung hình ở mức khiêm tốn, chỉ từ 5 khung hình/giây (khung hình/giây) lên 15 khung hình/giây, thì các bản phát hành gần đây hơn đã chứng kiến những cải tiến lớn hơn nhiều. Với các trò chơi như Deliver us the Moon và Wolfenstein: Youngblood, Nvidia đã giới thiệu một công cụ AI mới cho DLSS, công cụ này được cho là sẽ cải thiện chất lượng hình ảnh, đặc biệt là ở độ phân giải thấp hơn như 1080p và có thể tăng tốc độ khung hình trong một số trường hợp lên hơn 50%.
Với phiên bản mới nhất của DLSS 3, mức tăng tốc độ khung hình có thể còn đáng kể hơn nhờ tính năng tạo khung hình mới. Các triển khai DLSS trước đây chỉ có các lõi Tensor giúp khung hình trông đẹp hơn, nhưng giờ đây, các khung hình có thể được kết xuất chỉ bằng AI. Chúng ta sẽ thảo luận chi tiết hơn về DLSS 3 sau.
Deliver Us The Moon | Tăng cường hiệu suất & chất lượng hình ảnh NVIDIA DLSS
Ngoài ra còn có các chế độ điều chỉnh chất lượng mới mà người dùng DLSS có thể thực hiện, chọn giữa Hiệu suất, Cân bằng và Chất lượng, mỗi chế độ tập trung mã lực lõi Tensor của GPU RTX vào một khía cạnh khác của DLSS.
DLSS hoạt động như thế nào?
DLSS 2.0 off
DLSS 2.0 Performance
DLSS 2.0 Quality
DLSS buộc trò chơi phải hiển thị ở độ phân giải thấp hơn (thường là 1440p) rồi sử dụng thuật toán AI đã được đào tạo để suy đoán trò chơi sẽ trông như thế nào nếu được hiển thị ở độ phân giải cao hơn (thường là 4K). Nó thực hiện điều này bằng cách sử dụng một số hiệu ứng khử răng cưa (có thể là TAA của riêng Nvidia) và một số tính năng làm sắc nét tự động. Các hiện vật trực quan không có ở độ phân giải cao hơn cũng được loại bỏ và thậm chí được sử dụng để suy ra các chi tiết nên có trong một hình ảnh.
Như Eurogamer giải thích, thuật toán AI được đào tạo để xem xét một số trò chơi nhất định ở độ phân giải cực cao (được cho là siêu mẫu 64x) và được chắt lọc thành một thứ có kích thước chỉ vài megabyte trước khi được thêm vào bản phát hành trình điều khiển Nvidia mới nhất và tất cả game thủ đều có thể truy cập được. trên toàn thế giới. Ban đầu, Nvidia phải trải qua quá trình này trên cơ sở từng trò chơi. Trong DLSS 2.0, Nvidia cung cấp một giải pháp chung, vì vậy mô hình AI không còn cần phải được đào tạo cho mỗi trò chơi.
Trên thực tế, DLSS là phiên bản thời gian thực của công nghệ Ansel nâng cao ảnh chụp màn hình của Nvidia. Nó kết xuất hình ảnh ở độ phân giải thấp hơn để tăng hiệu suất, sau đó áp dụng các hiệu ứng khác nhau để mang lại hiệu ứng tổng thể tương đối giống với việc tăng độ phân giải.
Kết quả có thể là một túi hỗn hợp, nhưng nói chung, nó dẫn đến tốc độ khung hình cao hơn mà không làm giảm đáng kể độ trung thực của hình ảnh. Nvidia tuyên bố tốc độ khung hình có thể cải thiện tới 75% trong Remedy Entertainment’s Control khi sử dụng cả DLSS và dò tia. Nó thường ít rõ ràng hơn thế và không phải ai cũng thích giao diện cuối cùng của trò chơi DLSS, nhưng tùy chọn này chắc chắn dành cho những ai muốn làm đẹp trò chơi của họ mà không phải trả chi phí chạy ở độ phân giải cao hơn.
Trong Death Stranding, chúng tôi đã thấy những cải tiến đáng kể ở 1440p so với kết xuất gốc. Chế độ hiệu suất bị mất một số chi tiết tốt hơn trên gói phía sau, đặc biệt là trong băng. Chế độ chất lượng duy trì hầu hết các chi tiết trong khi làm mịn một số cạnh thô của kết xuất gốc. Ảnh chụp màn hình “DLSS off” của chúng tôi hiển thị chất lượng mà không cần khử răng cưa. Mặc dù DLSS không duy trì mức chất lượng đó, nhưng nó rất hiệu quả trong việc chống răng cưa trong khi vẫn duy trì hầu hết các chi tiết.
Chúng tôi không thấy bất kỳ sự mài sắc quá mức nào trong Death Stranding, nhưng đó là điều bạn có thể gặp phải khi sử dụng DLSS.
Tốt hơn theo thời gian
DLSS có khả năng cung cấp cho những game thủ không thể đạt được tốc độ khung hình thoải mái ở độ phân giải trên 1080p khả năng làm như vậy bằng suy luận. DLSS chắc chắn là một trong những tính năng mạnh mẽ nhất của GPU RTX. Chúng không mạnh như chúng ta mong đợi và các hiệu ứng dò tia đẹp mắt nhưng có xu hướng tác động đáng kể đến hiệu suất, nhưng DLSS mang đến cho chúng ta những điều tốt nhất của cả hai thế giới: trò chơi đẹp hơn cũng hoạt động tốt hơn.
Ban đầu, có vẻ như DLSS sẽ là một tính năng thích hợp cho các card đồ họa cấp thấp, nhưng không phải vậy. Thay vào đó, DLSS đã cho phép các trò chơi như Cyberpunk 2077 và Control tăng cường độ trung thực của hình ảnh trên phần cứng cao cấp mà không làm cho trò chơi không thể chơi được. DLSS nâng cao phần cứng cấp thấp đồng thời cung cấp cái nhìn thoáng qua về tương lai cho phần cứng cao cấp.
Nvidia đã trình chiếu các trò chơi kết xuất RTX 3090 như Wolfenstein: YoungBlood ở 8K với tính năng dò tia và bật DLSS. Mặc dù việc áp dụng rộng rãi 8K vẫn còn xa, nhưng màn hình 4K đang ngày càng trở nên phổ biến. Thay vì kết xuất ở 4K gốc và hy vọng đạt khoảng 50 khung hình/giây đến 60 khung hình/giây, game thủ có thể kết xuất ở 1080p hoặc 1440p và sử dụng DLSS để điền thông tin còn thiếu. Kết quả là tốc độ khung hình cao hơn mà không làm giảm đáng kể chất lượng hình ảnh.
DLSS cũng luôn được cải thiện và nó nhận được các bản cập nhật thường xuyên nhằm cải thiện thuật toán AI. Giờ đây nó cho phép nó sử dụng các vectơ chuyển động thông minh hơn, về cơ bản giúp cải thiện hình thức của các vật thể khi chúng đang di chuyển. Bản cập nhật cũng giảm hiện tượng bóng mờ, làm cho các hiệu ứng hạt trông rõ ràng hơn và cải thiện độ ổn định theo thời gian. DLSS 2 hiện đã được áp dụng khá rộng rãi và có 216 trò chơi hỗ trợ tính đến tháng 9 năm 2022.
Tuy nhiên, những cải tiến không dừng lại ở đó. Trên thực tế, mọi thứ sắp trở nên thú vị hơn rất nhiều với sự ra đời của DLSS 3.
DLSS 3 phát minh lại công nghệ bằng cách hiển thị khung hình thay vì pixel
Vào ngày 20 tháng 9, trong bài phát biểu quan trọng về GTC 2022, Nvidia đã công bố DLSS 3 phiên bản mới nhất của công nghệ sẽ có sẵn cho chủ sở hữu cạc đồ họa sê-ri RTX 40. Không giống như một số bản cập nhật nhỏ hơn trước đây, các thay đổi đối với DLSS lần này là rất lớn và chúng có khả năng mang lại hiệu suất tăng đáng kể với việc bổ sung các khung hình do AI tạo ra, được tạo bằng các khung hình thực mà GPU ám ảnh. Điều này rất khác so với DLSS và DLSS 2, vốn chỉ chạm vào các khung hình thực với khả năng nâng cấp do AI cung cấp.
Hiện tại có bốn GPU hỗ trợ DLSS 3:
- RTX4090
- RTX4080
- RTX 4070ti
- RTX4070
Trong bài đánh giá RTX 4090, chúng tôi nhận thấy rằng DLSS 3 có thể mang lại tốc độ khung hình cao hơn đáng kể so với DLSS 2. Trong Cyberpunk 2077 ở 4K với tính năng dò tia được đặt ở mức tối đa, bật DLSS 3 mang lại số khung hình cao hơn gần 50% so với chỉ sử dụng DLSS 2; so với việc hoàn toàn không sử dụng DLSS, DLSS 3 có tốc độ khung hình cao hơn ba lần. Ở khía cạnh này, DLSS 3 mang lại đúng như những gì Nvidia đã hứa.
Tuy nhiên, có một số hạn chế kỹ thuật với DLSS 3. Về cơ bản, DLSS chèn một khung hình do AI tạo vào giữa hai khung hình thực và khung hình AI đó được vẽ dựa trên sự khác biệt giữa hai khung hình thực. Đương nhiên, điều này có nghĩa là GPU không thể hiển thị cho bạn khung hình thực thứ hai trước khi bạn nhìn thấy khung hình do AI tạo ra, đó là lý do tại sao độ trễ cao hơn rất nhiều với DLSS 3. Đây là lý do tại sao Nvidia Reflex cũng cần được bật cho DLSS 3 để hoạt động.
Hạn chế lớn khác của DLSS 3 chỉ đơn giản là các khung hình do AI tạo ra có lỗi và các lỗi hình ảnh kỳ lạ. Trong thử nghiệm của mình, chúng tôi nhận thấy rằng có sự giảm chất lượng chung khi bật DLSS 3, điều này rất dễ bỏ qua khi tốc độ khung hình tăng quá cao, nhưng một số vấn đề về chất lượng rất khó bỏ qua. Đặc biệt, các yếu tố giao diện người dùng hoặc HUD bị cắt xén trong các khung hình do AI tạo ra, có lẽ là do AI hướng đến môi trường 3D chứ không phải văn bản 2D nằm trên chính trò chơi. DLSS 2 không gặp sự cố này vì giao diện người dùng được hiển thị độc lập với các phần tử 3D, không giống như DLSS 3.
Dưới đây là ảnh chụp màn hình từ Cyberpunk 2077 so sánh DLSS 3, DLSS 2 và độ phân giải gốc từ trái sang phải. Khi nói đến môi trường, cả hai cách triển khai DLSS đều tốt hơn so với bản gốc, nhưng bạn cũng có thể thấy rằng trong ảnh chụp màn hình DLSS 3 ở bên trái, điểm đánh dấu nhiệm vụ bị biến dạng và không thể đọc được văn bản. Đây thường là điều xảy ra trong các khung hình do AI tạo ra trong các trò chơi có DLSS 3.
Một mặt, DLSS 3 đẩy khung hình cao hơn và thường không có chất lượng hình ảnh kém hơn nhiều so với DLSS 2. Nhưng mặt khác, việc bật DLSS 3 khiến độ trễ rất cao so với tốc độ khung hình và có thể gây ra các lỗi hình ảnh kỳ lạ, đặc biệt là trên các thành phần UI và HUD. Việc giảm độ trễ và giảm các tạo tác hình ảnh chắc chắn sẽ là một thách thức đối với Nvidia vì đây là những sự đánh đổi cơ bản đi kèm với DLSS 3. Tuy nhiên, đối với công nghệ thế hệ đầu tiên, đây là lần thử đầu tiên tốt và hy vọng Nvidia sẽ có thể cải thiện mọi thứ với các lần lặp lại trong tương lai của DLSS 3.
DLSS 3 đang dần tiến vào nhiều trò chơi hơn. Dưới đây là những tựa game hiện đang hỗ trợ DLSS 3:
- A Plague Tale: Requiem
- Atomic Heart
- Bright Memory: Infinite
- Chernobylite
- Conqueror’s Blade
- Cyberpunk 2077
- Deliver Us Mars
- Destroy All Humans 2
- Dying Light 2
- F1 22
- FIST: Forged in Shadow Torch
- Hitman 3
- Hogwarts Legacy
- Icarus
- Jurassic World Evolution 2
- Justice
- Loopmancer
- Marauders
- Marvel’s Spider-Man Remastered
- Microsoft Flight Simulator
- Midnight Ghost Hunt
- Mount and Blade 2 Bannerlord
- Naraka Bladepoiint
- Portal RTX
- Ripout
- The Witcher 3 Wild Hunt
- Warhammer 40,000 Darktide
DLSS so với FSR so với RSR so với XeSS
AMD là đối thủ cạnh tranh lớn nhất của Nvidia khi nói đến công nghệ đồ họa. Để cạnh tranh với DLSS, AMD đã phát hành FidelityFX Super Resolution (FSR) vào năm 2021. Mặc dù đạt được cùng một mục tiêu là cải thiện hình ảnh đồng thời tăng tốc độ khung hình, nhưng FSR hoạt động hoàn toàn khác với DLSS. FSR kết xuất khung hình ở độ phân giải thấp hơn, sau đó sử dụng thuật toán nâng cấp không gian mã nguồn mở để làm cho trò chơi trông giống như đang chạy ở độ phân giải cao hơn và không tính đến dữ liệu vectơ chuyển động. DLSS sử dụng thuật toán AI để mang lại kết quả tương tự, nhưng kỹ thuật này chỉ được hỗ trợ bởi GPU RTX của chính Nvidia. Mặt khác, FSR có thể hoạt động trên bất kỳ GPU nào.
AMD FidelityFX Super Độ phân giải: Hiệu suất được tăng cường
Ngoài FSR, AMD còn có Radeon Super Resolution (RSR), đây là một kỹ thuật nâng cấp không gian sử dụng AI. Mặc dù điều này nghe có vẻ giống với DLSS, nhưng vẫn có những điểm khác biệt. RSR được xây dựng bằng thuật toán tương tự như FidelityFX Super Resolution (FSR) và là một tính năng dựa trên trình điều khiển được phân phối qua phần mềm Adrenalin của AMD. RSR nhằm mục đích lấp đầy khoảng trống mà FSR không có sẵn, vì FSR phải được triển khai ngay trong các trò chơi cụ thể. Về cơ bản, RSR sẽ hoạt động trong hầu hết mọi trò chơi, vì nó không yêu cầu các nhà phát triển triển khai nó. Đáng chú ý, FSR khả dụng trên các GPU Nvidia và AMD mới hơn, và mặt khác, RSR chỉ tương thích với các thẻ RDNA của AMD, bao gồm dòng Radeon RX 5000 và RX 6000. Sắp tới, đội hình đó sẽ được mở rộng để bao gồm RDNA 3 và GPU dòng Radeon RX 7000 của nó.
Intel cũng đang nghiên cứu công nghệ siêu lấy mẫu của riêng mình có tên là Xe Super Sampling (XeSS) và không giống như FSR hoặc DLSS, có hai phiên bản khác nhau. Cái đầu tiên sử dụng các đơn vị toán học ma trận XMX, có trong GPU Arc Alchemist mới của nó ; các đơn vị XMX này đảm nhiệm tất cả quá trình xử lý AI ở phần cứng. Phiên bản khác sử dụng hướng dẫn sản phẩm chấm vector bốn phần tử (DP4a) được chấp nhận rộng rãi, do đó loại bỏ sự phụ thuộc vào phần cứng của chính Intel và cho phép XeSS hoạt động trên GPU Nvidia và AMD.