Các mô hình AI hình ảnh như Midjourney, Stable Diffusion đang làm đe dọa đến việc thiết kế và đồ họa hình ảnh khi người dùng chỉ cần nhập từ khóa mong muốn để có được các hình ảnh nghệ thuật hoặc thiết kế vừa ý. Tuy nhiên, với những người làm nghề thiết kế đồ vật 3D, họ vẫn có thể thở phào nhẹ nhõm vì các công cụ AI này chỉ có thể tạo ra các hình ảnh 2D. Với sự ra mắt của mô hình AI mới từ nhà sản xuất chip đồ họa Nvidia, người ta có thể tạo ra các cấu trúc 3D chi tiết từ một đoạn video bình thường, ngay cả khi nó được quay bằng smartphone, giúp giảm bớt gánh nặng công việc của các nhà thiết kế.
Nvidia, nhà sản xuất chip được hưởng lợi nhiều nhất từ làn sóng bùng nổ các công cụ AI tạo sinh mới, đang tận dụng cơn sốt này để phát triển mô hình AI Neuralangelo mới. Điều đáng chú ý là công cụ này không chỉ tạo ra các sản phẩm đồ họa mà còn tạo nên các bản sao của vật thể dưới dạng 3D từ những đoạn video 2D, cho dù đó là các tác phẩm điêu khắc cổ điển, xe tải bình thường hay các tòa nhà. Nvidia muốn các công cụ phần mềm của mình góp phần tạo nên cuộc cách mạng của ngành công nghiệp.
Neralangelo hoạt động bằng cách lựa chọn một số khung hình của đối tượng từ các góc độ khác nhau trong đoạn video, từ đó thu được các thông tin về kích thước, hình dạng và độ sâu của đối tượng. Sau đó, nó sẽ tạo ra một bản mô tả 3D thô của đối tượng trước khi được tối ưu hóa để tái tạo lại các chi tiết của vật thể trong thực tế. Theo công ty, mô hình mới này đã áp dụng công nghệ từ một mô hình cũ của họ có tên Instant NeRF, cho phép ghi lại chính xác các chi tiết của bất kỳ vật thể nào mà người dùng muốn tái tạo lại dưới dạng 3D. Những chi tiết này bao gồm kết cấu, hoa văn và các biến thể màu sắc của vật thể đó.
Nvidia cho biết, Neuralangelo có thể tái tạo được các kết cấu rất phức tạp, chẳng hạn như độ nhám của tấm lợp mái hoặc độ nhẵn của đá cẩm thạch, với mức độ "vượt trội đáng kể so với các phương pháp trước đây." Điều đáng chú ý hơn, công cụ này có khả năng tạo ra các vật thể 3D chất lượng cao từ các đoạn video được quay bằng smartphone, giúp các nhà sáng tạo có thể dễ dàng thực hiện các dự án của mình. Theo Nvidia, công cụ của họ có thể tạo ra các hình ảnh 3D chỉ trong vòng 2 giờ.
Ming-Yu Liu, đồng tác giả trong tài liệu Neuralangelo cho biết, cuối cùng công cụ này sẽ "cho phép các nhà phát triển nhập các vật thể chi tiết – cho dù là các bức tượng nhỏ hay các tòa nhà khổng lồ - vào trong môi trường ảo của những trò chơi điện tử hoặc các bản sao kỹ thuật số với chất lượng đáng tin cậy."
Trong đoạn video giới thiệu công cụ mới của mình, Nvidia đã cho thấy khả năng của mô hình AI Neuralangelo thông qua việc tái tạo lại các khung cảnh quy mô lớn từ một đoạn phim do drone quay lại. Điều này sẽ giúp các nhà phát triển game dễ dàng tái hiện lại những địa điểm thực tế trong trò chơi của họ. Ngoài ra, công cụ này còn có tiềm năng ứng dụng trong các lĩnh vực khác như robot, trải nghiệm thực tế ảo, kiến trúc hoặc nghệ thuật.
Không phải Apple hay Microsoft, đây mới là công ty sẽ dẫn dắt ngành công nghệ trong 5 năm tới