Sora AI và Công Nghệ Đằng Sau
Mới đây, OpenAI đã giới thiệu một mô hình AI đầy ấn tượng mang tên Sora, mở ra không gian sáng tạo mới trong việc tạo video từ văn bản. Sora không chỉ chuyển đổi văn bản thành video mà còn có khả năng tùy biến mạnh mẽ về bối cảnh và phong cách.
Tổng hợp video được tạo ra bởi Sora từ các câu lệnh dạng văn bản, với độ chân thực tốt đến mức khó có thể nhận ra.
Kiến Trúc Độc Đáo của Sora
Sức mạnh của Sora đến từ việc kết hợp kiến trúc diffusion và transformer. Kiến trúc diffusion, từng thành công với DALL-E 3 trong tạo ảnh từ văn bản, giờ được áp dụng vào việc tạo video, cho phép Sora tạo ra chuỗi hình ảnh động từ đầu vào ngẫu nhiên.
Video gốc quay cảnh một chiếc xe đang đi trên một con đường xuyên rừng. Nguồn: Choi Min/Twitter
Tùy Biến Độc Đáo và Ấn Tượng
Khả năng tùy biến của Sora là điểm nổi bật, cho phép người dùng thay đổi hoàn toàn bối cảnh và phong cách của video chỉ từ vài câu lệnh. Mỗi điều chỉnh mang đến một video mới, độc đáo và ấn tượng.
Chỉ bằng một câu lệnh, đoạn video trên đã có thể biến đổi thành một video hoàn toàn khác, khi chiếc xe thời hiện đại đã biến thành một chiếc xe cổ, với khung cảnh xung quanh là thành phố vào năm 1920. Nguồn: Choi Min/Twitter