Thông báo ngày 25/9 của OpenAI đã chỉ ra rằng các tính năng này sẽ được thêm vào các phiên bản trả phí của dịch vụ ChatGPT. Điều này cho phép người dùng tương tác với trí tuệ nhân tạo và thậm chí cho phép trí tuệ nhân tạo xem những gì họ đang nói. OpenAI nhấn mạnh rằng: "Âm thanh và hình ảnh mở ra nhiều ứng dụng cho ChatGPT trong cuộc sống".
Biểu tượng của OpenAI và ChatGPT. Ảnh: AFP/TTXVN
OpenAI đã đề xuất rằng người dùng có thể chụp ảnh một địa danh trong khi du lịch và trò chuyện trực tiếp với ChatGPT về những điều thú vị tại địa điểm đó. Họ cũng có thể chụp ảnh nội dung trong tủ lạnh để ChatGPT đề xuất công thức bữa ăn hoặc chụp ảnh bài toán Toán của con để nhận được lời giải.
Theo OpenAI, tính năng này sẽ được trải nghiệm bởi người dùng ChatGPT Plus và Enterprise trong vài tuần tới. Dự án cũng đang được phát triển cho hệ điều hành của điện thoại thông minh Apple và Google.
ChatGPT, một công cụ sáng tạo của OpenAI, cho biết: "Bây giờ, bạn có thể sử dụng giọng nói để trò chuyện với trợ lý của mình một cách dễ dàng. Bạn có thể nói chuyện với công cụ này khi bạn đang di chuyển, yêu cầu kể một câu chuyện trước khi đi ngủ cho con bạn, hoặc để công cụ này giúp bạn giải quyết một cuộc tranh luận trên bàn ăn".
OpenAI cũng đã hợp tác với các diễn viên lồng tiếng để tạo ra các tương tác bằng giọng nói qua ChatGPT trở nên thực tế và sinh động hơn.
Các chương trình AI sinh sản của OpenAI đã thu hút sự chú ý vào cuối năm ngoái, khi ChatGPT có khả năng tạo ra các bài tiểu luận, bài thơ và cuộc trò chuyện từ các gợi ý ngắn gọn.
Ngoài OpenAI, nhiều "gã khổng lồ" công nghệ như Google, Meta và Microsoft cũng đang cố gắng phát triển AI, trong khi đồng thời đề phòng những rủi ro tiềm tàng của công nghệ này, như việc tạo ra thông tin sai lệch và hỗ trợ tội phạm mạng.
Trong thông báo ngày 25/9, Spotify - nền tảng phát nhạc trực tuyến có trụ sở tại Thụy Điển, đã thông báo rằng họ đang sử dụng công nghệ từ OpenAI để dịch podcast sang nhiều ngôn ngữ khác nhau, trong khi vẫn giữ nguyên ngôn ngữ của người nói gốc.
Ông Ziad Sultan, Phó Chủ tịch phụ trách cá nhân hóa của Spotify, cho biết: "Voice Translation, bằng cách kết hợp giọng nói của chính người sáng tạo, mang đến khả năng cho người nghe trên toàn cầu khám phá và lấy cảm hứng từ các podcast mới một cách chân thực hơn."
Theo Spotify, trong thời gian sắp tới, công ty sẽ phát hành các podcast tiếng Anh đã được dịch sang tiếng Tây Ban Nha, tiếng Pháp và tiếng Đức.
OpenAI đã cho ra mắt phiên bản mới của Dall-E, tích hợp ChatGPT.