Gemini - Mô hình AI mới của Google và những thách thức mà nó đối mặt

Gemini - Mô hình AI mới của Google và những thách thức mà nó đối mặt

Mô hình AI Gemini của Google gây rắc rối ngay từ khi ra mắt với một đoạn clip trình diễn khả năng ấn tượng, khiến nhiều người trở nên hào hứng

Hơn một năm sau khi ChatGPT ra đời, Google đã chính thức giới thiệu mô hình AI Gemini để cạnh tranh với đối thủ của mình. Mặc dù chatbot AI Bard đã được Google ra mắt từ lâu, nhưng nền tảng công nghệ dưới mô hình vẫn chỉ là LaMDA và PaLM, mà hiệu suất của chúng không thể sánh kịp với GPT-4 của OpenAI.

Phiên bản cao cấp nhất, Gemini Ultra, được Google giới thiệu có hiệu suất vượt trội hơn cả các mô hình AI "tiên tiến nhất". Đây được chứng minh bằng việc đánh bại GPT-4 của OpenAI trong 30 trong tổng số 32 bài kiểm tra tiêu chuẩn về khả năng suy luận và hiểu biết hình ảnh.

Gemini - Mô hình AI mới của Google và những thách thức mà nó đối mặt

Tuy nhiên, việc gặp "sự cố" trong các sự kiện ra mắt sản phẩm mới dường như đã trở thành một thói quen của Google. Trước đây, chatbot Bard của họ đã thừa nhận việc Google lợi dụng vị thế độc quyền trên thị trường quảng cáo. Và hiện tại, mô hình Gemini mới ra mắt cũng đang gặp phải những tai tiếng đáng buồn không kém.

Để chứng minh cho tuyên bố của mình, Google đã trình diễn khả năng của Gemini thông qua việc công bố một đoạn video. Video này cho thấy mô hình trí tuệ nhân tạo này có khả năng trình bày theo thời gian thực những gì nó có thể nhìn thấy hoặc nghe được từ con người. Google mô tả điều này như "đa phương thức", trong đó Gemini có khả năng xử lý thông tin bằng cả văn bản, video và âm thanh. Điều này là một tính năng vượt trội của Gemini.

Tại một thời điểm trong đoạn video demo, thậm chí chatbot AI còn tạo ra một tương tác hài hước sau khi được người hướng dẫn trong video cho xem một món đồ chơi hình con vịt xanh. Lộ rõ vẻ ngạc nhiên, AI của Gemini kêu lên: "Cái quái gì vậy! Tôi vừa nói về một con vịt xanh, và bây giờ bạn đang ôm một con! Có vẻ như vịt xanh phổ biến hơn tôi nghĩ."

Tuy nhiên, vào thứ Năm vừa qua, đại diện của Google đã nói với Bloomberg rằng đoạn video demo liên quan đến việc "sử dụng các khung hình ảnh tĩnh từ đoạn phim và nhắc nhở qua văn bản" – nghĩa là quá trình tiếp nhận thông tin của AI đã được con người can thiệp và chỉnh sửa lại. Trước đó một bài đăng trên blog của Google cũng nói về cách quá trình huấn luyện nói trên được thực hiện.

AI của Google không thể tương tác và hiển thị cảm xúc thời gian thực như trong video demo. Mô hình mới Gemini hoạt động tương tự như ChatGPT, đáp ứng theo lời nhắc và hình ảnh tải lên. Mặc dù video demo Gemini được chia sẻ rộng rãi trên nền tảng Google và CEO Sundar Pichai cũng đăng tải trên tài khoản X có hơn 7 triệu người theo dõi, nhưng không có thông tin về hạn chế của khả năng của Gemini. Thay vào đó, chỉ có dòng chú thích cho biết "độ trễ đã giảm và câu trả lời của Gemini đã được rút gọn" xuất hiện trong phần mô tả của video trên YouTube.

Phó chủ tịch về Tìm kiếm tại Google DeepMind, Oriol Vinyals nói: "Mọi lời nhắc của người dùng và câu trả lời trong đoạn video đều là thật, và chỉ được rút gọn lại. Đoạn video minh họa cho những trải nghiệm đa phương thức trong Gemini có thể như thế nào."

Kể từ khi được phát hành, đoạn video demo này đã nhận được sự chú ý với Gemini. Một người dùng chia sẻ rằng Gemini chứng minh một "trí tuệ lớn hơn một phần nhỏ so với người trưởng thành."

AI Gemini: Có thể chấm bài tập học sinh, vẫn còn tình trạng 'ảo giác'