Vào sáng ngày 28/12, VinBigdata đã chính thức giới thiệu ViGPT, được mô tả là "ChatGPT phiên bản Việt" đầu tiên dành cho người dùng cuối.
Tại sự kiện này, ông Đinh Tiến Dũng, hay còn được biết đến với biệt danh "Giáo sư Cù Trọng Xoay" và là MC của chương trình Ai là triệu phú, đã thực hiện trải nghiệm trực tiếp với ViGPT. Ông đã đặt ra nhiều câu hỏi thuộc các lĩnh vực pháp luật, văn hóa, xã hội và ViGPT đã trả lời một cách trơn tru. Không những thế, ông còn thử nghiệm ViGPT bằng việc nói một câu sai chính tả: "Hà Lội có phải Thủ đô của Việt Lam không?". Tuy nhiên, công cụ này đã nhanh chóng phát hiện lỗi và phản hồi một cách hài hước: "Sao bạn nói ngọng thế, lêu lêu".
Theo Giáo sư Vũ Hà Văn – Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigData, dù đã có nhiều mô hình ngôn ngữ hỗ trợ tiếng Việt, nhưng "không có lý gì để nước ngoài tạo ra một công cụ tốt hơn mà chúng ta không thể cạnh tranh được". Người Việt đã có thể nắm quyền chủ động. Sở hữu một mô hình ngôn ngữ lớn của Việt Nam cũng là cách để bảo tồn văn hóa và lịch sử dân tộc.
"Sản phẩm đến tay người dùng cuối cùng, lần đầu tiên chúng tôi dám đưa sản phẩm như vậy. Nói thẳng, đó là một sự liều. Nhưng đây là sự liều có tính toán, là việc cần phải thực hiện. VinBigData là công ty về dữ liệu lớn, có lợi thế về dữ liệu hơn nhiều công ty nước ngoài và cả ở Việt Nam. Chúng tôi sở hữu đội ngũ rất giỏi và tâm huyết trong lĩnh vực này", Giáo sư Vũ Hà Văn nói.
Giáo sư Vũ Hà Văn
Trong tương lai gần, VinBigdata sẽ mở cửa cho 1.000 người đầu tiên đăng ký trải nghiệm ViGPT trong vòng 15 ngày, sau đó sẽ tiến hành điều chỉnh và cập nhật. Công ty thuộc hệ sinh thái Vingroup này cũng cho biết sẽ cung cấp phiên bản cộng đồng cho các tổ chức phi lợi nhuận mà không thu phí.
VinBigdata cũng cung cấp một phiên bản dành cho cộng đồng khoa học. Ngoài ra, có một phiên bản khác được thiết kế cho doanh nghiệp với mục tiêu đảm bảo an toàn dữ liệu, giảm thiểu chi phí vận hành, tối ưu hóa và cá nhân hóa theo yêu cầu nghiệp vụ. Công nghệ học có giám sát giúp doanh nghiệp có câu trả lời chính xác nhất và giảm thiểu khả năng bịa đặt. Đồng thời, công nghệ học tăng cường giúp công cụ liên tục học từ phản hồi của người dùng.
Chúng tôi đã phát triển mô hình cho doanh nghiệp với chỉ 1,6 tỷ tham số - một con số rất nhỏ. Dữ liệu của chúng tôi bao gồm khoảng 600GB dữ liệu tiếng Việt, liên quan đến nhiều lĩnh vực như văn hóa lịch sử, bảo hiểm, ngân hàng, logistics, y tế, sức khỏe, bất động sản,… Chúng tôi đã so sánh mô hình của chúng tôi với rất nhiều mô hình khác, bao gồm ChatGPT 4, ChatGPT 3.5 cũng như nhiều mô hình khác phát triển cho tiếng Việt với 7 tỷ tham số. ViGPT bản 1,6 tỷ tham số của chúng tôi chỉ thua bản của OpenAI ở mức độ rất nhỏ", ông Nguyễn Kim Anh – CEO VinBigdata chia sẻ.
Không lâu trước đó, VinAI - một thành viên của hệ sinh thái Vingroup cũng đã công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn dành riêng cho tiếng Việt, với tên gọi là PhởGPT. Tiến sĩ Bùi Hải Hưng - Tổng Giám đốc VinAI đã trình bày về công nghệ PhởGPT, yêu cầu nền tảng này làm thơ và trả lời các câu hỏi. Ông cũng cho biết, vì đây là mã nguồn mở nên VinAI không giới hạn về tính thương mại, tất cả mọi người đều có thể sử dụng PhởGPT để phát triển ứng dụng cho riêng mình, kể cả mục đích thương mại. Đây là một nền tảng mà VinAI cung cấp cho cộng đồng để phát triển các ứng dụng liên quan đến công nghệ AI trong nước.