Giao diện trong tiếng Việt của ChatGPT và hành trình những người đầu tiên

Giao diện trong tiếng Việt của ChatGPT và hành trình những người đầu tiên

ViGPT - ChatGPT phiên bản Việt, do VinBigdata (Tập đoàn Vingroup) phát triển, đã hoàn toàn làm chủ mô hình ngôn ngữ tiếng Việt chỉ sau 9 tháng kể từ khi ra mắt ChatGPT Sản phẩm này, giới thiệu vào tháng 12/2023, nhanh chóng thu hút sự chú ý của cộng đồng khoa học công nghệ Việt Nam

Giao diện trong tiếng Việt của ChatGPT và hành trình những người đầu tiên

Lựa chọn con đường khó để giải quyết vấn đề trí tuệ nhân tạo tại Việt Nam

Vào cuối năm 2022, ChatGPT đã tạo ra một "cú nổ lớn", mở ra cuộc đua để tiến vào lĩnh vực trí tuệ nhân tạo giữa các quốc gia và các công ty công nghệ lớn. Cộng đồng công nghệ tại Việt Nam lúc đó đang rất hăng hái, mong muốn phát triển các sản phẩm mang tính đặc trưng của Việt Nam để độc lập trong công nghệ, giảm thiểu sự phụ thuộc vào các sản phẩm quốc tế. Tuy nhiên, không phải tất cả đơn vị đều có đủ năng lực và quyết tâm để thực hiện ước muốn đó, nhưng VinBigdata lại là một ngoại lệ.

"AI tạo sinh là một bài toán khó. Các ông lớn như OpenAI hay Google cũng phải đổ rất nhiều nguồn lực và thời gian vào nghiên cứu mới có thể tạo ra những sản phẩm như chúng ta thấy. Các sản phẩm này đã rất tốt, nhưng thật ra các nhà khoa học cũng vẫn chưa hoàn toàn hiểu cơ cấu hoạt động của nó. Khi nào nó có lỗi, và lỗi sẽ như thế nào ít ai đoán trước được. Để phát triển một sản phẩm tương tự ChatGPT dành cho người Việt, trong thời gian ngắn chưa tới một năm, thì rất nhiều thử thách. Nhưng chúng tôi đã lựa chọn "liều" vì một phiên bản ChatGPT tiếng Việt nếu không phải người Việt làm thì ai làm" - GS. Vũ Hà Văn, Giám đốc khoa học VinBigdata chia sẻ.

Giao diện trong tiếng Việt của ChatGPT và hành trình những người đầu tiên

GS. Vũ Hà Văn (Giám đốc Khoa học VinBigdata) chia sẻ: phát triển ViGPT là một lựa chọn liều lĩnh, song cần thiết để giải quyết bài toán đặc trưng của người Việt.

Thực tế, ít công ty quyết định xây dựng Mô hình ngôn ngữ lớn của riêng mình từ đầu. GPT-3 của OpenAI có 175 tỷ tham số và được đào tạo trên bộ dữ liệu 45 terabyte, tiêu tốn 4,6 triệu USD. Tính toán cho thấy, số tiền phát triển GPT-4 có thể lên tới 100 triệu USD. "Với những con số khổng lồ như thế, rất khó để tìm được một công ty nào đủ sức đầu tư cho công nghệ này", TS. Nguyễn Kim Anh, Giám đốc Sản phẩm VinBigdata nói.

Để các doanh nghiệp Việt Nam có thể tiếp cận với công nghệ AI thế hệ mới, với chi phí và hạ tầng tối ưu, VinBigdata lựa chọn một hướng đi hoàn toàn khác biệt, đó là tạo ra một mô hình ngôn ngữ chỉ với 1,6 tỷ tham số, nhưng có khả năng tương đương với những mô hình ngôn ngữ lớn có nhiều tỷ tham số. "Kết quả cho thấy, với kiến trúc do chính VinBigdata tự phát triển hoàn toàn có thể tối ưu và đẩy nhanh quá trình huấn luyện mô hình ngôn ngữ, giảm chi phí hạ tầng (bao gồm chi phí huấn luyện và chi phí sử dụng), nhưng vẫn đảm bảo chất lượng của mô hình," TS. Nguyễn Kim Anh cho biết thêm.

Giao diện trong tiếng Việt của ChatGPT và hành trình những người đầu tiên

VinBigdata hi vọng tạo ra một "trợ lý ảo thông minh" có khả năng hiểu và đưa ra câu trả lời theo ngữ cảnh của người Việt.

Sau khi giải quyết vấn đề về kích thước của mô hình ngôn ngữ lớn, trong quá trình phát triển ViGPT, sau khi nghiên cứu các mô hình của nước ngoài, đội ngũ VinBigdata nhận ra một thử thách khác là "tính ảo giác", đến từ bản chất cố hữu của mô hình xác suất thống kê.

Theo đó, các mô hình ngôn ngữ lớn trên thế giới thường được huấn luyện bằng các nguồn dữ liệu tiếng Anh, dẫn đến việc chúng chưa thực sự hiểu và phản ứng đúng với ngữ cảnh và văn hóa của người Việt. Điều này dẫn đến tình trạng ảo giác khiến mô hình ngôn ngữ lớn "bịa đặt" ra câu trả lời không chính xác.

Để tìm ra lời giải tối ưu trong thời gian ngắn, đội ngũ Xử lý ngôn ngữ tự nhiên (NLP) của VinBigdata được chia thành các nhóm nhỏ, cùng phân tích, bàn bạc các ý tưởng khác nhau để tìm hướng đi cuối cùng phù hợp.

Sau cùng, chúng tôi quyết định phát triển một kiến trúc khác, không giống với phần lớn mô hình ngôn ngữ lớn hiện tại, đồng thời tiến hành đào tạo trên một bộ dữ liệu tiếng Việt tinh chỉnh có dung lượng 600GB, nhằm tạo ra một "trợ lý ảo thông minh" có khả năng hiểu và đưa ra câu trả lời theo ngữ cảnh của người Việt", TS. Nguyễn Kim Anh nói thêm.

Khát vọng của chúng tôi là xây dựng một hệ sinh thái công nghệ Việt.

Theo đánh giá từ VMLU, ViGPT đạt điểm trung bình 42,24%, xếp thứ hai sau ChatGPT (48,54%). Điều này cho phép ViGPT tìm kiếm thông tin và giải đáp câu hỏi về các chủ đề đặc trưng, đặc biệt của Việt Nam một cách nhanh chóng.

Ngoài trí tuệ nhân tạo, đội ngũ phát triển muốn tích hợp ViGPT vào các sản phẩm hàng ngày để tạo ra sự thay đổi trong cuộc sống người Việt. Điều này là động lực để VinBigdata xây dựng một hệ sinh thái các sản phẩm ngôn ngữ và tiếng nói ứng dụng ViGPT - Hệ sinh thái "Vi" bao gồm: ViChat, ViVoice, Trợ lý ảo ViVi. Các sản phẩm này có thể sử dụng cho nhiều lĩnh vực khác nhau như ô tô, ngân hàng - tài chính, bảo hiểm, giao thông vận tải và nhiều ngành nghề khác.

Khi làm công nghệ, đặc biệt là AI, chúng tôi không chỉ muốn chinh phục những hệ thống phức tạp mà còn muốn tạo ra những sản phẩm cụ thể, có ứng dụng cao, trong đó AI là yếu tố quan trọng tạo ra những thay đổi trong cuộc sống", Giám đốc Sản phẩm VinBigdata khẳng định.

Vì vậy, việc phát triển ViGPT mới chỉ là bước đầu tiên trong hành trình đưa công nghệ và dữ liệu "thuần Việt" phục vụ cuộc sống của hàng triệu người dân Việt Nam. Đại diện VinBigdata cho biết, đơn vị này đặt mục tiêu tích hợp ViGPT vào nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0, nhằm cung cấp các giải pháp vượt trội cho hệ thống tổ chức và doanh nghiệp ở nhiều quy mô và ngành nghề khác nhau.

Trước khi có ViGPT, đội ngũ chuyên gia và kỹ sư trong lĩnh vực công nghệ xử lý ngôn ngữ và tiếng nói tại VinBigdata đã thành công với việc phát triển ViVi - trợ lý ảo tiên phong toàn diện tiếng Việt (được tích hợp và triển khai trên ô tô điện VinFast, ứng dụng cư dân Vinhomes Resident và sàn thương mại điện tử Vinhomes Online). Đồng thời, họ cũng kiểm soát hoàn toàn những công nghệ tiên tiến như Sinh trắc học giọng nói (Voice Biometrics) và Nhân bản giọng nói (Voice Cloning).

Tất cả các công nghệ này đều được phát triển dựa trên cơ sở dữ liệu lên đến 3.500 terabyte, tập trung chủ yếu vào dữ liệu đặc thù của người Việt do VinBigdata đã thu thập, phân tích và tinh chỉnh. Mục tiêu chính là mang công nghệ tiên tiến của thế giới đến gần hơn với cuộc sống người Việt, thông qua dữ liệu và tri thức của họ.

ViGPT là phiên bản "ChatGPT Việt" đầu tiên dành cho người dùng cuối, được xây dựng trên cơ sở mô hình ngôn ngữ lớn tiếng Việt (LLM) do VinBigdata phát triển. ViGPT có những tính năng ưu việt và thiết kế phổ biến với nhu cầu sử dụng của người Việt, như sáng tạo nội dung, tìm kiếm thông tin, và giải đáp các câu hỏi đặc trưng của Việt Nam. Đăng ký và trải nghiệm ViGPT tại: vigpt.vinbigdata.com