Từ khi ChatGPT được ra mắt đến nay, chủ đề về trí tuệ nhân tạo đã thu hút sự chú ý toàn cầu với sự tham gia của hàng loạt người lớn trong lĩnh vực công nghệ. Đây cũng chính là điểm tập trung của AI Day 2023 – một sự kiện khoa học thường niên về trí tuệ nhân tạo – vừa được tổ chức tại Thành phố Hồ Chí Minh.
Sự kiện này cũng là nơi Công ty VinAI giới thiệu dự án "PhởGPT", một mô hình ngôn ngữ lớn mã nguồn mở tối ưu cho ngôn ngữ tiếng Việt. Trong khi các chatbot AI hay dịch vụ tạo sinh hình ảnh gần gũi với người dùng thông thường, các mô hình ngôn ngữ lớn là công nghệ nền tảng làm nên các ứng dụng thú vị này. Đây cũng chính là loại công nghệ mà những người lãnh đạo trong lĩnh vực công nghệ đang chạy đua phát triển, với các cái tên như OpenAI, Microsoft, Google, Meta, Baidu, …
VinAI đã ra mắt PhởGPT, một mô hình ngôn ngữ lớn mã nguồn mở với 7,5 tỷ tham số. Vậy PhởGPT có điểm gì khác biệt so với các mô hình ngôn ngữ lớn khác trên thị trường? Trong cuộc trò chuyện với Tổng giám đốc VinAI, ông Bùi Hải Hưng đã tiết lộ nhiều điểm độc đáo trong mô hình ngôn ngữ lớn thuần Việt này.
Thay vì chỉ được điều chỉnh từ một mô hình ngôn ngữ đã có, PhởGPT được phát triển từ đầu bởi VinAI để có hiệu suất tối ưu nhất cho ngôn ngữ Tiếng Việt.
Dự án này có 2 điểm rất đặc biệt:
Một điểm đầu tiên quan trọng là mô hình này đã được phát triển từ đầu, hoàn toàn độc lập với các mô hình ngôn ngữ khác trên thế giới. Thay vì sử dụng một mô hình ngôn ngữ có sẵn và tinh chỉnh lại, VinAI đã xây dựng PhởGPT từ đầu. Điều này cho phép đội ngũ nghiên cứu của VinAI tối ưu hóa mô hình này cho ngôn ngữ tiếng Việt theo nhiều cách khác nhau, điều mà rất khó thực hiện nếu chỉ sử dụng một mô hình từ nước ngoài và tinh chỉnh lại cho ngôn ngữ tiếng Việt.
Mô hình ngôn ngữ này có dữ liệu lớn với 7.5 tỷ tham số, được xây dựng trên nền tảng giải mã Transformer và huấn luyện từ đầu. Sử dụng những kỹ thuật tiên tiến nhất hiện có như cơ chế tập trung chớp nhoáng và ngoại suy độ dài ngữ cảnh AliBi, mô hình này không chỉ hiểu sâu hơn về ngữ cảnh mà còn tăng khả năng đối thoại và tương tác tự nhiên của PhởGPT, giúp nó trở thành một công cụ đa nhiệm và linh hoạt, có khả năng đáp ứng đa dạng các nhu cầu ngôn ngữ của người sử dụng.
Một cuộc trò chuyện giữa người dùng và PhởGPT đã được thể hiện trong một sự kiện
Điểm đặc biệt thứ hai của PhởGPT là việc nó là một dự án mã nguồn mở - khác với mô hình mã nguồn đóng như GPT-4 (mô hình nền tảng cho ChatGPT). Việc công khai mã nguồn của PhởGPT và sẵn sàng cung cấp cho mọi người, giúp tạo ra một môi trường và cộng đồng người dùng có thể phát triển các ứng dụng tùy chỉnh và độc đáo, đặc biệt là những ứng dụng đòi hỏi sự bảo mật cao mà không phụ thuộc vào nguồn từ các phần mềm sở hữu riêng.
Cách tiếp cận này cũng đang trở thành một trào lưu trên toàn cầu và đã được các hãng lớn như Meta áp dụng khi ra mắt mô hình Llama vài tháng trước.
Một điểm cần lưu ý khác là việc xây dựng mô hình ngôn ngữ lớn này diễn ra trong bối cảnh khan hiếm nguồn cung chip AI trên toàn cầu. Điều này cũng là động lực cho VinAI để tối ưu hóa việc sử dụng phần cứng trong quá trình tính toán các tác vụ AI khi xây dựng mô hình PhởGPT tiếp theo. Mục tiêu của việc tối ưu hóa là tạo ra một mô hình nhỏ gọn nhưng vẫn hiệu quả trong vận hành ứng dụng, đồng thời giúp tiết kiệm chi phí vận hành và tính toán.
Ở cuộc hội thảo, ông Hưng đã trò chuyện với CEO OpenAI, ông Sam Altman
Điều này có ý nghĩa quan trọng không chỉ đối với các doanh nghiệp Việt Nam mà còn đối với nhiều nước khác trong khu vực, vì hầu hết họ đều đang gặp khó khăn trong việc tiếp cận nguồn cung chip trí tuệ nhân tạo cũng như chi phí phát triển mô hình tính toán và chi phí vận hành. Việc tối ưu hóa các mô hình ngôn ngữ để tiết kiệm chi phí sẽ giúp các doanh nghiệp vượt qua được những rào cản về chi phí và giúp họ bắt kịp các xu hướng trong khu vực.
PhởGPT là một cú nhảy vọt đáng chú ý khi chỉ sau một năm từ khi ChatGPT và trào lưu AI tạo sinh bùng nổ toàn cầu, VinAI đã tự xây dựng được một mô hình ngôn ngữ lớn. Việc nghiên cứu, phát triển và công bố PhởGPT hôm nay sẽ tạo ra nền tảng quan trọng cho việc phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, đồng thời hỗ trợ phát triển các ứng dụng thực tế, hiệu quả và phù hợp với chiến lược phát triển AI của Chính phủ đến năm 2030.