Chatbot từ Trung Quốc tự tin mạnh hơn GPT-4 gấp 14 lần ở khía cạnh này

SkylerNew

Chuyên viên tin tức
Thành viên BQT
Baichuan, startup AI có trụ sở tại Bắc Kinh, Trung Quốc tuyên bố AI Baichuan2-192k là "mô hình mạnh mẽ nhất thế giới khi xử lý văn bản dài".

Baichuan2-192k là mô hình ngôn ngữ lớn (LLM) mới nhất của Baichuan, công ty đứng sau công cụ tìm kiếm phổ biến ở Trung Quốc Sogou. Theo nhà sáng lập Wang Xiaochuan, mô hình mới này dựa trên cửa sổ ngữ cảnh (Context Window) có thể xử lý khoảng 350.000 ký tự tiếng Trung, qua đó trở thành mô hình mạnh nhất thế giới ở thời điểm hiện tại trong việc xử lý văn bản dài.

589824_70849781239021_2164496013459456

Nhà sáng lập Baichuan, ông Wang Xiaochuan

Theo bài đăng trên WeChat, Baichuan2-192k có sức mạnh xử lý cửa sổ ngữ cảnh lớn gấp 14 lần so với GPT-4, mô hình ngôn ngữ lớn trong ChatGPT của OpenAI.
LLM có cửa sổ ngữ cảnh lớn nhất thế giới trước đó thuộc về Claude 2 của Anthropic, startup do Amazon hậu thuẫn. Mô hình này có thể chứa dữ liệu cửa sổ ngữ cảnh đạt 75.000 từ tiếng Anh, tương ứng hàng trăm trang tài liệu hoặc một cuốn sách. Nếu tuyên bố của Baichuan là đúng, LLM của công ty này đang mạnh hơn Claude 2 gần gấp 5 lần.

Theo Xiaochuan, Baichuan2-192k hữu ích cho các doanh nghiệp cần xử lý và tạo văn bản dài hàng ngày, chẳng hạn ngành pháp lý, truyền thông. tài chính. Công ty đang thử nghiệm mô hình cho một số đối tác ở phạm vi nội bộ.

Dù vậy, theo một số chuyên gia AI, việc có thể xử lý nhiều thông tin hơn không có nghĩa là mô hình AI đó tốt hơn, mà quan trọng vẫn là cách nó thực hiện các công việc được đưa ra.

Trước Baichuan, nhiều công ty Trung Quốc cũng tuyên bố mạnh miệng về các LLM của mình đã vượt ChatGPT. Ngày 31.10, Alibaba cho biết LLM Tongyi Qianwen của mình đã vượt qua GPT-3.5 của OpenAI và Llama2 của Meta. Zhipu AI, công ty khởi nghiệp do Alibaba và Tencent hậu thuẫn, tuần trước ra mắt ChatGLM3 với nhiều cải tiến, gồm tốc độ suy luận nhanh hơn, chi phí đào tạo thấp hơn.

Theo VN review​
 
Bên trên