Đại học Stanford tuyên bố tìm ra phương pháp 'lật mặt' ChatGPT - Gã khổng lồ đã lộ 'gót chân Achilles'?

SkylerNew

Chuyên viên tin tức
Thành viên BQT
Mang tên gọi DetectGPT, phương pháp này có thể giúp đối phó với dạng bài viết do những chatbot sử dụng mô hình ngôn ngữ lớn như ChatGPT tạo ra.

Việc sử dụng các mô hình ngôn ngữ lớn (LLM) đang có dấu hiệu tăng vọt thời gian gần đây trong giới công nghệ, bởi một lý do rất chính đáng là chúng thật sự tốt. Trong những ngày qua, cái tên nổi bật nhất trong số đó là ChatGPT đã trở thành chatbot yêu thích của rất nhiều người ở đủ mọi lĩnh vực khác nhau. Từ lập trình viên, nhân viên văn phòng cho tới các nhà môi giới bất động sản, tất cả đều say đắm công cụ AI này như điếu đổ. Với khả năng tổng hợp thông tin từ nhiều nguồn trên mạng internet một cách nhanh chóng, nó có thể cho người dùng các gợi ý hoặc tóm tắt công việc cần làm nhanh hơn bất cứ đồng nghiệp hay trợ lý cá nhân nào.

Nhiều ví dụ thực tế đã cho thấy nó có thể làm tốt đến mức tạo ra những bài báo hoặc nghiên cứu đủ sự rõ ràng và thuyết phục để có thể sử dụng trong lĩnh vực giáo dục hay đào tạo. Tuy nhiên, nó cũng đặt ra một vấn đề là cần có các hệ thống để phát hiện những văn bản do các công cụ AI này tạo ra để tránh các trường hợp gian lận hoặc lừa đảo.

detectgpt-167507029434991859295-1675072454700-1675072455557966494950.jpg

Không phải ai cũng thích các văn bản do AI viết ra.​

Và mới đây, một nhóm các nhà nghiên cứu tại đại học Stanford (Mỹ) đã đề xuất một phương pháp mới gọi là DetectGPT. Từ tên gọi đã có thể hình dung sự tồn tại của nó nhằm mục đích trở thành một trong những công cụ đầu tiên để phát hiện các văn bản được tạo ra bởi ChatGPT. Phương pháp này phát triển dựa trên ý tưởng đã được nhóm nghiên cứu chứng minh là văn bản do các công cụ LLM tạo ra “thường di chuyển xung quanh các vùng cụ thể của vùng cong âm trong hàm xác suất về nhật ký của mô hình”. Thông qua đó, nhóm đã phát triển một công cụ mới để đánh giá xem một văn bản có phải do máy tạo ra hay không mà không cần phải thu thập các bộ dữ liệu lớn để so sánh văn bản.

Về cơ bản phương pháp này được gọi là "zero-shot" trong lĩnh vực học máy, cho phép DetectGPT phát hiện văn bản do AI viết mà không cần biết về loại AI đã được sử dụng để tạo văn bản đó. Nó hoạt động hoàn toàn trái ngược với các phương pháp kiểm tra khác thường yêu cầu đào tạo ra một 'bộ phân loại' và sử dụng bộ dữ liệu của các đoạn văn bản thật và giả.

Nhóm đã thử nghiệm DetectGPT trên tập dữ liệu gồm các bài báo do AI tạo ra và kết quả cho thấy nó vượt trội hơn so với các phương pháp zero-shot khác trong việc phát hiện các văn bản không phải do con người sản xuất. Các thông số về cơ bản gợi ý rằng phương pháp này có thể là một cách đầy hứa hẹn để xem xét và kiểm duyệt các văn bản trong tương lai.

Quan trọng hơn cả đây là một phương pháp hoàn toàn không yêu cầu bất kỳ dữ liệu bổ sung hoặc quá trình đào tạo nào. Với việc các công cụ LLM tiếp tục phát triển và xuất hiện mới, tầm quan trọng của các hệ thống tương ứng để phát hiện văn bản do AI tạo ra sẽ ngày càng trở nên quan trọng. Và DetectGPT là một phương pháp đầy hứa hẹn có thể mang lại các tác động đáng kể trong nhiều lĩnh vực và sự phát triển hơn nữa của nó có thể mang lại lợi ích cho tất cả mọi người.

Theo Genk​
 
Bên trên