Đối mặt với vô số nội dung do AI tạo ra, chất lượng thấp, máy chủ in sẵn của học thuật arXiv đang thắt chặt các quy tắc gửi đối với các bài báo khoa học máy tính.

Trong một thông báo vào ngày 31 tháng 10, nền tảng có ảnh hưởng này đã tuyên bố rằng danh mục Khoa học Máy tính (CS) của họ sẽ không còn chấp nhận các bài báo đánh giá hoặc báo cáo nêu quan điểm trừ khi chúng đã vượt qua đánh giá ngang hàng tại một tạp chí hoặc hội nghị được công nhận.

Động thái này được thiết kế để giảm bớt gánh nặng cho những người kiểm duyệt tình nguyện và trực tiếp đối mặt với hàng loạt bài gửi mà arXiv cho là”nhanh và dễ viết”bằng AI có tính tổng hợp nhưng thường thiếu nội dung.

Một làn sóng’Slop’do AI tạo ra

Trong nỗ lực bảo vệ chất lượng nghiên cứu, arXiv đang trực tiếp đối mặt với tác động của các mô hình ngôn ngữ lớn đối với xuất bản học thuật. Nền tảng này đã tràn ngập các bài gửi, đặc biệt là trong lĩnh vực khoa học máy tính đang phát triển nhanh chóng.

Theo tuyên bố chính thức, trang web hiện nhận được “hàng trăm bài đánh giá mỗi tháng”. Khối lượng khổng lồ của nó đã trở nên không thể quản lý được đối với hệ thống kiểm tra của nền tảng.

Nhiều bài nộp trong số này không đáp ứng được các tiêu chuẩn học thuật cơ bản. Những người điều hành arXiv nhận thấy rằng “phần lớn các bài báo đánh giá mà chúng tôi nhận được chỉ là những thư mục có chú thích, không có cuộc thảo luận thực chất nào về các vấn đề nghiên cứu mở”.

Những bài báo như vậy góp phần gây ồn ào học thuật, lãng phí thời gian của các nhà nghiên cứu khi tìm kiếm những hiểu biết mới. Việc dễ dàng sản xuất như vậy đã gây căng thẳng đáng kể cho các chuyên gia tình nguyện kiểm tra các bài báo.

Như arXiv đã giải thích, “AI sáng tạo/các mô hình ngôn ngữ lớn đã góp phần vào cơn lũ này bằng cách tạo ra các bài báo—đặc biệt là các bài báo không giới thiệu kết quả nghiên cứu mới—viết nhanh và dễ viết.”

Sự gia tăng nội dung tốn ít công sức này có nguy cơ chôn vùi nghiên cứu hợp pháp và làm giảm giá trị của nền tảng.

Các công cụ tinh vi hỗ trợ cơn lũ này cũng đang tăng lên về số lượng và khả năng. Các bài báo gần đây, chẳng hạn như bài mô tả trợ lý nghiên cứu AI đa tác nhân, chứng minh công nghệ có khả năng tự động hóa toàn bộ quá trình viết học thuật từ lên ý tưởng đến soạn thảo.

Công nghệ này khiến việc tạo ra các bài đánh giá tài liệu nghe có vẻ hợp lý nhưng cuối cùng lại trống rỗng, càng làm trầm trọng thêm vấn đề mà arXiv hiện đang cố gắng giải quyết. Yêu cầu đánh giá ngang hàng trước đóng vai trò như một bộ lọc quan trọng, giao việc kiểm soát chất lượng ban đầu cho các tạp chí và hội nghị có uy tín.

Một hệ thống đang chịu áp lực

Mặc dù thay đổi chính sách là mới nhưng vấn đề cơ bản lại không phải vậy. Quy trình bình duyệt học thuật đã gặp khó khăn trong nhiều năm dưới nền văn hóa “xuất bản hoặc diệt vong” khuyến khích số lượng hơn chất lượng.

Các chuyên gia như Satoshi Tanaka của Đại học Dược Kyoto đã lập luận rằng quy trình bình duyệt trong giới học thuật “đang gặp khủng hoảng”.

Hợp chất của cuộc khủng hoảng là số lượng tình nguyện viên còn hạn chế những người đánh giá, những người bị choáng ngợp bởi số lượng bài nộp. Sự mệt mỏi này tạo ra một lỗ hổng mà các công cụ AI, cả tốt lẫn xấu, đang bắt đầu khai thác.

arXiv trước đây từng là trung tâm của các cuộc tranh luận về AI và tính liêm chính trong học thuật. Năm ngoái, các nhà nghiên cứu thậm chí còn bị phát hiện nhúng các lệnh ẩn trong bài viết của họ để thao túng các hệ thống đánh giá do AI cung cấp, một phương pháp được gọi là tiêm nhắc.

Bằng cách che giấu hướng dẫn bằng văn bản màu trắng hoặc phông chữ cực nhỏ, các tác giả đã cố gắng đánh lừa các hệ thống tự động đưa ra phản hồi tích cực. Sự cố đó cho thấy các hệ thống tự động có thể bị lừa dễ dàng như thế nào, làm suy yếu toàn bộ quá trình xem xét.

Sự thay đổi gần đây của arXiv thậm chí còn là một nguồn gây nhầm lẫn, với một số cơ quan ban đầu báo cáo sai phạm vi của quy tắc mới.

Không phải là một chính sách mới, mà là một biện pháp thực thi cần thiết

Trích dẫn một lượng lớn hồ sơ gửi đến không thể quản lý được, các quan chức arXiv đã làm rõ rằng thay đổi này mang tính thực thi nhiều hơn hành động hơn là một chính sách mới.

Các bài đánh giá và báo cáo quan điểm chưa bao giờ là loại nội dung được chấp nhận chính thức nhưng trước đây được cho phép theo quyết định của người kiểm duyệt khi chúng có chất lượng cao và được giới học thuật quan tâm.

Sự bùng nổ gần đây về số lượng, do AI thúc đẩy, đã đơn giản khiến cách tiếp cận tùy ý đó không thể đứng vững được. Bảo vệ thời gian của những người kiểm duyệt tình nguyện này—nền tảng của hệ thống in sẵn—là điều cần thiết.

Các nguyên tắc của nền tảng arXiv nêu rõ rằng các tác giả là con người hoàn toàn chịu trách nhiệm về bất kỳ nội dung nào được tạo ra bởi các công cụ AI và cấm liệt kê AI là đồng tác giả.

Việc áp dụng phương pháp kiểm duyệt mới này cho danh mục CS là phần mở rộng hợp lý của nguyên tắc này, củng cố rằng việc xác thực do con người chỉ đạo vẫn là điều tối quan trọng. Các nhà xuất bản trong toàn ngành đang phải vật lộn với vấn đề này, tạo ra các chính sách rời rạc.

Trong khi một số nhà xuất bản cho phép hạn chế sử dụng AI, những nhà xuất bản khác như Elsevier đã cấm hoàn toàn với lý do”nguy cơ công nghệ này sẽ tạo ra các kết luận không chính xác, không đầy đủ hoặc thiên vị”.

Sắp tới, nền tảng đã chỉ ra rằng các ngành khác có thể thấy những thay đổi tương tự. Trong thông báo của mình, arXiv lưu ý: “Nếu các danh mục khác nhận thấy sự gia tăng tương tự về các bài báo đánh giá và báo cáo quan điểm do LLM viết, họ có thể chọn thay đổi phương thức kiểm duyệt của mình theo cách tương tự…”

Động thái như vậy cho thấy một sự thay đổi tiềm năng trên toàn nền tảng nếu làn sóng nội dung do AI tạo ra tiếp tục lan rộng. Nó coi động thái của arXiv không phải là một giải pháp riêng lẻ mà là một dấu hiệu tiềm năng về cách toàn bộ cộng đồng khoa học sẽ buộc phải thích ứng với những thách thức và cám dỗ của AI sáng tạo.

Categories: IT Info