
Tài liệu này giới thiệu về DeepScientist, một hệ thống agent dựa trên mô hình ngôn ngữ lớn (LLM) được thiết kế để tự động hóa quá trình khám phá khoa học, bao gồm việc tạo ý tưởng, thực hiện thử nghiệm và viết báo cáo nghiên cứu. Hệ thống này mô hình hóa nghiên cứu khoa học như một bài toán Tối ưu hóa Bayesian nhằm tìm ra các phương pháp mới vượt qua hiệu suất State-of-the-Art (SOTA) hiện tại. Các thử nghiệm chỉ ra rằng DeepScientist đạt được những tiến bộ tương đương với nhiều năm nghiên cứu của con người chỉ trong vòng hai tuần, đồng thời liên tục vượt trội hơn các phương pháp do con người thiết kế trên nhiều lĩnh vực như phát hiện văn bản AI và tăng tốc suy luận LLM. Tuy nhiên, các nhà nghiên cứu nhấn mạnh rằng tính chính trực trong học thuật là tối quan trọng, do đó họ sẽ không công khai mô-đun phân tích và báo cáo để đảm bảo con người vẫn phải giám sát và chịu trách nhiệm cuối cùng cho các kết quả khoa học do AI tạo ra.