นักวิจัยนำเสนอเฟรมเวิร์ก RMA (Research Math Agents) ซึ่งเป็นระบบเอเจนต์ที่มุ่งเน้นการแก้ปัญหาคณิตศาสตร์ระดับงานวิจัย (research-level) ซึ่งมีความยากกว่าโจทย์การแข่งขันทั่วไป ระบบนี้ใช้การแบ่งบทบาทเอเจนต์ออกเป็นกลุ่มวิเคราะห์, ค้นหาวรรณกรรม, เปรียบเทียบ, และตรวจสอบ (verifier) โดยทำงานร่วมกันผ่านหน่วยความจำที่มีโครงสร้าง
หัวใจสำคัญของ RMA คือการทำงานแบบหลายรอบ (multi-round workflow) ที่เอเจนต์จะสร้างข้อเสนอและรับคำติชมเพื่อนำไปปรับปรุงบทพิสูจน์ให้ดีขึ้น จากการทดสอบบนเบนช์มาร์ก First Proof พบว่า RMA สามารถแก้โจทย์ระดับงานวิจัยได้ถึง 8 ใน 10 ข้อ ซึ่งรวมถึงปัญหาที่โมเดลระดับสูงอย่าง GPT-5.2R ยังไม่สามารถแก้ได้ โดยให้ผลลัพธ์ที่มีความสมเหตุสมผลเชิงตรรกะและอ่านเข้าใจง่ายกว่า