Home / Sharenewshort / 🌙 ARIS – Để Claude Code Nghiên Cứu Khoa Học Trong Khi Bạn Đang Ngủ: Công Cụ Nghiên Cứu ML Tự Động Đầy Đủ Nhất Năm 2026

🌙 ARIS – Để Claude Code Nghiên Cứu Khoa Học Trong Khi Bạn Đang Ngủ: Công Cụ Nghiên Cứu ML Tự Động Đầy Đủ Nhất Năm 2026

Bạn là một nhà nghiên cứu Machine Learning và luôn cảm thấy không đủ thời gian? Bạn mơ ước rằngAIcó thể tự đọc paper, tìm ý tưởng, chạy experiment, viết bài báo và phản biện reviewer — tất cả khi bạn đang ngủ? ARIS (Auto-claude-code-research-in-sleep) chính là câu trả lời. Đây là một hệ thống mã nguồn mở cực kỳ nhẹ, không cần database, không cần Docker, toàn bộ hoạt động chỉ dựa trên các file Markdown thuần. Bài viết này sẽ phân tích cực kỳ chi tiết mọi khía cạnh của dự án này.


1. ARIS là gì?

ARIS (viết tắt của Autonomous Research via Adversarial Multi-Agent Collaboration) là một bộ kỹ năng (skills) tùy chỉnh cho Claude Code, giúp tự động hóa phức tạp quy trình nghiên cứu khoa học thông qua hợp tác đa mô hình (cross-model collaboration). Nghĩa là:

  • Claude Code đóng vai trò người thực thi (executor) — nhanh nhẹn, linh hoạt trong việc viết code, chạy experiment.
  • GPT-5.4 xhigh (thông qua Codex MCP) đóng vai trò người đánh giá (reviewer) — chậm nhưng kỹ lưỡng, nghiêm khắc trong việc chỉ ra điểm yếu.

Tại sao không dùng một mô hình duy nhất tự đánh giá? Tác giả giải thích rất rõ: khi một mô hình tự review chính nó (self-play), dễ rơi vào “điểm mù” (local minima) — mô hình không phát hiện được sai sót do chúng được tạo ra bởi chính nó. Việc dùng hai mô hình đối kháng (adversarial) giúp phát hiện nhiều lỗ hổng hơn, giống như cách cờ vây hai người chơi tiến tới cân bằng Nash nhanh hơn nhiều người chơi.

Hệ thống hoạt động theo triết lý: ARIS là phương pháp luận, không phải nền tảng — mọi kỹ năng chỉ là file SKILL.md đơn giản, có thể dùng trên Claude Code, Codex CLI, Cursor, Trae, Antigravity, Windsurf hay bất kỳ AI agent nào khác.


2. Các Workflow Chính

ARIS tổ chức toàn bộ quy trình nghiên cứu thành 4 workflow cốt lõi + 1 workflow meta, có thể dùng độc lập hoặc nối tiếp nhau thành pipeline hoàn chỉnh.

ARIS Workflow Overview

2.1 Workflow 1: Khám Phá Ý Tưởng & Cổ Sự Phương Pháp (/idea-discovery)

Mục tiêu: “Trạng thái nghệ thuật hiện tại ra sao? Khoảng trống ở đâu? Giải quyết thế nào?”

Đây là workflow bắt đầu nếu bạn chỉ có một hướng nghiên cứu chung chung, chưa có ý tưởng cụ thể. Các bước diễn ra:

📚 /research-lit    →   /idea-creator   →   /novelty-check
   (tìm papers)       (8-12 ý tưởng)     (kiểm tra mới)
         │                   │                   │
         ▼                   ▼                   ▼
   ┌──────────┐      ┌──────────┐        ┌──────────┐
   │ Quét     │─────▶│ Sinh     │───────▶│ Kiểm tra │
   │ papers   │      │ ý tưởng  │        │ tính mới │
   │ cục bộ + │      │ 8-12 cái │        │          │
   │ tìm kiếm │      │ & xếp    │        │          │
   └──────────┘      │ hạng     │        └──────────┘
                     └──────────┘              │
                            │                  ▼
                  /research-refine    ┌──────────┐
                  (tinh chỉnh)        │ LLM bên  │
                       │              │ ngoài đa │
                       ▼              │ giá      │
                ┌──────────┐          └──────────┘
                │ Lặp lại  │◀──────────────┘
                │ đến khi  │
                │ score≥9  │
                └──────────┘

Chi tiết từng bước:

  • /research-lit: Tìm kiếm tài liệu đa nguồn — Zotero, Obsidian, PDF cục bộ, arXiv API, Semantic Scholar, DeepXiv, Exa AI web search. Có thể tải PDF từ arXiv nếu bật tùy chọn.
  • /idea-creator: Brainstorm 8-12 ý tưởng cụ thể, lọc theo tính khả thi, chi phí tính toán, pilot trên GPU.
  • /novelty-check: Xác minh tính mới của ý tưởng bằng cách so sánh với tài liệu gần đây + cross-check bằng GPT-5.4.
  • /research-refine: Cổ sự phương pháp — biến ý tưởng mơ hồ thành đề xuất có bài toán cụ thể, lặp lại đến khi đạt điểm ≥ 9/10.
  • /experiment-plan: Tạo lộ trình experiment theo claim-driven, bao gồm ablation, ngân sách GPU, thứ tự chạy.

Lệnh tắt: /idea-discovery "hướng nghiên cứu của bạn"


2.2 Workflow 1.5: Cầu Nối Experiment (/experiment-bridge)

Mục tiêu: “Tôi có kế hoạch rồi. Giờ code nó, triển khai và thu kết quả.”

EXPERIMENT_PLAN.md
       │
       ▼
┌──────────┐    ┌──────────┐    ┌──────────┐
│ Claude   │───▶│ GPT-5.4  │───▶│ Sanity   │
│ Code     │    │ xhigh    │    │ Check    │
│ viết     │    │ review   │    │ (1 GPU)  │
│ code     │    │ code     │    │          │
└──────────┘    └──────────┘    └──────────┘
                                      │
                                      ▼
┌──────────┐    ┌──────────┐    ┌──────────┐
│ Thu      │◀───│ Theo dõi │◀───│ Triển    │
│ kết quả  │    │ tiến độ  │    │ khai GPU │
└──────────┘    │ (+ W&B)  │    └──────────┘
                └──────────┘

Khi GPT-5.4 reviewer phát hiện lỗi logic trong code trước khi tốn giờ chạy GPU — đây là tính năng code review mặc định bật. Sau đó, experiment nhỏ nhất chạy trước (sanity check) để phát hiện lỗi runtime, rồi mới triển khai toàn bộ.

ARIS hỗ trợ 3 chế độ GPU:

  • local: GPU trên máy hiện tại
  • remote: Máy GPU qua SSH (cấu hình trong CLAUDE.md)
  • vast: Thuê GPU từ Vast.ai theo yêu cầu — ARIS tự phân tích task, tìm GPU rẻ nhất phù hợp, tự thuê → thiết lập → chạy → thu kết quả → hủy.

2.3 Workflow 2: Vòng Lặp Tự Động Đánh Giá & Sửa (/auto-review-loop)

Mục tiêu: “Review bài của tôi, sửa những gì sai, lặp lại đến khi tốt.”

Đây là workflow cốt lõi — chạy trong khi bạn ngủ. GPT-5.4 đánh giá → phát hiện điểm yếu → đề xuất experiment → Claude Code viết script, triển khai lên GPU, theo dõi kết quả, viết lại bài — tất cả tự động.

Kết quả thực tế từ một lần chạy qua đêm:

Round Điểm Điều gì xảy ra
Initial 5.0/10 Borderline reject
Round 1 6.5/10 Thêm metrics chuẩn, phát hiện decoupling metric
Round 2 6.8/10 Claim chính không tái tạo được, xoay hướng narrative
Round 3 7.0/10 Nghiên cứu seed lớn phủ nhận claim cải thiện chính
Round 4 7.5/10 ✅ Bằng chứng chẩn đoán vững chắc → sẵn sàng nộp

Tổng cộng 20+ experiment GPU đã chạy tự động, narrative được viết lại, các claim không còn đúng đã bị loại bỏ — hoàn toàn không cần con người can thiệp.

Các tính năng an toàn:

  • 🔒 MAX_ROUNDS = 4 — không lặp vô hạn
  • ⏱️ Experiment > 4 GPU-hour bị bỏ qua, gắn cờ để xử lý sau
  • 🧠 Ưu tiên đổi cách diễn đạt (“reframing”) thay vì chạy experiment mới khi cả hai đều giải quyết được vấn đề
  • 🪞 Cấm che giấu điểm yếu để tăng điểm giả
  • 🔧 Phải sửa thật trước khi review lại
  • 💾 Dùng REVIEW_STATE.json để khôi phục nếu context window đầy giữa chừng

Mức độ đánh giá (Reviewer Difficulty):

Mức độ Chi tiết Khi nào dùng
medium (mặc định) Review MCP tiêu chuẩn Workflow bình thường
hard + Reviewer Memory (GPT theo dõi nghi ngờ qua các vòng) + Debate Protocol (Claude phản biện lại, GPT phán quyết) Muốn feedback khắc nghiệt hơn
nightmare + GPT đọc trực tiếp repo qua `codex exec` (Claude không thể che giấu gì) + adversarial verification Chuẩn bị nộp journal/hội nghị top

2.4 Workflow 3: Pipeline Viết Bài Báo (/paper-writing)

Mục tiêu: “Biến bản narrative nghiên cứu thành PDF sẵn sàng nộp.”

Yêu cầu: môi trường LaTeX cục bộ (latexmk + pdfinfo).

NARRATIVE_REPORT.md → PAPER_PLAN.md → paper/ (LaTeX + PDF)

Các bước chi tiết:

  1. /paper-plan: Tạo Claims-Evidence Matrix, cấu trúc section, kế hoạch hình vẽ, khung trích dẫn
  2. /paper-figure: Tạo biểu đồ matplotlib/seaborn chất lượng xuất bản + bảng so sánh LaTeX từ JSON/CSV
  3. /paper-illustration: Sơ đồ kiến trúc AI-generated qua Gemini (mặc định), hoặc Mermaid (miễn phí), hoặc bỏ qua
  4. /paper-write: Sinh LaTeX section-by-section cho ICLR/NeurIPS/ICML. Trích dẫn thật từ DBLP/CrossRef (anti-hallucination)
  5. /paper-compile: Compile LaTeX → PDF, tự sửa lỗi, kiểm tra giới hạn trang
  6. /auto-paper-improvement-loop: 2 vòng review nội dung + kiểm tra format (từ 4/10 → 8.5/10)

Kết quả test thực tế — một bài lý thuyết ICLR 2026 (7 sections, 29 trích dẫn, 4 hình, 2 bảng) từ một file NARRATIVE_REPORT.md duy nhất — 0 lỗi compile, 0 undefined reference.

Score progression thực tế:

Round Điểm Thay đổi chính
Round 0 4/10 (nội dung) Baseline
Round 1 6/10 Sửa assumption, làm mềm claims, đổi notation
Round 2 7/10 Thêm synthetic validation, strengthens limitations
Round 3 5→8.5/10 (format) Remove hero fig, nén conclusion, chuyển sang appendix, sửa overfull hbox

Sau khi được chấp nhận, ARIS còn hỗ trợ:

  • /paper-slides: Sinh slide Beamer PDF + PPTX + speaker notes + chuẩn bị Q&A
  • /paper-poster: Sinh poster hội nghị A0/A1 PDF + PPTX + SVG

2.5 Workflow 4: Rebuttal — Phản Biện An Toàn (/rebuttal)

Mục tiêu: “Reviewer đã chấm. Giúp tôi viết rebuttal an toàn, có căn cứ.”

7 giai đoạn:

  1. Parse — chuẩn hóa reviews, xác thực rules của venue (giới hạn ký tự, text-only…)
  2. Atomize — chia mỗi review thành issue cards (loại, mức độ nghiêm trọng, thái độ reviewer)
  3. Strategize — chủ đề toàn cầu, ưu tiên per-reviewer, ngân sách ký tự
  4. Evidence sprint — nếu auto_experiment: true, tự chạy experiment bổ sung qua /experiment-bridge
  5. Draft — opener toàn cầu + phản hồi per-reviewer theo số + closing cho meta-reviewer
  6. Safety check — 6 lints: coverage, provenance, commitment, tone, consistency, limit
  7. GPT-5.4 stress test — review nội bộ hoài nghi bản nháp → Finalize

3 cổng an toàn — rebuttal sẽ KHÔNG finalize nếu bất kỳ cổng nào thất bại:

  • 🔒 Provenance — mọi claim phải map đến paper/review/kết quả được user xác nhận. Không bịa.
  • 🔒 Commitment — mọi lời hứa phải được user phê duyệt. Không hứa quá mức.
  • 🔒 Coverage — mọi mối bận tâm của reviewer phải được theo dõi. Không bỏ sót.

Hai đầu ra: PASTE_READY.txt (đếm ký tự chính xác) + REBUTTAL_DRAFT_rich.md (bản mở rộng để chỉnh sửa thủ công).


2.6 Workflow M: Meta-Optimize — ARIS Tự Tối Ưu Chính Nó (/meta-optimize)

Khác với W1-W4 tối ưu artifacts (papers, code, experiments), Workflow M tối ưu bản thân ARIS — các file SKILL.md, tham số mặc định, quy tắc hội tụ.

Cách hoạt động:

  1. Ghi log thụ động — Claude Code hooks ghi lại mọi skill invocation, tool call, failure, parameter override, user prompt
  2. Phân tích pattern/meta-optimize đọc log và phát hiện: tham số bị override nhiều nhất, tools thường thất bại, điểm review dừng ở đâu, sửa chữa thủ công của user
  3. Đề xuất patch — tạo diff tối thiểu cho SKILL.md với lý do dựa trên dữ liệu
  4. Reviewer gate — GPT-5.4 xhigh review mỗi patch
  5. User approval — chỉ áp dụng khi user đồng ý

3. Nhiều Mô Hình Linh Hoạt

ARIS không khóa bạn vào Claude + GPT. Bạn có thể kết hợp bất kỳ mô hình nào tương thích OpenAI API:

Executor Reviewer Cần Claude API? Cần OpenAI API?
Claude Opus/Sonnet ⭐ GPT-5.4 (Codex MCP)
GLM-5 (Z.ai) GPT-5.4 Không
GLM-5 MiniMax-M2.7 Không Không
DeepSeek-V3.1/Qwen3-Coder DeepSeek-R1/Qwen3-235B Không Không
Codex CLI (GPT-5.4) Claude Code CLI (claude-review) Không* Không*
Antigravity GPT-5.4 hoặc bất kỳ qua llm-chat Không Tùy chọn

Và nhiều tổ hợp khác (Kimi, LongCat, Gemini review…). Thậm chí hỗ trợ ModelScope miễn phí — 2000 calls/ngày, không phí, không khóa.


4. Research Wiki — Bộ Nhớ Nghiên Cứu Liên Tục

“Ngừng tái khám phá. Bắt đầu tích lũy.” — cảm hứng từ LLM Wiki của Karpathy.

Khi bật Research Wiki (/research-wiki init), ARIS tích lũy kiến thức qua toàn bộ vòng đời nghiên cứu:

4 loại thực thể:

Thực thể Lưu trữ Ví dụ
📄 Paper Tóm tắt cấu trúc: thesis, method, limitations paper:chen2025_factorized_gap
💡 Idea Giả thuyết, trạng thái (proposed/failed/succeeded), lý do thất bại idea:001
🧪 Experiment Metrics, verdict, phần cứng, thời lượng exp:001
📋 Claim Mệnh đề testable + trạng thái evidence claim:C1

Tính năng học hỏi xoắn ốc (Spiral Learning):

  • Round 1: Đọc 15 papers → ý tưởng A → experiment → THẤT BẠI → wiki ghi “A thất bại do OOM”
  • Round 2: /idea-creator đọc wiki → thấy A thất bại → sinh ý tưởng D (tránh bẫy A) → THÀNH CÔNG MỘT PHẦN
  • Round 3: /idea-creator biết A thất bại + D thành công một phần → sinh ý tưởng F → THÀNH CÔNG 🎉

Ý tưởng thất bạiký ức giá trị nhất — nó giúp ARIS không lặp lại sai lầm.


5. Tích Hợp Đa Nền Tảng & Công Cụ

5.1 IDE/Agent hỗ trợ

  • Claude Code — nền tảng chính
  • Codex CLI — bộ kỹ năng đồng bộ đầy đủ
  • Cursor — hoạt động với @-reference skills + MCP
  • Trae (ByteDance AI IDE) — có hướng dẫn riêng
  • Antigravity (Google’s agent-first IDE) — hỗ trợ Claude Opus 4.6 / Gemini 3.1 Pro
  • OpenClaw — không cần Claude Code CLI

5.2 Tích hợp Zotero

Tìm kiếm thư viện Zotero, đọc annotations/highlights, xuất BibTeX — trước khi tìm trên web. Cài qua zotero-mcp.

5.3 Tích hợp Obsidian

Tìm kiếm vault theo topic, tag, wikilink. Cài qua mcpvault.

5.4 Thông báo Feishu/Lark

3 chế độ: off (mặc định), push (webhook, cảnh báo mobile), interactive (chat hai chiều — approve/reject từ Feishu).

5.5 GPU Server

  • Local GPU: Chạy trực tiếp
  • Remote SSH: Cấu hình máy server trong CLAUDE.md
  • Vast.ai: Tự thuê, tự chạy, tự hủy
  • Modal: Serverless GPU, scale-to-zero, $30/tháng gói free

6. Mức Độ Nỗ Lực (Effort Levels)

Mỗi skill chấp nhận tham số --effort:

Level Tokens Phù hợp Chi tiết
lite ~0.4x Khám phá nhanh, tiết kiệm budget Ít papers, ý tưởng, rounds. Độ sâu tối thiểu.
balanced 1x Workflow bình thường (mặc định) Hành vi hiện tại. Không thay đổi gì.
max ~2.5x Chuẩn bị nộp bài nghiêm túc Nhiều papers hơn, review sâu hơn, nhiều ablation hơn.
beast ~5-8x Sprint nộp venue top Mọi nút vặn tối đa. Không giới hạn chi phí.

Cái KHÔNG bao giờ thay đổi bất kể effort:

  • Codex reasoning: luôn xhigh
  • DBLP/CrossRef citations: luôn bật
  • Reviewer independence: luôn bật
  • Experiment integrity: luôn bật

Ví dụ so sánh chi tiết theo effort:

Skill Chiều lite balanced max beast
research-lit papers 6-8 10-15 18-25 40-50
idea-creator ideas 4-6 8-12 12-16 20-30
auto-review-loop rounds 2 3-4 6 8+
rebuttal stress tests 0-1 1 2 3

7. Danh Sách Toàn Bộ 31 Skills

Full Pipeline

Skill Mô tả Codex MCP?
🏗️ research-pipeline End-to-end: Workflow 1 → 1.5 → 2 → 3

Workflow 1: Idea Discovery

Skill Mô tả Codex MCP?
🔭 idea-discovery Orchestrator — chạy tất cả skills dưới đây liên tiếp
├ 📚 research-lit Tìm kiếm tài liệu đa nguồn Không
├ 💡 idea-creator Brainstorm 8-12 ý tưởng, lọc, pilot GPU, xếp hạng
├ 🔍 novelty-check Kiểm tra tính mới so với tài liệu gần đây
├ 🔬 research-review Review sâu một vòng từ LLM bên ngoài
└ 🧭 research-refine-pipeline Refine method + plan experiments liên tiếp

Workflow 1.5: Experiment Bridge

Skill Mô tả Codex MCP?
🔗 experiment-bridge Đọc plan → code → sanity check → deploy GPU → thu kết quả Không
├ 🚀 run-experiment Deploy lên local/remote/Vast.ai GPU Không
├ 👀 monitor-experiment Theo dõi, thu kết quả Không
└ ☁️ vast-gpu Quản lý GPU Vast.ai theo yêu cầu Không

Workflow 2: Auto Research Loop

Skill Mô tả Codex MCP?
🔁 auto-review-loop Review → fix → re-review (tối đa 4 rounds)
├ 🔬 research-review Review sâu từ LLM bên ngoài
├ 🔍 novelty-check Kiểm tra tính mới khi reviewer đề xuất hướng mới
├ 🚀 run-experiment Deploy experiments lên GPU Không
├ 📊 analyze-results Phân tích kết quả, tính thống kê, sinh insights Không
└ 👀 monitor-experiment Theo dõi experiment đang chạy Không
🔁 auto-review-loop-llm Giống trên nhưng dùng bất kỳ API tương thích OpenAI Không

Workflow 3: Paper Writing

Skill Mô tả Codex MCP?
📝 paper-writing Orchestrator — chạy tất cả skills dưới đây
├ 📐 paper-plan Claims-evidence matrix, cấu trúc section, kế hoạch hình vẽ
├ 📊 paper-figure Biểu đồ matplotlib/seaborn + bảng LaTeX Tùy chọn
├ 🎨 paper-illustration Sơ đồ kiến trúc AI qua Gemini Gemini API
├ ✍️ paper-write Sinh LaTeX section-by-section, BibTeX thật từ DBLP/CrossRef
├ 🔨 paper-compile Compile LaTeX → PDF, tự sửa lỗi Không
└ 🔄 auto-paper-improvement-loop 2 vòng review nội dung + kiểm tra format

Workflow 4: Rebuttal

Skill Mô tả Codex MCP?
📝 rebuttal Parse → atomize → strategy → draft → safety → stress test → finalize → follow-up

Standalone / Utility Skills

Skill Mô tả Codex MCP?
📄 arxiv Tìm kiếm, tải và tóm tắt arXiv papers Không
🔎 semantic-scholar Tìm papers đã publish qua Semantic Scholar API Không
📚 deepxiv Truy xuất paper phân cấp qua DeepXiv CLI
🔎 exa-search AI-powered web search qua Exa
🎨 pixel-art Sinh pixel art SVG cho READMEs, slides Không
📱 feishu-notify Thông báo Feishu/Lark Không

8. Cài Đặt & Sử Dụng Nhanh

Cài đặt

# 1. Clone repo
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
mkdir -p ~/.claude/skills/
cp -r Auto-claude-code-research-in-sleep/skills/* ~/.claude/skills/

# 2. Cài Codex MCP (cho review skills)
npm install -g @openai/codex
codex setup                    # chọn model gpt-5.4
claude mcp add codex -s user -- codex mcp-server

# 3. Chạy
claude

Cập nhật thông minh

cd Auto-claude-code-research-in-sleep && git pull
bash tools/smart_update.sh          # dry-run: xem thay đổi
bash tools/smart_update.sh --apply  # áp dụng

smart_update.sh so sánh skills cục bộ với upstream, phát hiện tùy chỉnh cá nhân (đường dẫn server, API keys), chỉ cập nhật những skill an toàn.

Các lệnh chính

# Workflow 1: Khám phá ý tưởng
/idea-discovery "hướng nghiên cứu"

# Workflow 1.5: Cầu nối experiment
/experiment-bridge

# Workflow 2: Vòng lặp tự động
/auto-review-loop "chủ đề paper"

# Workflow 3: Viết bài
/paper-writing "NARRATIVE_REPORT.md"

# Workflow 4: Rebuttal
/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000

# Pipeline đầy đủ
/research-pipeline "hướng nghiên cứu"

# Bật Research Wiki
/research-wiki init

# Meta-optimize
/meta-optimize

# Targeted mode — cải thiện paper cụ thể
/research-pipeline "improve method X" — ref paper: https://arxiv.org/abs/2406.04329, base repo: https://github.com/org/project

# Rebuttal mode
/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000

9. Community Papers — Bài Báo Thực Tế Được Xây Dựng Với ARIS

Paper Điểm Venue Stack
CS Paper 8/10 “clear accept” CS Conference Claude Code + GPT-5.4
AAAI Paper 7/10 “good paper, accept” AAAI 2026 Main Technical Pure Codex CLI
UAV-CC Under review IEEE TGRS Claude Opus 4.6 + Codex 5.4 xhigh + Cursor

10. Tính Năng Đặc Biệt Khác

/experiment-audit

Cross-model verification tính toàn vẹn experiment. GPT-5.4 đọc eval scripts và kết quả, kiểm tra ground truth giả, self-normalized scores, phantom results, scope inflation. Tính năng advisory — cảnh báo lớn, không chặn.

Codex Plugin Integration

Các tính năng bổ sung khi cài codex-plugin-cc:

  • /codex:review — Review code experiment trước GPU deployment
  • /codex:adversarial-review — Adversarial code review tìm edge cases
  • /codex:rescue — Auto-debug khi experiment hoặc LaTeX compile thất bại sau 2 lần thử, Codex chẩn đoán độc lập

Human-in-the-Loop

Mọi workflow đều hỗ trợ checkpoint tại quyết định quan trọng. AUTO_PROCEED=true cho tự động hoàn toàn, false để phê duyệt từng bước. Có thể kết hợp --human checkpoint: true để tạm dừng sau mỗi vòng review và đưa hướng dẫn tùy chỉnh.

Anti-Hallucination Citations

Workflow 3 (paper writing) fetches BibTeX thật từ DBLP/CrossRef thay vì LLM tự tạo — loại bỏ trích dẫn ảo. Bật mặc định, không cần cài thêm gì.

De-AI Polish

Tự động loại bỏ pattern viết AI (delve, pivotal, landscape…) trong paper.


11. Kiến Trúc Tổng Thể & Triết Lý

Full Pipeline:
/research-lit → /idea-creator → /novelty-check → /research-refine → /experiment-bridge
→ /auto-review-loop → /paper-writing → submit → /rebuttal → accept! 🎉

📚 research-wiki (persistent memory)
   ↕ reads before ideation, writes after every stage, failed ideas = anti-repetition memory

🧬 /meta-optimize (Workflow M — runs independently, improves ARIS itself)
   ↑ reads .aris/meta/events.jsonl

Những gì ARIS KHÔNG thay thế:

“These tools accelerate research, but they don’t replace your own critical thinking. Always review generated ideas with your domain expertise, question the assumptions, and make the final call yourself. The best research comes from human insight + AI execution, not full autopilot.”


Tổng Kết

ARIS là một hệ thống nghiên cứu tự động mở phi thường — nhẹ hơn bất kỳ framework nào (chỉ file Markdown), linh hoạt hơn (chạy trên bất kỳ IDE/agent nào), và mạnh mẽ hơn (hợp tác đa mô hình đối kháng). Nó không chỉ giúp bạn viết code hay chạy experiment — nó bao phủ toàn bộ vòng đời nghiên cứu từ ý tưởng đến rebuttal, và thậm chí tự tối ưu chính nó qua meta-optimization.


Source link: ARIS – Auto-claude-code-research-in-sleep

Leave a Reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *