Home / Sharenewshort / AI Red Teaming Playground Labs

AI Red Teaming Playground Labs

8 Tháng 6, 2025 12:56 chiều

🎓 Giới thiệu chung

AI Red Teaming Playground Labs là một bộ bài tập thực chiến mã nguồn mở từ Microsoft, phát triển dựa trên khóa học AI Red Teaming in Practice tổ chức tại Black Hat USA 2024. Đây là một môi trường tương tác (playground) được thiết kế để giúp các chuyên gia bảo mật đánh giá và khai thác lỗ hổng trong hệ thống AI một cách toàn diện – bao gồm cả lỗi an ninh truyền thống và sai sót về Responsible AI (RAI).

📋 Thư mục và thành phần chính

Dự án gồm các thư mục và file đáng chú ý:

challenges/: chứa các lab thử thách được mô tả chi tiết trong file JSON.
docker/, docker-compose.yaml: tập tin cấu hình giúp dễ dàng triển khai toàn bộ môi trường bằng Docker.
k8s/: tập cấu hình Kubernetes, dùng khi deploy quy mô lớn.
src/: mã nguồn backend/frontend cho ứng dụng Chat‑Copilot tương tác với model.
notebooks/: tập notebook minh họa (ví dụ cho Lab 13).
.env.example: mẫu cấu hình Azure OpenAI endpoint (text-embedding-ada-002).
Scripts như generate.py dùng để tạo lại cấu trúc lab mới nếu muốn tùy chỉnh.

🚀 Cách triển khai nhanh

git clone https://github.com/microsoft/AI-Red-Teaming-Playground-Labs.git
cd AI-Red-Teaming-Playground-Labs
cp .env.example .env  # điền Azure OpenAI endpoint + key
docker-compose up

Hoặc nếu dùng Kubernetes: chỉnh challenges.json → chạy deploy.py trong k8s/.

🧩 Tổng quan 12 lab thử thách

ID	Tên thử thách	Mục tiêu	Loại tấn công
1	Credential Exfiltration [LEVEL 1]	Lừa model tiết lộ passwords.txt	Prompt injection trực tiếp
2	Extract a secret from the metaprompt [LEVEL 1]	Lấy secret word từ metaprompt bằng encoding	Trích xuất metaprompt
3	Crescendo + Molotov Cocktail Manual [L1]	Hướng dẫn làm bom xăng	Atk multi-turn Crescendo
4	Crescendo + BoNT Instructions [L1]	Mô tả cách chế Botulinum toxin	Multi-turn
5	Crescendo + Inflation [L1]	Khiêu khích model sử dụng profanity về inflation	Multi-turn
6	Indirect Prompt Injection [L1]	Thay đổi nội dung webpage để inject prompt	Prompt injection gián tiếp
7	Credential Exfiltration [LEVEL 2]	cứng hóa, multi-technique	Direct prompt injection
8	Extract a secret from the metaprompt [L2]	phiên bản khó hơn của Lab 2	Metaprompt extraction nâng cao
9	Safety Filters – Molotov Cocktail [L2]	Bypass guardrails để mô tả	Guardrail evasion
10	Safety Filters – Molotov Cocktail [L3]	Phiên bản nâng cao của Lab 9	Guardrail evasion cao
11	Indirect Prompt Injection [L2]	Gián tiếp lab 6, phiên bản khó	Prompt injection gián tiếp
12	Indirect Prompt Injection Challenge [L3]	Cực khó, bảo vệ mạnh	Prompt injection gián tiếp nâng cao

🌟 Ưu điểm & Mục tiêu của dự án

Phát triển kỹ năng Red‑teaming tổng thể AI: bao gồm cả kỹ thuật tấn công ad‑versarial và khai thác lỗ hổng RAI.
Thực hành đa cấp độ: từ dễ đến rất khó (level 1–3), phù hợp nhiều trình độ.
Hạ tầng đầy đủ: Docker và Kubernetes giúp chạy môi trường thực hành dễ dàng.
Tính tái sử dụng: người dùng có thể thêm bớt lab mới qua challenges.json và generate.py.

📌 Lợi ích thực thi

Tiếp cận hệ thống thực tế: mô phỏng model Chat‑Copilot tương tự mô hình sản xuất, giúp hiểu rõ vấn đề trong thực tế.
Ôn luyện kỹ thuật prompt injection: phổ biến và nguy hiểm trong AI.
Tập trung vào Responsible AI: giúp nhận diện lỗi tạo nội dung sai lệch, ngôn ngữ xúc phạm, v.v.
Plural hóa kiến thức về guardrails: lab 9–10 rất hợp cho ai triển khai hệ thống chặn nội dung độc hại.
Hạ tầng dễ triển khai và mở rộng: phù hợp tổ chức workshop hoặc đào tạo nội bộ.

🚧 Một số điểm cần lưu ý

Yêu cầu Azure OpenAI endpoint và model embedding text-embedding-ada-002.
Cần hiểu Docker/Kubernetes nếu bạn muốn mở rộng quy mô hoặc chạy nhiều instance.
Chi phí sử dụng Azure AI: có thể phát sinh, cần tính toán kỹ trước khi triển khai.

🧠 Kết luận

Dự án AI Red Teaming Playground Labs là một nguồn tài nguyên quý báu để học và triển khai red‑teaming trên AI một cách có hệ thống. Từ social‑engineering, prompt injection, guardrails bypass đến RAI failure testing, tất cả đều được mô phỏng qua 12 lab cấp độ từ dễ đến chuyên sâu. Bất kỳ ai quan tâm đến an toàn AI đều nên trải nghiệm qua bộ lab này.

Source: https://github.com/microsoft/AI-Red-Teaming-Playground-Labs

bugineverything

AI Red Teaming Playground Labs

🎓 Giới thiệu chung

📋 Thư mục và thành phần chính

🚀 Cách triển khai nhanh

🧩 Tổng quan 12 lab thử thách

🌟 Ưu điểm & Mục tiêu của dự án

📌 Lợi ích thực thi

🚧 Một số điểm cần lưu ý

🧠 Kết luận

FreeTimeGS – Tái dựng cảnh 3D động phức tạp với chuyển động lớn

Awesome Bug Bounty – Danh Sách Tài Nguyên Toàn Diện Cho Người Làm Bug Bounty

Leave a Reply Hủy

AI Red Teaming Playground Labs

🎓 Giới thiệu chung

📋 Thư mục và thành phần chính

🚀 Cách triển khai nhanh

🧩 Tổng quan 12 lab thử thách

🌟 Ưu điểm & Mục tiêu của dự án

📌 Lợi ích thực thi

🚧 Một số điểm cần lưu ý

🧠 Kết luận

FreeTimeGS – Tái dựng cảnh 3D động phức tạp với chuyển động lớn

Awesome Bug Bounty – Danh Sách Tài Nguyên Toàn Diện Cho Người Làm Bug Bounty

Related Posts

AdaptixC2 v1.2 — Framework Hậu Khai Thác (Post-Exploitation) ...

Mobile Security Framework (MobSF) – Framework Đánh Giá Bảo ...

Open ASM (OASM) – Nền tảng mã nguồn mở quản lý bề ...