Build software better, together

depalmar / ai_for_the_win

Build AI-powered security tools. 50+ hands-on labs covering ML, LLMs, RAG, threat detection, DFIR, and red teaming. Includes Colab notebooks, Docker environment, and CTF challenges.

Updated Apr 11, 2026
Python

AmirhosseinHonardoust / Noise-Injection-Techniques

Star

Noise Injection Techniques provides a comprehensive exploration of methods to make machine learning models more robust to real-world bad data. This repository explains and demonstrates Gaussian noise, dropout, mixup, masking, adversarial noise, and label smoothing, with intuitive explanations, theory, and practical code examples.

Updated Nov 15, 2025

AI-Security-Research-Group / LLM-Attacks

Star

Comprehensive taxonomy of AI security vulnerabilities, LLM adversarial attacks, prompt injection techniques, and machine learning security research. Covers 71+ attack vectors including model poisoning, agentic AI exploits, and privacy breaches.

machine-learning ai-security ai-privacy open-source-security adversarial-ml prompt-injection ai-red-teaming model-poisoning llm-attacks ai-vulnerabilities security-taxonomy

Updated Sep 19, 2025

raghavpoonia / ai-security-mastery

Star

Complete 90-day learning path for AI security: ML fundamentals → LLM internals → AI threats → Detection engineering. Built from first principles with NumPy implementations, Jupyter notebooks, and production-ready detection systems.

machine-learning deep-learning jupyter-notebook owasp pytorch cybersecurity security-research ai-security threat-detection mlops detection-engineering adversarial-ml ai-red-team prompt-injection llm-security

Updated Mar 31, 2026
Jupyter Notebook

praetorian-inc / model-extraction-demo

Star

An application to demonstrate stealing an AI model through knowledge distillation.

security ai model offsec adversarial-ml llm-security

Updated Dec 1, 2025
Python

MadsDoodle / Detecting-the-Machine-A-Comprehensive-Benchmark-of-AI-Generated-Text-Detectors-Across-Architectures

Star

This project aims to address this gap by conducting a systematic, controlled study of human versus LLM-generated text detectability using paired question–answer datasets. Rather than proposing a novel detection architecture, the focus is on analyzing detection robustness, failure modes, and the impact of adversarial humanization strategies.

nlp benchmarking text-classification transformers xgboost stylometry bert model-evaluation electra perplexity roberta domain-generalization adversarial-ml ai-evaluation llm-detection ai-generated-text-detection llm-benchmarks

Updated Mar 19, 2026
Jupyter Notebook

clolomagico123 / ai-security-lab

Star

🤖 Test and secure AI systems with advanced techniques for Large Language Models, including jailbreaks and automated vulnerability scanners.

incident-response dfir ctf offensive-security blue-team adversarial-attacks ai-security cybersecurity-education hands-on-labs adversarial-ml llm ai-red-team prompt-injection langchain-alternative agentic-ai-security llm-attacks

Updated Apr 12, 2026

tessera-ops / awesome-ai-security

Star

A curated list of awesome AI security tools, frameworks, and resources. OWASP AI Testing Guide, Agentic AI Top 10, EU AI Act, adversarial ML, LLM red-teaming, prompt injection.

machine-learning awesome owasp cybersecurity awesome-list ai-safety security-tools red-teaming ai-security adversarial-ml ai-testing prompt-injection llm-security agentic-ai eu-ai-act

Updated Mar 25, 2026

Ashfaaq98 / ai-security-research

Star

A collection of resources documenting my research and learning journey in AI System Security.

research resources ai-security adversarial-ml llm-security agentic-ai ai-red-teaming

Updated Mar 17, 2026

ParraX123 / meta-ai-bug-bounty

Star

🛡️ Discover and analyze critical vulnerabilities in Meta AI's Instagram Group Chat, ensuring robust security through comprehensive testing and reporting.

cybersecurity penetration-testing ethical-hacking responsible-disclosure security-research mitre-attack red-teaming ai-security ai-risk adversarial-ml mitre-atlas prompt-injection meta-ai llm-vulnerabilities

Updated Apr 12, 2026

donbaudin / meta-ai-bug-bounty

Star

Bug bounty report demonstrating prompt injection and command execution vulnerabilities in Meta AI's Instagram Group Chat

cybersecurity penetration-testing bug-bounty ethical-hacking responsible-disclosure security-research mitre-attack red-teaming ai-security ai-risk adversarial-ml mitre-atlas prompt-injection meta-ai llm-vulnerabilities

Updated May 31, 2025

daletoniris / alchemind

Star

From the first artificial neurons to autonomous defense systems — Book + Labs + Papers on AI history, neural networks, adversarial ML, and The Warden architecture. By Daniel Dieser.

security machine-learning deep-learning waf artificial-intelligence cybersecurity neural-networks active-learning ekoparty adversarial-ml

Updated Mar 7, 2026
Python

scthornton / ml-security-tools

Star

Collection of Python security analysis tools for ML models and infrastructure. Includes FGSM harness, model inspection, poison monitoring, and deployment security validation.

python machine-learning security-tools security-testing adversarial-ml ml-security model-security

Updated Apr 7, 2026
Python

deconvolute-labs / benchmarks

Star

Reproducible security benchmarking for the Deconvolute SDK and AI system integrity against adversarial attacks.

benchmark ai-safety adversarial-attacks rag adversarial-ml llm-security deconvolute rag-security indirect-prompt-injection

Updated Feb 1, 2026
Python

zakky8 / llm-jailbreak-taxonomy

Star

Mechanism-grounded taxonomy of 40 LLM jailbreak patterns across 10 categories. Full evaluation harness for 4 frontier models. AI safety research with responsible disclosure.

taxonomy jailbreak alignment ai-safety security-testing responsible-disclosure jailbreak-detection adversarial-attacks red-teaming ai-security model-robustness adversarial-ml prompt-injection red-teaming-tools llm-security llm-evaluation llm-jailbreaks ai-red-teaming adversarial-testing

Updated Mar 21, 2026
Jupyter Notebook

tobias1248 / INCITE

Star

Master's students in NCCU SoSLab maintaining a cleaned and restructured version of INCITE (based on PyCT).

cnn transformer mit-license neuronal-network concolic-testing adversarial-ml

Updated Apr 8, 2026
Python

0xkadxr / adversarial-vision-attacks

Star

Tools for generating adversarial images that expose vulnerabilities in multimodal LLMs. Typographic, perturbation, steganographic, and visual injection attacks.

computer-vision pytorch ai-safety multimodal adversarial-ml llm-security

Updated Mar 22, 2026
Python

rexcoleman / verified-delegation-protocol

Star

FP-16: Verified Delegation Protocol for Multi-Agent Systems — LLM-as-judge + crypto signing + adaptive rate limiting

reproducible-research multi-agent-systems ai-security adversarial-ml llm-as-judge govml

Updated Mar 30, 2026
Python

OpenAgenticOS / awesome-aisecurity

Star

A curated list of awesome resources for AI system security.

awesome enhancements good-first-issue ai-security mlsec adversarial-ml llm-security genai-security

Updated Dec 2, 2025

mauryasameer / llm_eval

Star

SR 11-7 & EU AI Act compliant LLM validation framework for financial services — accuracy, adversarial robustness, and explainability auditing with automated report generation.

python financial-services explainability huggingface adversarial-ml generative-ai prompt-injection local-llm llm-evaluation-framework model-risk-management sr-11-7-eu-ai-act

Updated Apr 8, 2026
Python

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

adversarial-ml

Here are 70 public repositories matching this topic...

depalmar / ai_for_the_win

AmirhosseinHonardoust / Noise-Injection-Techniques

AI-Security-Research-Group / LLM-Attacks

raghavpoonia / ai-security-mastery

praetorian-inc / model-extraction-demo

MadsDoodle / Detecting-the-Machine-A-Comprehensive-Benchmark-of-AI-Generated-Text-Detectors-Across-Architectures

clolomagico123 / ai-security-lab

tessera-ops / awesome-ai-security

Ashfaaq98 / ai-security-research

ParraX123 / meta-ai-bug-bounty

donbaudin / meta-ai-bug-bounty

daletoniris / alchemind

scthornton / ml-security-tools

deconvolute-labs / benchmarks

zakky8 / llm-jailbreak-taxonomy

tobias1248 / INCITE

0xkadxr / adversarial-vision-attacks

rexcoleman / verified-delegation-protocol

OpenAgenticOS / awesome-aisecurity

mauryasameer / llm_eval

Improve this page

Add this topic to your repo