Blog

Notes de terrain sur la détection de menaces supply-chain.

Quand les attaquants codent l'évasion contre MUAD'DIB
2026-07-01 détection dprk npm évasion sandbox live
Analyse d'une campagne npm attribuée au mode opératoire DPRK « Contagious Interview » : 5 packages sur 3 scopes, dont le payload teste le marqueur de sandbox MUADDIB_GVISOR (reconstruit par charcode). Détection statique de longzy-basic-ui (100/100, sandbox: none), analyse du .prepare.cjs (C2 Lark, sérialisation de process.env, exécution différée), perte de couverture par délestage mémoire et correctif anti-spill IOC-aware. Traitement retenu pour le marqueur.
Ground truth +29 samples : pourquoi un TPR figé à 93,85% mesurait surtout l'IOC matching
2026-05-26 ground-truth métriques pypi compound méthodologie
60 samples sur 67 attendaient juste MUADDIB-PKG-001. Le TPR mesurait l'IOC database, pas les 250+ règles comportementales. Track C (16 fixtures synthétiques), Track A (6 tarballs réels), Track B (7 reconstructions), Track D (compound direct-IP+linux-fingerprint), fix download PyPI 38% fail rate. TPR@20 +3,1pp (85,19% → 88,30%), FPR npm stable, FPR PyPI honnête à 9,68% sur 124/132 (was 6,10% sur 82/132 biaisé).
Mini Shai-Hulud : 206 packages scannés, 113 passés sous le radar, autopsie d'un gap de scoring
2026-05-12 scoring supply-chain npm retrospective TeamPCP shai-hulud
La campagne Mini Shai-Hulud de TeamPCP a compromis 200+ packages npm dont @tanstack/react-router (12M DL/semaine). MUAD'DIB a détecté les patterns mais le scoring les a écrasés à 2/100. Trois causes racines (reachability, isLargeJs, MT-1 cap), cinq correctifs, score final 100/100 CRITICAL.
@bcs-bank-complex-ui/deeplink : analyse d'un credential harvester multi-plateforme imitant un scope npm interne d'une banque russe
2026-05-04 détection npm dependency-confusion credential-harvester live
Détection live d'un package npm publié sous un scope interne deviné, payload de stage 2 capturé en direct (250 lignes, 12 formats de credentials, remontée de 8 niveaux de /proc/<ppid>/environ), C2 hébergé en sous-domaine d'une vitrine SaaS russe de réservation pour stations de lavage automobile.
Packages @athena-ui-components : analyse d'une campagne de dependency confusion revendiquant un programme bug bounty non listé publiquement
2026-04-20 détection npm dependency-confusion oast bug-bounty
22 tarballs archivés sous un scope npm, 3 variantes de payload, exfiltration triple canal (HTTP, DNS, Discord), revendication d'un programme YesWeHack DBS Bank non vérifiable publiquement.
Quand le ML ne marche pas : pourquoi j'ai remplacé un classifier par des règles déterministes
2026-04-19 ml retrospective xgboost post-filtre méthodologie
AUC 0.999 sur corpus pollué vs AUC 0.9917 sur corpus humain propre. Pourquoi XGBoost ne marche pas sur 302 samples et comment un post-filtre déterministe a réduit les FP CRITICAL de 33.8%.
52 malwares en 15 jours : review manuelle de 14 373 tarballs npm
2026-04-14 detection malware npm review campagnes scoring
Review de securite complete sur 15 jours d'archives npm. 52 malwares confirmes dans 7 campagnes distinctes, dont 12 que le scanner avait sous-scores. 5 nouvelles regles implementees.
logkitx : anatomie d'une chaîne de dépendances DPRK
2026-04-08 détection dprk lazarus npm dependency-chain live
Trois packages npm, une chaîne de dépendances, un infostealer Lazarus. Comment MUAD'DIB détecte logkitx et dev-log-core — et pourquoi logger-base passe à travers.
react-emits : un malware npm détecté en live et reporté
2026-04-05 détection malware npm report live
4 versions en 4 heures, un path.js copie du module natif avec deux IIFE fetch+eval injectées, et des dépendances qui shadow fs, process et path. Score 100, reporté à npm.
FPR 11% à 2.85% : quand le ground truth vient de l'extérieur
2026-04-05 ml retrain auto-labeler xgboost data-leakage
49 malwares confirmés, un modèle qui tourne en rond, et un retrain à 100% de précision. Tout ce qui pouvait mal tourner a mal tourné.
gVisor : le kernel qui rend la sandbox invisible
2026-03-31 sandbox gvisor évasion détection
Les malwares détectent Docker en 3 lignes. gVisor intercepte les syscalls au niveau kernel. Le malware pense qu'il tourne sur une vraie machine.
CanisterWorm : quand la sandbox est aveugle pendant 5 minutes
2026-03-23 détection canisterworm sandbox libfaketime évasion
7 packages compromis détectés, verdict DORMANT SUSPECT au lieu de MALICIOUS. Le payload Python attendait 5 minutes. La sandbox n'attendait pas.
v2.10.5 - Quand un changement de label fait passer le ML de 37% à 98%
2026-03-22 ml audit xgboost monitoring pipeline
3 mois de monitoring, 0 malware confirmé, 8176 labels contaminés. Comment un nettoyage de données a fait passer la précision ML de 37% à 98%.
Du rule-based au ML : un classifier XGBoost pour trier les faux positifs
2026-03-20 ml xgboost faux-positifs architecture
Un classifier binaire XGBoost en JavaScript pur pour filtrer les faux positifs de la zone grise T1, sans aucune dépendance Python en production.
Red Team vs Blue Team : 107 échantillons adversariaux en 7 campagnes
2026-03-17 red-team adversarial méthodologie
Comment tester un scanner de sécurité quand l'attaquant connaît les règles.
92.5% de détection sur 17 000 malwares réels
2026-03-14 benchmark datadog métriques
9 heures de benchmark sur le dataset Datadog. 14 587 packages in-scope, 13 486 détectés.
GlassWorm : Unicode invisible et C2 blockchain Solana
2026-03-10 détection glassworm unicode solana
433 packages npm compromis, du code caché dans des caractères zero-width, et un C2 sur la blockchain.
Le sandbox qui voyage dans le temps
2026-03-02 sandbox time-bomb évasion
Quand les malwares attendent 72h avant de voler les credentials, on accélère le temps.
Le vrai FPR : quand 0% cache la réalité
2026-02-21 métriques faux-positifs méthodologie
Notre taux de faux positifs était de 0%. En réalité, il était de 38%.