4 Commits

Author SHA1 Message Date
Gilles Soulier 3c15943e2e debug(smart v0.1.16): log JSON brut complet en cas d'échec parse
Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-23 13:51:30 +02:00
Gilles Soulier a9506a5505 fix(smart v0.1.15): contrôleur NVMe + règle udev disk group
Cause racine : smartctl -a -j /dev/nvme0n1 (namespace) retourne exit 4
et omet smart_status car les commandes admin échouent via le namespace.
Solution : utiliser /dev/nvme0 (contrôleur) accessible grâce à la règle
udev SUBSYSTEM==nvme GROUP=disk.

- smart.rs : scan /sys/class/nvme/ pour les contrôleurs (nvme0, nvme1)
  au lieu de /sys/block/ pour les namespaces (nvme0n1)
- deploy/99-nanometrics-smart.rules : udev rule KERNEL==nvme* GROUP=disk
- deploy/install.sh : déploie la règle udev + udevadm trigger

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-23 13:39:13 +02:00
Gilles Soulier ee5e8710a3 fix(smart v0.1.14): filtre NVMe correct + SmartStatus défensif
- Filtre nvme : n[4..].contains('n') au lieu de n.contains('n')
  pour distinguer nvme0n1 (namespace) de nvme0 (contrôleur)
- SmartStatus.passed : #[serde(default)] pour éviter crash si absent

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-23 13:20:04 +02:00
Gilles Soulier d715b452c1 fix(smart v0.1.13): SmartTemp.current optionnel — évite échec parse JSON
Certains NVMe (ASUS TUF A16) ont un champ temperature sans current.
Le champ requis current: i64 faisait crasher toute la désérialisation.
Correction : #[serde(default)] + and_then au lieu de map.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-05-23 13:11:10 +02:00
5 changed files with 51 additions and 23 deletions
+1 -1
View File
@@ -248,7 +248,7 @@ dependencies = [
[[package]]
name = "nanometrics-agent"
version = "0.1.12"
version = "0.1.16"
dependencies = [
"libc",
"rumqttc",
+1 -1
View File
@@ -1,6 +1,6 @@
[package]
name = "nanometrics-agent"
version = "0.1.12"
version = "0.1.16"
edition = "2021"
[lib]
+34 -21
View File
@@ -9,10 +9,16 @@ struct SmartJson {
}
#[derive(Deserialize)]
struct SmartStatus { passed: bool }
struct SmartStatus {
#[serde(default)]
passed: bool,
}
#[derive(Deserialize)]
struct SmartTemp { current: i64 }
struct SmartTemp {
#[serde(default)]
current: Option<i64>,
}
#[derive(Deserialize)]
struct SmartAttrs { table: Vec<SmartAttr> }
@@ -44,7 +50,7 @@ pub fn is_available() -> bool {
pub fn parse_json(json: &str) -> Result<crate::payload::SmartMetrics, serde_json::Error> {
let s: SmartJson = serde_json::from_str(json)?;
let temperature = s.temperature.as_ref().map(|t| t.current)
let temperature = s.temperature.as_ref().and_then(|t| t.current)
.or_else(|| s.nvme_smart_health_information_log.as_ref()?.temperature);
let mut reallocated = None;
@@ -85,23 +91,28 @@ pub fn collect() -> Option<Vec<crate::payload::SmartMetrics>> {
eprintln!("[smart] smartctl introuvable dans PATH");
return None;
}
let mut devs: Vec<String> = std::fs::read_dir("/sys/block")
.into_iter()
.flatten()
.flatten()
.map(|e| e.file_name().into_string().unwrap_or_default())
.filter_map(|n| {
if n.starts_with("sd") {
Some(format!("/dev/{}", n))
} else if n.starts_with("nvme") && n.contains('n') {
Some(format!("/dev/{}", n))
} else {
None
}
})
.collect::<std::collections::HashSet<_>>()
.into_iter()
.collect();
let mut set = std::collections::HashSet::new();
// SATA/SAS : /sys/block/sd* → /dev/sda, /dev/sdb…
for e in std::fs::read_dir("/sys/block").into_iter().flatten().flatten() {
let n = e.file_name().into_string().unwrap_or_default();
if n.starts_with("sd") {
set.insert(format!("/dev/{}", n));
}
}
// NVMe : /sys/class/nvme/nvme* → /dev/nvme0, /dev/nvme1…
// On utilise le contrôleur (char device), pas le namespace (block device),
// car smartctl ne peut exécuter les commandes admin SMART que via le contrôleur.
// La règle udev 99-nanometrics-smart.rules lui donne l'accès groupe disk.
for e in std::fs::read_dir("/sys/class/nvme").into_iter().flatten().flatten() {
let n = e.file_name().into_string().unwrap_or_default();
if n.starts_with("nvme") {
set.insert(format!("/dev/{}", n));
}
}
let mut devs: Vec<String> = set.into_iter().collect();
devs.sort();
eprintln!("[smart] disques détectés: {:?}", devs);
@@ -127,7 +138,9 @@ pub fn collect() -> Option<Vec<crate::payload::SmartMetrics>> {
}
Err(e) => {
eprintln!("[smart] {} parse JSON échoué: {}", dev, e);
eprintln!("[smart] premiers 200 octets stdout: {:?}", &json.chars().take(200).collect::<String>());
eprintln!("[smart] --- JSON BRUT BEGIN ({} octets) ---", json.len());
eprintln!("{}", &*json);
eprintln!("[smart] --- JSON BRUT END ---");
}
}
}
+4
View File
@@ -0,0 +1,4 @@
# Nanometrics: accès groupe disk aux contrôleurs NVMe pour SMART
# Sans cette règle, /dev/nvme0 est crw------- root root (root only),
# ce qui empêche smartctl d'exécuter les commandes admin et omet smart_status du JSON.
KERNEL=="nvme[0-9]*", SUBSYSTEM=="nvme", GROUP="disk", MODE="0660"
+11
View File
@@ -45,6 +45,17 @@ else
fi
echo ""
# ── 2. Règle udev NVMe (accès SMART pour le groupe disk) ──────────────────────
UDEV_RULE="/etc/udev/rules.d/99-nanometrics-smart.rules"
cat > "$UDEV_RULE" << 'UDEVRULE'
# Nanometrics: accès groupe disk aux contrôleurs NVMe pour SMART
KERNEL=="nvme[0-9]*", SUBSYSTEM=="nvme", GROUP="disk", MODE="0660"
UDEVRULE
udevadm control --reload-rules
udevadm trigger --subsystem-match=nvme 2>/dev/null || true
ok "Règle udev NVMe installée ($UDEV_RULE)"
echo ""
# ── 3. Détection de l'architecture ────────────────────────────────────────────
ARCH="$(uname -m)"
case "$ARCH" in