Merge pull request #33 from gardenlinux/non_kexec_hugepages

toanju · web-flow · commit c40398dfe5f1 · 2025-02-06T20:46:33.000+01:00
Set hugepages dynamically without kexec
diff --git a/features/orabos/file.include/usr/lib/dracut/modules.d/99ensure-hugepages/ensure-hugepages.sh b/features/orabos/file.include/usr/lib/dracut/modules.d/99ensure-hugepages/ensure-hugepages.sh
@@ -2,48 +2,32 @@
 # This file is part of dracut ensure-hugepages module.
 # SPDX-License-Identifier: MIT
 
-hugepages=$(getarg hugepages=) || hugepages=0
+hugepages=$(getarg hugepages=) || hugepages=-1	# -1 for unset
 
 mem_total_mb=$(($(sed -rn 's/MemTotal:\s+(.*) kB/\1/p' /proc/meminfo) / 1024 ))
 hugepagesize_mb=$(($(sed -rn 's/Hugepagesize:\s+(.*) kB/\1/p' /proc/meminfo) / 1024 ))
 
-function adopt_watermark_scale_factor() {
-  # On a 3TiB host, the default watermark_scale_factor=10 was exactly that
-  # that the kswapd0 was running permanently. Setting it to 5 was solving the
-  # issue, but is likely a suboptimal value, but a first start.
-  # The value 500 reproduces exactly that value for that scale, and hopefully
-  # also holds for larger hosts.
-  max_watermark_scale_factor=$(($non_hugepages_mb * 500 / $mem_total_mb))
-  watermark_scale_factor=$(</proc/sys/vm/watermark_scale_factor)
-  if [ $max_watermark_scale_factor -lt $watermark_scale_factor ]; then
-    echo $max_watermark_scale_factor > /proc/sys/vm/watermark_scale_factor
-  fi
-}
-
-if [ ${hugepages:-0} -gt 0 ]; then
-  hugepages_mb=$(($hugepages * $hugepagesize_mb))
-  non_hugepages_mb=$(($mem_total_mb - $hugepages_mb))
-  adopt_watermark_scale_factor
-  exit 0
+if [ $hugepages -lt 0 ]; then	# presumably unset, derive it from rdnon_hugepages or from default
+  non_hugepages_pm=$(getarg rd.non_hugepages_pm=) || non_hugepages_pm=45
+  non_hugepages_mb=$(( ($mem_total_mb * $non_hugepages_pm) / 1000 ))
+  hugepages=$(( ($mem_total_mb - $non_hugepages_mb ) / $hugepagesize_mb ))
 fi
 
 
-non_hugepages_pm=$(getarg rd.non_hugepages_pm=) || non_hugepages_pm=50
-non_hugepages_mb=$(( ($mem_total_mb * $non_hugepages_pm) / 1000 ))
-hugepages=$(( ($mem_total_mb - $non_hugepages_mb ) / $hugepagesize_mb ))
-
-if [ $hugepages -le 0 ]; then
+if [ ${hugepages:-0} -lt 0 ]; then
   exit 0
 fi
 
-cmdline="$(</proc/cmdline) hugepages=$hugepages"
-release=$(uname -r)
-
-NEWROOT=${NEWROOT:-/sysroot}
-
-kexec \
-  -l $NEWROOT/boot/vmlinuz-${release} \
-  --initrd=$NEWROOT/boot/initrd.img-${release} \
-  --command-line="$cmdline"
+# On a 3TiB host, the default watermark_scale_factor=10 was exactly that
+# that the kswapd0 was running permanently. Setting it to 5 was solving the
+# issue, but is likely a suboptimal value, but a first start.
+# The value 500 reproduces exactly that value for that scale, and hopefully
+# also holds for larger hosts.
+max_watermark_scale_factor=$(($non_hugepages_mb * 500 / $mem_total_mb))
+watermark_scale_factor=$(</proc/sys/vm/watermark_scale_factor)
+if [ $max_watermark_scale_factor -lt $watermark_scale_factor ]; then
+  echo $max_watermark_scale_factor > /proc/sys/vm/watermark_scale_factor
+fi
 
-kexec -e --reset-vga
+# Only after having set the above, we an actually reserve the hugepages
+echo $hugepages > /proc/sys/vm/nr_hugepages
diff --git a/features/orabos/file.include/usr/lib/dracut/modules.d/99ensure-hugepages/module-setup.sh b/features/orabos/file.include/usr/lib/dracut/modules.d/99ensure-hugepages/module-setup.sh
@@ -11,6 +11,5 @@ depends() {
 
 # Install the required file(s) and directories for the module in the initramfs.
 install() {
-	inst_hook pre-pivot 00 "$moddir/ensure-hugepages.sh"
-	inst kexec
+	inst_hook cmdline 00 "$moddir/ensure-hugepages.sh"
 }

Original file line number	Diff line number	Diff line change
`@@ -11,6 +11,5 @@ depends() {`
`11`	`11`
`12`	`12`	`# Install the required file(s) and directories for the module in the initramfs.`
`13`	`13`	`install() {`
`14`		`- inst_hook pre-pivot 00 "$moddir/ensure-hugepages.sh"`
`15`		`- inst kexec`
	`14`	`+ inst_hook cmdline 00 "$moddir/ensure-hugepages.sh"`
`16`	`15`	`}`