feat: all cpus reservations to 0.1

2026-05-14 16:22:07 +08:00
parent 453a3eab11
commit 53b841926e
274 changed files with 828 additions and 828 deletions
@@ -30,7 +30,7 @@ CUBE_FORCE_REINSTALL=0
 # CubeSandbox runs MySQL + Redis + CubeProxy + CoreDNS + CubeMaster + CubeAPI +
 # Cubelet + network-agent inside the wrapper container, then spawns MicroVMs.
 # Give it enough headroom; 16 GiB / 8 vCPU is a comfortable single-node default.
-CUBE_CPU_LIMIT=8
+CUBE_CPU_LIMIT=8.0
 CUBE_MEMORY_LIMIT=16G
-CUBE_CPU_RESERVATION=2
-CUBE_MEMORY_RESERVATION=8G
+CUBE_CPU_RESERVATION=0.1
+CUBE_MEMORY_RESERVATION=8G
@@ -136,7 +136,7 @@ These permissions are equivalent to what `online-install.sh` would request if it
 - **`/dev/kvm not found`** — the host does not expose KVM to Docker. On WSL2, confirm nested virtualization is enabled and the kernel exposes `/dev/kvm`. On bare metal, ensure VT-x / AMD-V is enabled in BIOS.
 - **First boot hangs at "Running CubeSandbox one-click installer"** — the installer is downloading the bundle (~hundreds of MB) and pulling several Docker images. Check progress with `docker compose logs -f cube-sandbox`.
 - **`quickcheck.sh reported issues`** — open a shell in the container and inspect logs:
-  
+
  ```bash
  docker compose exec cube-sandbox bash
  ls /data/log/
@@ -89,19 +89,19 @@ services:
    healthcheck:
      test:
        - CMD-SHELL
-        - "curl -fsS http://127.0.0.1:3000/health && curl -fsS http://127.0.0.1:8089/notify/health && curl -fsS http://127.0.0.1:19090/healthz"
+        - 'curl -fsS http://127.0.0.1:3000/health && curl -fsS http://127.0.0.1:8089/notify/health && curl -fsS http://127.0.0.1:19090/healthz'
      interval: 30s
      timeout: 15s
      retries: 5
-      start_period: 600s   # First boot downloads ~400 MB + Docker images; be generous.
+      start_period: 600s # First boot downloads ~400 MB + Docker images; be generous.

    deploy:
      resources:
        limits:
-          cpus: '${CUBE_CPU_LIMIT:-8}'
+          cpus: '${CUBE_CPU_LIMIT:-8.0}'
          memory: ${CUBE_MEMORY_LIMIT:-16G}
        reservations:
-          cpus: '${CUBE_CPU_RESERVATION:-2}'
+          cpus: '${CUBE_CPU_RESERVATION:-0.1}'
          memory: ${CUBE_MEMORY_RESERVATION:-8G}

 volumes:
@@ -25,7 +25,7 @@ INSTALL_NVIDIA_TOOLKIT=false
 # Resource limits
 DIND_CPU_LIMIT=2.0
 DIND_MEMORY_LIMIT=4G
-DIND_CPU_RESERVATION=1.0
+DIND_CPU_RESERVATION=0.1
 DIND_MEMORY_RESERVATION=2G

 # Docker daemon options
@@ -33,4 +33,4 @@ DIND_MEMORY_RESERVATION=2G
 DOCKER_TLS_CERTDIR=

 # Data directory for named volume
-# DATA_DIR=./data
+# DATA_DIR=./data
@@ -44,7 +44,7 @@ services:
          cpus: ${DIND_CPU_LIMIT:-2.0}
          memory: ${DIND_MEMORY_LIMIT:-4G}
        reservations:
-          cpus: ${DIND_CPU_RESERVATION:-1.0}
+          cpus: ${DIND_CPU_RESERVATION:-0.1}
          memory: ${DIND_MEMORY_RESERVATION:-2G}

  # GPU-enabled DinD (optional)
@@ -84,7 +84,7 @@ services:
          cpus: ${DIND_CPU_LIMIT:-2.0}
          memory: ${DIND_MEMORY_LIMIT:-4G}
        reservations:
-          cpus: ${DIND_CPU_RESERVATION:-1.0}
+          cpus: ${DIND_CPU_RESERVATION:-0.1}
          memory: ${DIND_MEMORY_RESERVATION:-2G}
          devices:
            - driver: nvidia
@@ -14,27 +14,27 @@ DEER_FLOW_MODEL_ID=gpt-4.1-mini
 OPENAI_API_KEY=

 # Resources - Gateway
-DEER_FLOW_GATEWAY_CPU_LIMIT=2.00
+DEER_FLOW_GATEWAY_CPU_LIMIT=2.0
 DEER_FLOW_GATEWAY_MEMORY_LIMIT=2G
-DEER_FLOW_GATEWAY_CPU_RESERVATION=0.50
+DEER_FLOW_GATEWAY_CPU_RESERVATION=0.1
 DEER_FLOW_GATEWAY_MEMORY_RESERVATION=512M

 # Resources - LangGraph
-DEER_FLOW_LANGGRAPH_CPU_LIMIT=2.00
+DEER_FLOW_LANGGRAPH_CPU_LIMIT=2.0
 DEER_FLOW_LANGGRAPH_MEMORY_LIMIT=2G
-DEER_FLOW_LANGGRAPH_CPU_RESERVATION=0.50
+DEER_FLOW_LANGGRAPH_CPU_RESERVATION=0.1
 DEER_FLOW_LANGGRAPH_MEMORY_RESERVATION=512M

 # Resources - Frontend
-DEER_FLOW_FRONTEND_CPU_LIMIT=1.00
+DEER_FLOW_FRONTEND_CPU_LIMIT=1.0
 DEER_FLOW_FRONTEND_MEMORY_LIMIT=1G
-DEER_FLOW_FRONTEND_CPU_RESERVATION=0.25
+DEER_FLOW_FRONTEND_CPU_RESERVATION=0.1
 DEER_FLOW_FRONTEND_MEMORY_RESERVATION=256M

 # Resources - Nginx
-DEER_FLOW_NGINX_CPU_LIMIT=0.50
+DEER_FLOW_NGINX_CPU_LIMIT=0.5
 DEER_FLOW_NGINX_MEMORY_LIMIT=256M
-DEER_FLOW_NGINX_CPU_RESERVATION=0.10
+DEER_FLOW_NGINX_CPU_RESERVATION=0.1
 DEER_FLOW_NGINX_MEMORY_RESERVATION=64M

 # Logging
@@ -42,4 +42,4 @@ DEER_FLOW_LOG_MAX_SIZE=100m
 DEER_FLOW_LOG_MAX_FILE=3

 # Timezone
-TZ=UTC
+TZ=UTC
@@ -53,10 +53,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${DEER_FLOW_GATEWAY_CPU_LIMIT:-2.00}
+          cpus: ${DEER_FLOW_GATEWAY_CPU_LIMIT:-2.0}
          memory: ${DEER_FLOW_GATEWAY_MEMORY_LIMIT:-2G}
        reservations:
-          cpus: ${DEER_FLOW_GATEWAY_CPU_RESERVATION:-0.50}
+          cpus: ${DEER_FLOW_GATEWAY_CPU_RESERVATION:-0.1}
          memory: ${DEER_FLOW_GATEWAY_MEMORY_RESERVATION:-512M}

  deerflow-langgraph:
@@ -102,10 +102,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${DEER_FLOW_LANGGRAPH_CPU_LIMIT:-2.00}
+          cpus: ${DEER_FLOW_LANGGRAPH_CPU_LIMIT:-2.0}
          memory: ${DEER_FLOW_LANGGRAPH_MEMORY_LIMIT:-2G}
        reservations:
-          cpus: ${DEER_FLOW_LANGGRAPH_CPU_RESERVATION:-0.50}
+          cpus: ${DEER_FLOW_LANGGRAPH_CPU_RESERVATION:-0.1}
          memory: ${DEER_FLOW_LANGGRAPH_MEMORY_RESERVATION:-512M}

  deerflow-frontend:
@@ -133,10 +133,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${DEER_FLOW_FRONTEND_CPU_LIMIT:-1.00}
+          cpus: ${DEER_FLOW_FRONTEND_CPU_LIMIT:-1.0}
          memory: ${DEER_FLOW_FRONTEND_MEMORY_LIMIT:-1G}
        reservations:
-          cpus: ${DEER_FLOW_FRONTEND_CPU_RESERVATION:-0.25}
+          cpus: ${DEER_FLOW_FRONTEND_CPU_RESERVATION:-0.1}
          memory: ${DEER_FLOW_FRONTEND_MEMORY_RESERVATION:-256M}

  deerflow-nginx:
@@ -164,8 +164,8 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${DEER_FLOW_NGINX_CPU_LIMIT:-0.50}
+          cpus: ${DEER_FLOW_NGINX_CPU_LIMIT:-0.5}
          memory: ${DEER_FLOW_NGINX_MEMORY_LIMIT:-256M}
        reservations:
-          cpus: ${DEER_FLOW_NGINX_CPU_RESERVATION:-0.10}
+          cpus: ${DEER_FLOW_NGINX_CPU_RESERVATION:-0.1}
          memory: ${DEER_FLOW_NGINX_MEMORY_RESERVATION:-64M}
@@ -52,8 +52,8 @@ GOOSE_MODEL=gpt-4
 # ============================================

 # CPU limits
-GOOSE_CPU_LIMIT=2.00
-GOOSE_CPU_RESERVATION=0.50
+GOOSE_CPU_LIMIT=2.0
+GOOSE_CPU_RESERVATION=0.1

 # Memory limits
 GOOSE_MEMORY_LIMIT=2G
@@ -61,4 +61,4 @@ GOOSE_MEMORY_RESERVATION=512M

 # Logging limits
 GOOSE_LOG_MAX_SIZE=100m
-GOOSE_LOG_MAX_FILE=3
+GOOSE_LOG_MAX_FILE=3
@@ -44,10 +44,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${GOOSE_CPU_LIMIT:-2.00}
+          cpus: ${GOOSE_CPU_LIMIT:-2.0}
          memory: ${GOOSE_MEMORY_LIMIT:-2G}
        reservations:
-          cpus: ${GOOSE_CPU_RESERVATION:-0.50}
+          cpus: ${GOOSE_CPU_RESERVATION:-0.1}
          memory: ${GOOSE_MEMORY_RESERVATION:-512M}

 volumes:
@@ -33,7 +33,7 @@ services:
          cpus: '2.0'
          memory: 4G
        reservations:
-          cpus: '1.0'
+          cpus: '0.1'
          memory: 2G
          devices:
            - driver: nvidia
@@ -41,12 +41,12 @@ K3S_DISABLE_SERVICES=traefik

 # Resource Limits
 # CPU limit (cores)
-K3S_DIND_CPU_LIMIT=2.00
+K3S_DIND_CPU_LIMIT=2.0
 # Memory limit
 K3S_DIND_MEMORY_LIMIT=4G

 # Resource Reservations
 # CPU reservation (cores)
-K3S_DIND_CPU_RESERVATION=0.50
+K3S_DIND_CPU_RESERVATION=0.1
 # Memory reservation
-K3S_DIND_MEMORY_RESERVATION=1G
+K3S_DIND_MEMORY_RESERVATION=1G
@@ -44,10 +44,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${K3S_DIND_CPU_LIMIT:-2.00}
+          cpus: ${K3S_DIND_CPU_LIMIT:-2.0}
          memory: ${K3S_DIND_MEMORY_LIMIT:-4G}
        reservations:
-          cpus: ${K3S_DIND_CPU_RESERVATION:-0.50}
+          cpus: ${K3S_DIND_CPU_RESERVATION:-0.1}
          memory: ${K3S_DIND_MEMORY_RESERVATION:-1G}

 volumes:
@@ -45,10 +45,10 @@ MICROSANDBOX_PORT_OVERRIDE=5555

 # CPU limits
 # MicroSandbox requires more CPU for KVM virtualization
-MICROSANDBOX_CPU_LIMIT=4
-MICROSANDBOX_CPU_RESERVATION=1
+MICROSANDBOX_CPU_LIMIT=4.0
+MICROSANDBOX_CPU_RESERVATION=0.1

 # Memory limits
 # MicroSandbox requires more memory for running VMs
 MICROSANDBOX_MEMORY_LIMIT=4G
-MICROSANDBOX_MEMORY_RESERVATION=1G
+MICROSANDBOX_MEMORY_RESERVATION=1G
@@ -66,10 +66,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${MICROSANDBOX_CPU_LIMIT:-4}
+          cpus: ${MICROSANDBOX_CPU_LIMIT:-4.0}
          memory: ${MICROSANDBOX_MEMORY_LIMIT:-4G}
        reservations:
-          cpus: ${MICROSANDBOX_CPU_RESERVATION:-1}
+          cpus: ${MICROSANDBOX_CPU_RESERVATION:-0.1}
          memory: ${MICROSANDBOX_MEMORY_RESERVATION:-1G}

 volumes:
@@ -28,7 +28,7 @@ x-mineru-vllm: &mineru-vllm
        cpus: '16.0'
        memory: 32G
      reservations:
-        cpus: '8.0'
+        cpus: '0.1'
        memory: 16G
        devices:
          - driver: nvidia
@@ -30,21 +30,21 @@ MULTICA_GOOGLE_CLIENT_SECRET=
 MULTICA_GOOGLE_REDIRECT_URI=http://localhost:3000/auth/callback

 # Resources - PostgreSQL
-MULTICA_POSTGRES_CPU_LIMIT=1.00
+MULTICA_POSTGRES_CPU_LIMIT=1.0
 MULTICA_POSTGRES_MEMORY_LIMIT=1G
-MULTICA_POSTGRES_CPU_RESERVATION=0.25
+MULTICA_POSTGRES_CPU_RESERVATION=0.1
 MULTICA_POSTGRES_MEMORY_RESERVATION=256M

 # Resources - Backend
-MULTICA_BACKEND_CPU_LIMIT=2.00
+MULTICA_BACKEND_CPU_LIMIT=2.0
 MULTICA_BACKEND_MEMORY_LIMIT=2G
-MULTICA_BACKEND_CPU_RESERVATION=0.50
+MULTICA_BACKEND_CPU_RESERVATION=0.1
 MULTICA_BACKEND_MEMORY_RESERVATION=512M

 # Resources - Frontend
-MULTICA_FRONTEND_CPU_LIMIT=1.00
+MULTICA_FRONTEND_CPU_LIMIT=1.0
 MULTICA_FRONTEND_MEMORY_LIMIT=1G
-MULTICA_FRONTEND_CPU_RESERVATION=0.25
+MULTICA_FRONTEND_CPU_RESERVATION=0.1
 MULTICA_FRONTEND_MEMORY_RESERVATION=256M

 # Logging
@@ -52,4 +52,4 @@ MULTICA_LOG_MAX_SIZE=100m
 MULTICA_LOG_MAX_FILE=3

 # Timezone
-TZ=UTC
+TZ=UTC
@@ -26,10 +26,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${MULTICA_POSTGRES_CPU_LIMIT:-1.00}
+          cpus: ${MULTICA_POSTGRES_CPU_LIMIT:-1.0}
          memory: ${MULTICA_POSTGRES_MEMORY_LIMIT:-1G}
        reservations:
-          cpus: ${MULTICA_POSTGRES_CPU_RESERVATION:-0.25}
+          cpus: ${MULTICA_POSTGRES_CPU_RESERVATION:-0.1}
          memory: ${MULTICA_POSTGRES_MEMORY_RESERVATION:-256M}

  multica-backend:
@@ -67,10 +67,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${MULTICA_BACKEND_CPU_LIMIT:-2.00}
+          cpus: ${MULTICA_BACKEND_CPU_LIMIT:-2.0}
          memory: ${MULTICA_BACKEND_MEMORY_LIMIT:-2G}
        reservations:
-          cpus: ${MULTICA_BACKEND_CPU_RESERVATION:-0.50}
+          cpus: ${MULTICA_BACKEND_CPU_RESERVATION:-0.1}
          memory: ${MULTICA_BACKEND_MEMORY_RESERVATION:-512M}

  multica-frontend:
@@ -99,10 +99,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${MULTICA_FRONTEND_CPU_LIMIT:-1.00}
+          cpus: ${MULTICA_FRONTEND_CPU_LIMIT:-1.0}
          memory: ${MULTICA_FRONTEND_MEMORY_LIMIT:-1G}
        reservations:
-          cpus: ${MULTICA_FRONTEND_CPU_RESERVATION:-0.25}
+          cpus: ${MULTICA_FRONTEND_CPU_RESERVATION:-0.1}
          memory: ${MULTICA_FRONTEND_MEMORY_RESERVATION:-256M}

 volumes:
@@ -20,9 +20,9 @@ OPENAI_API_KEY=
 GROQ_API_KEY=

 # Resources
-OPENFANG_CPU_LIMIT=2.00
+OPENFANG_CPU_LIMIT=2.0
 OPENFANG_MEMORY_LIMIT=2G
-OPENFANG_CPU_RESERVATION=0.50
+OPENFANG_CPU_RESERVATION=0.1
 OPENFANG_MEMORY_RESERVATION=512M

 # Logging
@@ -30,4 +30,4 @@ OPENFANG_LOG_MAX_SIZE=100m
 OPENFANG_LOG_MAX_FILE=3

 # Timezone
-TZ=UTC
+TZ=UTC
@@ -61,10 +61,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${OPENFANG_CPU_LIMIT:-2.00}
+          cpus: ${OPENFANG_CPU_LIMIT:-2.0}
          memory: ${OPENFANG_MEMORY_LIMIT:-2G}
        reservations:
-          cpus: ${OPENFANG_CPU_RESERVATION:-0.50}
+          cpus: ${OPENFANG_CPU_RESERVATION:-0.1}
          memory: ${OPENFANG_MEMORY_RESERVATION:-512M}

 volumes:
@@ -18,9 +18,9 @@ OPENAI_API_KEY=
 ANTHROPIC_API_KEY=

 # Resources
-PAPERCLIP_CPU_LIMIT=2.00
+PAPERCLIP_CPU_LIMIT=2.0
 PAPERCLIP_MEMORY_LIMIT=4G
-PAPERCLIP_CPU_RESERVATION=0.50
+PAPERCLIP_CPU_RESERVATION=0.1
 PAPERCLIP_MEMORY_RESERVATION=1G

 # Logging
@@ -28,4 +28,4 @@ PAPERCLIP_LOG_MAX_SIZE=100m
 PAPERCLIP_LOG_MAX_FILE=3

 # Timezone
-TZ=UTC
+TZ=UTC
@@ -43,10 +43,10 @@ services:
    deploy:
      resources:
        limits:
-          cpus: ${PAPERCLIP_CPU_LIMIT:-2.00}
+          cpus: ${PAPERCLIP_CPU_LIMIT:-2.0}
          memory: ${PAPERCLIP_MEMORY_LIMIT:-4G}
        reservations:
-          cpus: ${PAPERCLIP_CPU_RESERVATION:-0.50}
+          cpus: ${PAPERCLIP_CPU_RESERVATION:-0.1}
          memory: ${PAPERCLIP_MEMORY_RESERVATION:-1G}

 volumes:
@@ -56,7 +56,7 @@ TURBOOCR_LOG_FORMAT=json
 # First-start builds TRT engines; 12 G covers the GPU + engine compilation headroom.
 TURBOOCR_CPU_LIMIT=8.0
 TURBOOCR_MEMORY_LIMIT=12G
-TURBOOCR_CPU_RESERVATION=2.0
+TURBOOCR_CPU_RESERVATION=0.1
 TURBOOCR_MEMORY_RESERVATION=4G

 # Number of NVIDIA GPUs to reserve (GPU variant only)
@@ -70,4 +70,4 @@ TURBOOCR_LOG_MAX_SIZE=100m
 TURBOOCR_LOG_MAX_FILE=3

 # Timezone
-TZ=UTC
+TZ=UTC
@@ -70,7 +70,7 @@ services:
          cpus: ${TURBOOCR_CPU_LIMIT:-8.0}
          memory: ${TURBOOCR_MEMORY_LIMIT:-12G}
        reservations:
-          cpus: ${TURBOOCR_CPU_RESERVATION:-2.0}
+          cpus: ${TURBOOCR_CPU_RESERVATION:-0.1}
          memory: ${TURBOOCR_MEMORY_RESERVATION:-4G}
          devices:
            - driver: nvidia
@@ -102,7 +102,7 @@ services:
          cpus: ${TURBOOCR_CPU_LIMIT:-8.0}
          memory: ${TURBOOCR_MEMORY_LIMIT:-4G}
        reservations:
-          cpus: ${TURBOOCR_CPU_RESERVATION:-2.0}
+          cpus: ${TURBOOCR_CPU_RESERVATION:-0.1}
          memory: ${TURBOOCR_MEMORY_RESERVATION:-1G}
    shm_size: ${TURBOOCR_SHM_SIZE:-512m}