再也不怕忘记启动服务,这个脚本让我彻底解放双手
你有没有过这样的经历:辛辛苦苦部署好一个服务,测试运行一切正常,信心满满地关机睡觉——结果第二天一早打开电脑,发现服务根本没起来?手动启动、检查日志、排查端口冲突……一套操作下来,半小时没了。更糟的是,如果这是个无人值守的边缘设备或远程服务器,一次遗漏就可能导致整个业务链路中断。
别担心,这不是你的错,而是缺少一个真正可靠的开机自启机制。今天这篇文章不讲复杂原理,不堆晦涩参数,只用一个清晰、稳定、跨发行版的实践方案,帮你把“每次开机都要手动敲命令”这件事,从待办清单里永久划掉。
本文基于真实部署场景验证,适用于 CentOS 7/8 和 Ubuntu 18.04/20.04/22.04 等主流 Linux 发行版,无需安装额外工具,不依赖 systemd 的高级特性,兼容传统 SysV init 和 modern hybrid 模式。所有步骤均可复制粘贴执行,5 分钟内完成配置。
1. 明确目标:我们要自动化什么
在动手前,先理清核心诉求:
- 服务必须随系统启动自动运行,不是用户登录后才启动
- 失败时有明确反馈,不能静默退出或卡死
- 支持手动启停控制,方便日常维护和调试
- 不干扰其他服务依赖关系,避免因启动顺序导致失败
我们不追求“最炫酷”的写法,而要“最稳当”的落地。因此,本文采用经典的/etc/init.d/+rcN.d/软链接方式——它被验证了二十多年,至今仍是生产环境首选方案之一。
提示:虽然 systemd 已成主流,但很多企业级镜像(尤其是轻量容器化部署)仍保留 SysV 兼容层。本方案正是为这类真实场景而生,不是教科书里的“理论最优解”,而是运维一线的“经验最优解”。
2. 准备你的启动脚本
我们以一个典型的服务为例:一个监听本地 8080 端口的 Python HTTP 服务(实际可替换为你自己的任何程序)。脚本需具备标准的start/stop/status接口,这是 SysV init 识别和管理服务的基础。
2.1 创建可执行脚本文件
在终端中执行以下命令,创建/etc/init.d/mytest.sh:
sudo tee /etc/init.d/mytest.sh << 'EOF' #!/bin/bash # chkconfig: 2345 99 01 # description: My Test Service - a simple HTTP server for demo # processname: mytest DAEMON="/usr/bin/python3" DAEMON_OPTS="/opt/mytest/app.py" PIDFILE="/var/run/mytest.pid" LOGFILE="/var/log/mytest.log" start() { echo -n "Starting mytest service: " if [ -f $PIDFILE ]; then PID=$(cat $PIDFILE) if kill -0 $PID > /dev/null 2>&1; then echo "already running (PID: $PID)" return 0 fi fi # 启动服务并记录 PID $DAEMON $DAEMON_OPTS >> $LOGFILE 2>&1 & echo $! > $PIDFILE echo "done (PID: $(cat $PIDFILE))" } stop() { echo -n "Stopping mytest service: " if [ -f $PIDFILE ]; then PID=$(cat $PIDFILE) if kill -15 $PID > /dev/null 2>&1; then # 等待优雅退出 for i in {1..10}; do if ! kill -0 $PID > /dev/null 2>&1; then rm -f $PIDFILE echo "stopped" return 0 fi sleep 1 done # 强制终止 kill -9 $PID 2>/dev/null rm -f $PIDFILE echo "killed" else echo "not running" fi else echo "not running" fi } status() { if [ -f $PIDFILE ]; then PID=$(cat $PIDFILE) if kill -0 $PID > /dev/null 2>&1; then echo "mytest is running (PID: $PID)" return 0 else echo "mytest is not running (stale PID file)" rm -f $PIDFILE fi else echo "mytest is not running" fi } case "$1" in start) start ;; stop) stop ;; restart) stop sleep 2 start ;; status) status ;; *) echo "Usage: $0 {start|stop|restart|status}" exit 1 ;; esac exit 0 EOF2.2 设置权限并验证语法
sudo chmod +x /etc/init.d/mytest.sh sudo /etc/init.d/mytest.sh status此时应输出mytest is not running。如果你已有自己的服务程序,只需修改脚本中的DAEMON和DAEMON_OPTS变量即可,其余逻辑通用。
小技巧:脚本开头的
# chkconfig:行是给chkconfig工具用的(CentOS),Ubuntu 用户可忽略,但它不影响功能,保留无害且增强兼容性。
3. 确认系统默认运行级别
不同发行版默认启动级别略有差异,这决定了服务该放入哪个rcN.d/目录。我们用一条命令快速确认:
runlevel输出类似N 5或3,其中第二个数字就是当前默认运行级别(5表示图形界面,3表示多用户文本模式)。绝大多数服务器环境使用3或5,桌面环境多为5。
注意:Ubuntu 18.04+ 默认使用 systemd,但
/etc/rc*.d/仍被保留并由systemd-sysv-generator自动映射。所以即使你看到systemd,这套方案依然有效。
4. 建立启动软链接
根据上一步得到的运行级别(假设为5),进入对应目录并创建软链接:
cd /etc/rc5.d/ sudo ln -sf /etc/init.d/mytest.sh S99mytest这里S99mytest的含义是:
S表示Start(启动)99是启动优先级,数值越大越晚执行(确保数据库、网络等基础服务已就绪)mytest是服务标识名,清晰易读
如果你的runlevel输出是3,则执行:
cd /etc/rc3.d/ sudo ln -sf /etc/init.d/mytest.sh S99mytest验证是否成功:运行
ls -l S99*,应看到类似S99mytest -> /etc/init.d/mytest.sh的输出。注意使用-sf参数强制覆盖,避免重复创建。
5. 测试与验证:三步确认万无一失
光配置完还不够,必须通过真实测试闭环验证。我们分三步走:
5.1 手动触发启动流程
sudo /etc/init.d/mytest.sh start sudo /etc/init.d/mytest.sh status应看到类似mytest is running (PID: 12345)的输出。同时检查端口是否监听:
sudo ss -tuln | grep :8080若看到LISTEN状态,说明服务已正确运行。
5.2 模拟系统重启(不真重启)
为避免中断工作,我们用telinit命令模拟切换运行级别(仅限支持 SysV 的系统):
# 切换到单用户模式再切回,触发 rc scripts 重载 sudo telinit 1 sudo telinit 5然后再次检查状态:
sudo /etc/init.d/mytest.sh status如果仍显示运行中,说明软链接已生效。
5.3 真机重启验证(推荐在测试环境)
最后,在可控环境中执行一次完整重启:
sudo reboot机器重启后,等待 1–2 分钟,SSH 登录,立即执行:
sudo /etc/init.d/mytest.sh status成功标志:输出mytest is running,且你的服务功能完全可用(如能 curl 通 8080 端口)。
实战提醒:首次部署建议在虚拟机或测试服务器进行。若服务启动失败,查看
/var/log/mytest.log和journalctl -u mytest(systemd 环境)快速定位问题。
6. 日常维护与排错指南
配置不是一劳永逸,掌握几个关键命令,让你随时掌控服务状态:
6.1 快速启停与状态检查
# 启动 sudo service mytest start # 停止 sudo service mytest stop # 重启(推荐用于配置更新后) sudo service mytest restart # 查看状态 sudo service mytest status注:
service命令是/etc/init.d/脚本的统一入口,比直接调用脚本更规范,也兼容 systemd。
6.2 常见问题与解决思路
| 现象 | 可能原因 | 解决方法 |
|---|---|---|
service mytest status显示 not running,但手动start成功 | 脚本未写入rc5.d/或链接错误 | 检查ls -l /etc/rc5.d/S99*,确认软链接指向正确路径 |
重启后服务未启动,但手动start正常 | 启动顺序冲突(如依赖的数据库未就绪) | 将S99mytest改为S98mytest或更低序号,或在脚本start()中加入sleep 3等待 |
日志中报Permission denied | 脚本无执行权限或路径权限不足 | sudo chmod +x /etc/init.d/mytest.sh,确保DAEMON_OPTS指向的文件可读 |
PID file exists but process not found | 上次异常退出未清理 PID 文件 | sudo rm -f /var/run/mytest.pid,再start |
6.3 卸载方案(安全删除)
如需移除开机自启,只需两步:
# 1. 删除软链接 sudo rm -f /etc/rc3.d/S99mytest /etc/rc5.d/S99mytest # 2. 删除脚本(可选) sudo rm -f /etc/init.d/mytest.sh sudo rm -f /var/log/mytest.log /var/run/mytest.pid整个过程无残留,干净利落。
7. 进阶建议:让自动化更可靠
以上方案已足够应对 95% 的场景,但如果你希望进一步提升健壮性,可考虑以下三点轻量优化:
7.1 添加健康检查钩子
在脚本start()函数末尾加入简单连通性验证:
# 启动后等待 2 秒,检查端口是否就绪 sleep 2 if ! nc -z 127.0.0.1 8080; then echo "WARNING: service started but port 8080 not responding" # 可选:发送告警邮件或写入日志 fi7.2 使用 logrotate 管理日志
避免日志文件无限增长,创建/etc/logrotate.d/mytest:
/var/log/mytest.log { daily missingok rotate 14 compress delaycompress notifempty create 644 root root }7.3 统一服务管理(systemd 用户)
如果你确定只用 systemd,可将上述脚本转换为原生 service 文件(非必需,但更现代):
sudo tee /etc/systemd/system/mytest.service << 'EOF' [Unit] Description=My Test Service After=network.target [Service] Type=simple User=root WorkingDirectory=/opt/mytest ExecStart=/usr/bin/python3 /opt/mytest/app.py Restart=on-failure RestartSec=10 StandardOutput=append:/var/log/mytest.log StandardError=append:/var/log/mytest.log [Install] WantedBy=multi-user.target EOF sudo systemctl daemon-reload sudo systemctl enable mytest sudo systemctl start mytest注意:此方案与前述 SysV 方案互斥,请勿同时启用。选择一种并坚持使用即可。
8. 总结:从“记得做”到“自动做”的思维转变
到这里,你已经拥有了一个经过实战检验的开机自启解决方案。它不依赖云平台、不绑定特定框架、不引入新组件,纯粹利用 Linux 系统自带能力,却解决了最让人头疼的运维痛点。
回顾整个过程,真正的价值不仅在于那几行命令,而在于建立了一种自动化思维:
- 服务即配置:把服务生命周期(启停、状态、日志)封装进脚本,它就成了可版本化、可复用的资产
- 启动即契约:
S99mytest不只是一个文件名,它是你和系统之间的一份约定——“请在我需要时,准时唤醒它” - 稳定即习惯:不再靠记忆,而是靠机制;不再临时救火,而是提前设防
下次当你部署一个新的 API 服务、一个数据采集器、一个本地 AI 推理节点时,只需复制这份脚本模板,改几处路径,加一行软链接——你的服务,从此真正“活”在系统里。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。