Paraformer-large权限控制添加：多用户登录验证部署-洪萨配资

Paraformer-large权限控制添加：多用户登录验证部署

1. 背景与目标

你已经成功部署了带有 Gradio 界面的 Paraformer-large 语音识别系统，可以通过网页上传音频并获得高质量的文字转写结果。但目前这个界面是完全开放的——任何知道地址的人都能访问、提交任务，存在安全风险。

在实际应用中，比如企业内部语音归档系统、客服录音处理平台或教育机构语音作业批改工具，我们往往需要对使用者进行身份管理。本文将带你一步步为现有的 Paraformer-large Gradio 应用添加多用户登录验证机制，实现权限控制，确保只有授权人员可以使用服务。

整个过程无需重构原有逻辑，只需在启动方式上做轻量级增强，适合已有项目的快速升级。

2. 多用户登录方案设计

2.1 方案选型：Gradio 内置认证 vs 自定义后端

Gradio 提供了两种常见的认证方式：

内置用户名密码列表（auth参数）：简单直接，适合固定少量用户
自定义认证函数（auth_fn）：可对接数据库、LDAP 或 OAuth，扩展性强

考虑到大多数用户场景下用户数量有限且管理集中，我们选择第一种方式实现“多用户登录”，后续也会介绍如何升级到动态验证。

2.2 安全策略规划

功能	实现方式
用户身份识别	预设用户名和密码
权限粒度	所有用户功能一致（基础权限模型）
密码存储	明文配置（小规模安全环境），建议后期加密
登录界面	使用 Gradio 原生弹窗

说明：本方案适用于团队协作、私有化部署等中小规模场景。若需更复杂权限体系（如角色分级、API密钥、会话过期），可在auth_fn中集成 Flask/FastAPI 实现。

3. 修改代码以支持多用户登录

我们需要修改原来的app.py文件，在demo.launch()启动时加入认证参数。

3.1 编辑应用文件

打开终端，编辑主程序文件：

vim /root/workspace/app.py

替换原有demo.launch()行，新增auth参数来定义多个用户及其密码。

3.2 更新后的完整代码示例

# app.py - 支持多用户登录的 Paraformer-large ASR 服务 import gradio as gr from funasr import AutoModel import os # 1. 加载模型 model_id = "iic/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch" model = AutoModel( model=model_id, model_revision="v2.0.4", device="cuda:0" # 使用 GPU 加速 ) def asr_process(audio_path): if audio_path is None: return "请先上传音频文件" res = model.generate( input=audio_path, batch_size_s=300, ) if len(res) > 0: return res[0]['text'] else: return "识别失败，请检查音频格式" # 2. 构建 Web 界面 with gr.Blocks(title="Paraformer 语音转文字控制台") as demo: gr.Markdown("# 🎤 Paraformer 离线语音识别转写") gr.Markdown("支持长音频上传，自动添加标点符号和端点检测。") with gr.Row(): with gr.Column(): audio_input = gr.Audio(type="filepath", label="上传音频或直接录音") submit_btn = gr.Button("开始转写", variant="primary") with gr.Column(): text_output = gr.Textbox(label="识别结果", lines=15) submit_btn.click(fn=asr_process, inputs=audio_input, outputs=text_output) # 3. 启动服务并启用多用户登录 if __name__ == "__main__": # 定义多个用户的用户名和密码 user_credentials = [ ("admin", "passw0rd"), ("user1", "abc123"), ("analyst", "data2025"), ("editor", "editnow") ] # 启动服务，开启认证 demo.launch( server_name="0.0.0.0", server_port=6006, auth=user_credentials # 启用多用户登录 )

3.3 关键改动说明

原始代码	新增内容	作用
`demo.launch(...)`	添加`auth=[(...), (...)]`	激活登录验证
无	定义`user_credentials`列表	存储多组账号密码
无	使用元组`(username, password)`格式	Gradio 认证标准格式

4. 设置开机自启与服务守护

为了让服务在重启后自动运行并保持稳定，我们需要更新服务启动命令。

4.1 更新镜像配置中的启动命令

进入镜像管理页面，修改“服务启动命令”为：

source /opt/miniconda3/bin/activate torch25 && cd /root/workspace && python app.py

确保：

Conda 环境已激活（torch25是示例环境名，请根据实际情况调整）
脚本路径正确指向/root/workspace/app.py

4.2 可选：使用 nohup 后台运行（调试阶段）

如果你希望手动启动并在后台持续运行：

nohup python app.py > asr.log 2>&1 &

查看日志：

tail -f asr.log

5. 访问受保护的服务

5.1 建立 SSH 隧道

由于平台限制，仍需通过本地映射访问：

ssh -L 6006:127.0.0.1:6006 -p [你的SSH端口] root@[你的实例IP]

连接成功后，在本地浏览器打开：

👉http://127.0.0.1:6006

5.2 登录界面展示

此时不会直接进入主界面，而是弹出一个登录框：

Username: admin Password: passw0rd

输入正确的凭据后，方可进入语音识别界面。

提示：错误尝试超过3次会被临时锁定（Gradio 默认机制）。

6. 进阶优化建议

虽然当前方案已满足基本需求，但在生产环境中可进一步提升安全性与可维护性。

6.1 使用环境变量管理密码（推荐）

避免将密码硬编码在代码中，可通过.env文件加载：

import os from dotenv import load_dotenv load_dotenv() user_credentials = [ (os.getenv("USER1_NAME"), os.getenv("USER1_PASS")), (os.getenv("USER2_NAME"), os.getenv("USER2_PASS")) ]

.env文件内容：

USER1_NAME=admin USER1_PASS=passw0rd USER2_NAME=user1 USER2_PASS=abc123

记得将.env加入.gitignore，防止泄露。

6.2 动态认证函数（适用于更大规模）

使用auth_fn自定义逻辑，例如查询数据库或校验 JWT：

def verify_user(username, password): valid_users = { "admin": "passw0rd", "user1": "abc123" } return valid_users.get(username) == password demo.launch(auth=verify_user, ...)

这种方式便于集成外部系统。

6.3 添加访问日志记录

可以在asr_process函数中加入日志输出，追踪谁在何时使用了服务：

import logging logging.basicConfig(filename='asr_access.log', level=logging.INFO) def asr_process(audio_path): username = gr.request.username # 获取当前登录用户 logging.info(f"[{username}] 提交识别任务: {audio_path}") # ...后续处理