news 2026/6/10 1:04:44

极简LLM入门指南2

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
极简LLM入门指南2

环境搭建指南

要开发LLM应用,首先需要选择合适的开发环境。选择取决于你的资源、预算和项目需求。下面介绍三种常见方案。

方案选择

Google Colab是最低成本的选择,免费提供GPU资源,适合学习和测试。缺点是会话有时间限制,容易断连。

云GPU服务(如AutoDL、AWS)提供按需计费的GPU资源,适合需要持续运行但不想购买硬件的项目。成本在50-500美元/月之间。

本地GPU部署需要一次性硬件投入,但提供最大的灵活性和长期的成本优势。适合要长期开发或有特殊硬件需求的情况。

方案成本配置复杂度适用场景
Google Colab$0-49/月很简单学习和测试
云GPU服务$50-500/月中等短期项目
本地GPU初期$2000左右,后续电费复杂长期开发

Google Colab

Colab是最快入门的方式。只需要一个Google账户。

快速开始

  1. 打开 colab.research.google.com
  2. 新建笔记本
  3. 运行以下代码:
# 检查GPU!nvidia-smi# 安装依赖!pip install transformers torch accelerate# 测试fromtransformersimportpipeline pipe=pipeline("text-generation",model="gpt2")print(pipe("Hello")[0]['generated_text'])

保持Colab连接

Colab可能在你不活跃时断开连接。下面的代码可以定期点击保持活跃按钮:

# 防止断连importIPython IPython.display.Javascript(''' function KeepClicking(){ console.log("Keeping alive..."); document.querySelector("colab-connect-button").click() } setInterval(KeepClicking, 60000) ''')

云GPU服务

如果你需要更稳定的GPU资源,可以使用云GPU服务。国内有AutoDL,国外有AWS和其他供应商。

AutoDL(国内)

# 1. 注册 autodl.com# 2. 创建实例(RTX 4090, ¥2.8/小时)# 3. SSH连接sshroot@[实例IP]-p[端口]# 4. 一键配置conda create -n llmpython=3.10-y conda activate llm pipinstalltorch transformers accelerate

AWS/阿里云

# AWS (p3.2xlarge, $3/小时)aws ec2 run-instances\--image-id ami-0abcdef1234567890\--instance-type p3.2xlarge\--key-name MyKeyPair# 阿里云 (ecs.gn7i, ¥15/小时)aliyun ecs CreateInstance\--InstanceType ecs.gn7i-c8g1.2xlarge

本地GPU部署

本地部署给你最大的灵活性,但需要投入硬件和配置时间。下面介绍Windows、Linux和MacOS的配置方式。

Windows (WSL2)

# 1. 安装WSL2wsl--install Ubuntu-22.04 wsl--set-default-version 2# 2. 安装NVIDIA驱动(Windows侧)# 下载: nvidia.com/drivers# 3. WSL2内部配置wsl
# WSL2内部# 安装CUDAwgethttps://developer.download.nvidia.com/compute/cuda/12.3/local_installers/cuda_12.3_linux.runsudoshcuda_12.3_linux.run --toolkit --silent# 安装Python环境conda create -n llmpython=3.10conda activate llm pipinstalltorch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121# 验证python -c"import torch; print(torch.cuda.is_available())"

Ubuntu/Linux

#!/bin/bash# setup.sh - 一键安装脚本# 1. 更新系统sudoaptupdate&&sudoaptupgrade -y# 2. 安装NVIDIA驱动sudoaptinstallnvidia-driver-535 -y# 3. 安装CUDAwgethttps://developer.download.nvidia.com/compute/cuda/12.3/local_installers/cuda-repo-ubuntu2204-12-3-local_12.3.0-535.104.05-1_amd64.debsudodpkg -i cuda-repo-*.debsudoaptupdatesudoaptinstallcuda-toolkit-12-3 -y# 4. 配置环境变量echo'export PATH=/usr/local/cuda/bin:$PATH'>>~/.bashrcecho'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH'>>~/.bashrcsource~/.bashrc# 5. 安装Python包pipinstalltorch transformers accelerate bitsandbytes# 6. 验证nvidia-smi python -c"import torch; print(f'CUDA: {torch.cuda.is_available()}')"

MacOS (Apple Silicon)

# 1. 安装Homebrew/bin/bash -c"$(curl-fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"# 2. 安装Pythonbrewinstallpython@3.10# 3. 安装PyTorch (Metal支持)pip3install--pre torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/nightly/cpu# 4. 安装mlx (Apple优化)pip3installmlx# 5. 验证python3 -c"import torch; print(torch.backends.mps.is_available())"

本地模型运行工具:Ollama

Ollama可以在任何系统上简便地运行开源模型,无需复杂的配置。

安装

# Linux/WSLcurl-fsSL https://ollama.ai/install.sh|sh# MacOSbrewinstallollama# Windows# 下载: ollama.ai/download/windows

基本使用

# 启动服务ollama serve# 下载模型ollama pull llama3# 8B模型,需16GB内存ollama pull qwen2.5:7b# 7B模型,需14GB内存ollama pull phi3:mini# 3B模型,需6GB内存# 测试ollama run llama3"Hello"

Python API调用

importrequests response=requests.post('http://localhost:11434/api/generate',json={"model":"llama3","prompt":"What is machine learning?","stream":False})print(response.json()['response'])

Docker容器化部署

如果你倾向于使用Docker,可以通过Docker Compose快速启动包含Jupyter和Ollama的完整环境:

# docker-compose.ymlversion:'3.8'services:jupyter:image:pytorch/pytorch:2.1.0-cuda12.1-cudnn8-runtimeports:-"8888:8888"volumes:-./workspace:/workspacedeploy:resources:reservations:devices:-driver:nvidiacount:1capabilities:[gpu]command:>bash -c "pip install jupyterlab transformers accelerate && jupyter lab --ip=0.0.0.0 --allow-root --NotebookApp.token=''"ollama:image:ollama/ollamaports:-"11434:11434"volumes:-./ollama:/root/.ollamadeploy:resources:reservations:devices:-driver:nvidiacount:1capabilities:[gpu]
# 启动docker-compose up -d# 访问# Jupyter: http://localhost:8888# Ollama: http://localhost:11434

验证环境

安装完成后,应该验证环境是否正确配置。这个脚本会检查关键的依赖和硬件设置:

# test_env.pyimportsysimporttorchimporttransformersdeftest_environment():print("="*50)print("LLM环境检测")print("="*50)# Python版本print(f"Python:{sys.version}")# PyTorchprint(f"PyTorch:{torch.__version__}")print(f"CUDA可用:{torch.cuda.is_available()}")iftorch.cuda.is_available():print(f"GPU设备:{torch.cuda.get_device_name(0)}")print(f"GPU数量:{torch.cuda.device_count()}")print(f"CUDA版本:{torch.version.cuda}")# Transformersprint(f"Transformers:{transformers.__version__}")# 简单推理测试try:fromtransformersimportpipeline pipe=pipeline("text-generation",model="gpt2",device=0iftorch.cuda.is_available()else-1)result=pipe("Test",max_length=20)print(f"推理测试: ✓ 成功")exceptExceptionase:print(f"推理测试: ✗ 失败 -{e}")print("="*50)if__name__=="__main__":test_environment()

常见问题解决

问题解决方案
CUDA不可用检查GPU驱动是否安装。需要重新安装PyTorch的CUDA版本
内存不足使用更小的模型或启用量化(4-bit或8-bit)
模块导入失败运行pip install [缺失的包名]
GPU利用率低检查nvidia-smi是否检测到GPU,可能在使用CPU
WSL2检测不到GPU确保Windows驱动已更新,WSL2内核也需要更新
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 20:02:12

极简LLM入门指南4

Prompt工程:如何让AI更好地理解你 构建LLM应用的核心不只是调用API,更关键的是如何给模型写出有效的指令。同样的问题,用不同的方式提问,结果质量可能相差很大。这就是Prompt工程的核心价值。 本文需要先完成第03篇的内容&#xf…

作者头像 李华
网站建设 2026/6/9 2:29:07

MyBatis 扩展BaseTypeHandler 转换泛型 JSON 列表

最近发现一个mybatis里面json转换的bug, 写了这么多年Java这方面还是没有理清楚, 把正确的处理方法记录一下. 一. 对象JSON转换 这个是比较简单的情况, 有通用的处理方法, 例如 用Jackson实现一个通用的 TypeHandler Slf4j public class JacksonTypeHandler<T> extends B…

作者头像 李华
网站建设 2026/6/9 16:49:19

18、日期和时间管理函数全解析

日期和时间管理函数全解析 1. LAST_DAY 与 TRUNC、ADD_MONTHS 获取月末日期的差异 在处理日期时,我们常常需要获取一个月的最后一天。这里有两种常见的方法:使用 LAST_DAY 函数和结合 TRUNC 与 ADD_MONTHS 函数。 使用 LAST_DAY 函数 : select LAST_DAY(sysdate…

作者头像 李华
网站建设 2026/6/9 22:15:26

曾经的王,SpringBoot 倒下了!!!

2025年&#xff0c;不会AI的Java工程师&#xff0c;真的要被淘汰了吗&#xff1f;这两年AI编程确实很火热&#xff0c;甚至很多非程序员都能使用AI编程来开发APP应用&#xff0c;所有人都在看着程序员这个岗位什么时候能够被AI替代掉。但是反直觉的是&#xff0c;虽然在传统开发…

作者头像 李华
网站建设 2026/6/7 3:22:41

51、构建安全的 Syslog-ng 服务器:SSL 密钥创建与配置指南

构建安全的 Syslog-ng 服务器:SSL 密钥创建与配置指南 在网络管理中,确保日志服务器的安全性至关重要。本文将详细介绍在 Debian 和 Fedora 系统上为 Syslog-ng 服务器创建 SSL 密钥,以及配置 stunnel 和 Syslog-ng 的具体步骤。 1. 邮件服务器消息测试与访问控制 在进行…

作者头像 李华
网站建设 2026/6/8 10:56:30

4、F-RAN技术:应用案例与发展趋势

F-RAN技术:应用案例与发展趋势 1. F-RAN概述 F-RAN(Fog Radio Access Network)作为5G的先进技术解决方案,与仅使用C-RAN模式相比,通过自适应模型选择,F-RAN可以带来更高的频谱效率(SE)和更低的延迟,同时还能够提高能源效率(EE)。在实际的F-RAN中,关联模式是关键,…

作者头像 李华