news 2026/2/8 2:57:57

基于ollama、llamafile部署的大模型使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于ollama、llamafile部署的大模型使用

一、ollama方式

1.本地部署ollama

部署方式:见本地部署ollama博客内容

2.基于langchain使用

from langchain_ollama.chat_models import ChatOllama llm = ChatOllama( model="deepseek-r1:8b", # 与本地 ollama run 的模型名保持一致 base_url="http://ip:11434", # 默认端口 temperature=0.1, num_predict=2048 ) # 单轮调用示例 for chunk in llm.stream( "你好" ): print(chunk.content)

二、llamafile方式

1.本地部署

步骤(linux环境)

wget https://huggingface.co/FM-1976/Qwen2.5-1.6b-llamafile/resolve/main/QwenPortable.llamafile chmod +x QwenPortable.llamafile ./QwenPortable.llamafile

2.基于langchain使用

from langchain_openai import ChatOpenAI # 配置本地模型:核心就是指向 llamafile 的 OpenAI兼容接口 llm = ChatOpenAI( base_url="http://ip:8080/v1", # 本地llamafile的API地址,固定 api_key="not-needed", # 必填但无效,随便填即可,llamafile不需要鉴权 model_name="not-needed", # 模型名随便填,不影响调用,llamafile会忽略 temperature=0.7, # 回答随机性,0=严谨,1=发散 max_tokens=128 # 最大生成字数 ) # 方式1:简单单轮对话 result = llm.invoke("你好") print(result.content)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/7 11:38:49

【课程设计/毕业设计】基于SpringBoot的企业工厂仓库管理系统的设计与实现【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/3 5:38:16

Java计算机毕设之基于Java的“银海”音乐管理系统音乐人上传、版权登记、用户在线试听与下载、个性化推荐(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/4 2:00:43

Java计算机毕设之基于SpringBoot的仓库管理系统库存管理、入库管理、出库管理、库存预警、盘点管理的设计与实现(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/8 2:51:32

不只是代码:一场关于 AOSP 目录架构与网络服务的深度旅行

🏙️ 第一部分:AOSP 目录结构——Android 数字城市的“总体规划图”想象一下,你要去一个从未去过的超级大城市(AOSP)。这个城市非常大,有几百万行代码。如果你没有地图,进去就会迷路。这个城市的…

作者头像 李华