news 2026/6/25 0:45:31

AI开发-python-langchain框架(1-8-1 缓存机制——让 AI 应用“记住”高频问题)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI开发-python-langchain框架(1-8-1 缓存机制——让 AI 应用“记住”高频问题)

想象一下,你现在是一家大型电商平台的AI架构师。双十一期间,你的智能客服系统每天要处理千万级的用户咨询。每个问题都要调用昂贵的GPT-API,响应慢、成本高,用户投诉飙升……这时候,你会怎么做?"

"我们会发现一个奇怪的现象——每天有30%的问题是完全相同的!用户都在问:'快递几天能到?'、'怎么退货?'、'商品有保修吗?'……每个问题都要调用GPT-4,每次花费0.03美元,一天就是数万美元!更糟的是,相同的回答,用户要等3-5秒才能看到……"

解决方案:引入缓存机制(如下使用sqlite当缓存数据库),当用户问道相同问题时,从缓存里直接给出答案不用将问题在送给大模型,既节约金钱成本也节约时间成本。

直接看代码:

from langchain_community.cache import SQLiteCache from langchain.globals import set_llm_cache from langchain_openai import ChatOpenAI import os #指定缓存 对比提问同样的问题,返回时间 set_llm_cache(SQLiteCache(database_path="langchain_demo.db")) llm = ChatOpenAI( api_key=os.getenv("DEEPSEEK_API_KEY"), base_url=os.getenv("DEEP_URL"), # Deepseek 的 API 基础地址 model="deepseek-v3:671b", # Deepseek 对话模型(可选:deepseek-chat-pro 等高级模型) temperature=0.7, # 温度参数(0-1,越低越稳定) max_tokens=1024 # 最大生成 tokens ) #这时会向数据库里插入一条数据 response =llm.invoke("hello world") print(response.content) #再插入一条数据 注:是否插入要根据提示词和调用的模型(模型参数改变也会认为是不同) response =llm.invoke("how are you") print(response.content) #这时就会从缓存里直接出结果不会送往大模型,数据库里也不会新插入一条数据 response =llm.invoke("hello world") print(response.content)

运行结果:可以看到 第一次的回答和第三次的回答是完全一样的。

Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊 Hey there! Thanks for asking! I'm functioning at full capacity and ready to help you out. While I don't experience feelings in the way humans do, I genuinely enjoy our conversations and am always excited to learn and assist. How can I support you today? I'm all ears! 🌟 Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊

我们可以看到,虽然我么提问了三次问题,但是缓存数据库里只有两条数据,说明第三次提问,回答是从缓存里走的。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/24 17:37:25

好写作AI:引注生成智能化中的学术溯源准确性研究

引注之痛:从格式烦恼到溯源危机“参考文献格式又错了!”“这句话的出处到底是哪篇文献?怎么找不到了?”对于撰写毕业论文的大学生而言,引注管理往往是耗时最长、最易出错的环节之一。传统的手动管理方式不仅效率低下&a…

作者头像 李华
网站建设 2026/6/18 16:39:32

激光清洗:解锁焊接一致性提升的密码

引言 在现代制造业中,焊接作为一种关键的连接工艺,广泛应用于各个领域,从汽车制造、航空航天到电子设备生产等。焊接质量的优劣直接关系到产品的性能、可靠性和使用寿命 ,而焊接前处理则是确保焊接质量的重要前提。激光清洗技术作为一种先进的表面处理方法,近年来在焊接前…

作者头像 李华
网站建设 2026/6/21 23:00:49

MySQL数据库的升级版PostgreSQL,有什么使用场景?

目录 一、PostgreSQL是什么二、缓冲区管理器介绍三、缓冲区管理器的应用场景四、如何定义缓冲区管理器 一、PostgreSQL是什么 PostgreSQL是一种高级的开源关系型数据库管理系统(RDBMS),它以其稳定性、可靠性和高度可扩展性而闻名。它最初由加…

作者头像 李华
网站建设 2026/6/15 18:29:42

js判断是否为小数的方法与常见问题解决

在JavaScript开发中,判断一个值是否为小数是一个看似简单却容易踩坑的任务。整数、负数、科学计数法以及字符串输入都可能干扰你的判断逻辑。直接使用typeof或简单的正则表达式往往不够可靠,需要更严谨的方法来覆盖各种边缘情况。 js判断小数如何避免整…

作者头像 李华
网站建设 2026/6/13 18:43:23

一直听说IT行业工资高,没想到网络安全的工资这么高!!!

今天看到一篇关于网络安全行业人才的研究报告,就忍不住想要给大家分享一下。 看到这里是不是很好奇,听起来这么高大上的工作,薪资与我们差别有多大呢? 报告显示2019年上半年,网络安全人才需求总体保持高速增长态势&a…

作者头像 李华