news 2025/12/27 11:25:01

眼神交流+触摸感应,打造更贴心的小智AI:原理和实现

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
眼神交流+触摸感应,打造更贴心的小智AI:原理和实现

前文,分享了【小智Pro】系列文章:

30天,AI 陪我写了3万行代码,上线一款应用,3点血泪教训

零门槛为小智接入MCP,小智Pro焕新上线:MCP广场+自定义服务

得益于 ESP32 的强大,小智 AI 的生态不断壮大,接入的开发板琳琅满目:

除了语音对话,还能干点啥?

这正是小智Pro一直在探索的。

除了闹钟、音乐、知识库、记忆、天气实用价值

还应该提供情绪价值

前两天,朋友寄来了一块开发板 -zhengchen-eye

相比其它开发板,有两大特点:

  • 两块圆形串联LCD屏,可显示 gif 动图
  • 两块触摸板,可感知触摸强度

这两天,设备端调试成功,已加到小智Pro支持列表中,先看效果:

demo展示

今日分享,和大家聊聊:这两个功能的基本原理具体实现

1. 眼神交流

视频中的眨眼动作,本质上是写到设备中的gif 动图

因此,只需要设备端,为zhengchen-eye,自定义一份display即可。

下面上实操。

1.1 代码结构设计

xiaozhi-esp32display模块,采用面向对象的继承体系设计,清晰、可扩展。

核心是通过抽象基类,定义通用接口,然后根据不同类型的显示设备进行具体实现,层次结构如下:

Display (抽象基类) └── LvglDisplay (基于LVGL库的通用显示实现) ├── LcdDisplay (LCD显示屏通用实现) │ ├── SpiLcdDisplay (SPI接口LCD显示屏) │ ├── RgbLcdDisplay (RGB接口LCD显示屏) │ └── MipiLcdDisplay (MIPI接口LCD显示屏) ├── OledDisplay (OLED显示屏实现) └── EmoteDisplay (基于EMOTE引擎的表情显示实现,esp-box-3用到)

zhengchen-eye接入的是 LCD 屏,只需继承LcdDisplay,进行定制化开发即可:

LcdDisplay (LCD显示屏通用实现) └── ZhengchenEyeLcdDisplay (针对zhengchen-eye开发板的定制实现)

因为是特定板子的定制代码,我们放到boards/目录下:

./zhengchen-eye ├── zhengchen_eye_lcd_display.cc └── zhengchen_eye_lcd_display.h

1.2 基类代码详解

Display(display.h)是整个显示系统的抽象基类,定义了所有显示设备都应该具备的基本功能接口,比如:

  • 状态显示 (SetStatus)
  • 通知显示 (ShowNotification)
  • 表情显示 (SetEmotion)
  • 聊天消息显示 (SetChatMessage)
  • 状态栏更新 (UpdateStatusBar)

LvglDisplayDisplay的子类,实现了基于 LVGL 图形库的具体显示功能:

  • 基于 LVGL 的 UI 元素管理
  • 通知、状态栏等通用 UI 组件

LcdDisplayLvglDisplay的基础上,针对 LCD 显示屏,增加了更多相关功能:

  • LCD 面板初始化和配置
  • LVGL 与 LCD 硬件的对接
  • GIF 动画支持

1.3 自定义显示

display模块初始化时,会调用SetupUI来实现基于 LVGL 的 UI 元素管理。

不过,基类中的SetupUI不是虚方法。

在不改变通用代码的情况下,我们重写SetupUI函数,新增显示标签gif_label_

void ZhengchenEyeLcdDisplay::SetupUI() { ESP_LOGI(TAG, "Starting UI setup"); DisplayLockGuard lock(this); /* overlay */ overlay_container = lv_obj_create(container_); lv_obj_add_flag(overlay_container, LV_OBJ_FLAG_HIDDEN); // 默认隐藏 gif_label_ = lv_gif_create(overlay_container); lv_gif_set_src(gif_label_, &happy); }

然后,在板子初始化时,调用一次:

display_ = new ZhengchenEyeLcdDisplay(panel_io, panel, DISPLAY_WIDTH, DISPLAY_HEIGHT, DISPLAY_OFFSET_X, DISPLAY_OFFSET_Y, DISPLAY_MIRROR_X, DISPLAY_MIRROR_Y, DISPLAY_SWAP_XY); display_->SetupUI();

接下来,如何显示不同的gif 表情包

重写SetEmotion函数!

主程序会调用SetEmotion来显示不同的emoji,因此,只需把emoji改成gif就 OK 了。

下面用注释给大家解释下具体实现逻辑:

void ZhengchenEyeLcdDisplay::SetEmotion(const char* emotion) { // idle状态且 neutral 情绪 - 隐藏表情层,显示正常界面 // 否则显示表情层 // 根据emoji查找匹配的表情 }

效果如下:

2. 触摸感应

2.1 工作原理

ESP32 内置电容式触摸传感器,基于电容变化,实现触摸检测:

  • 电容构成: 每个触摸引脚与地之间存在寄生电容。
  • 触摸效应: 当手指靠近或触摸电极时,人体作为额外的电容,总电容值就会增大

因此,看电容值大小,不就知道是否触摸了?

看效果:

未触摸状态:电容保持在 3w-

触摸:电容增大到 13w+

松手:电容减少到 2w+

2.2 功能实现

ESP32 官方文档中,触摸传感器共有 10 个 IO 口。

zhengchen-eye这块板子用了两个:

void touch_init() { touch_pad_init(); touch_pad_config(TOUCH_PAD_NUM4); // 配置 GPIO4 为触摸引脚 touch_pad_config(TOUCH_PAD_NUM5); // 配置 GPIO5 为触摸引脚 }

然后,我们新增一个定时任务,实现触摸数据读取:

static void touch_read_task(void* arg) { zhengchen_eye* self = static_cast<zhengchen_eye*>(arg); while (1) { touch_pad_read_raw_data(TOUCH_PAD_NUM4, &self->touch_value); touch_pad_read_raw_data(TOUCH_PAD_NUM5, &self->touch_value1); ESP_LOGI(TAG, "Touch pad 4: %d, pad 5: %d", self->touch_value, self->touch_value1); vTaskDelay(2000 / portTICK_PERIOD_MS); } }

问题来了,小智怎么知道我有没有触摸呢?

2.3 两大使用场景

换句话说,这个触摸感应到底可以用在什么场景?

笔者认为,至少可以有两大使用场景

一是,小智在和用户互动时,通过 MCP 发起主动问询!

放在设备端即可:

当然,为了避免小智偷懒,让它每轮对话发起主动调用,更新提示词如下:

二是,定时任务中加个判断,发生触摸动作时,主动上传到服务端,服务端每日统计触摸值,可作为 AI 和用户的亲密度属性。

当然,还有更多使用场景,欢迎大开脑洞,评论区聊~

写在最后

本文分享了小智AI: 眼神交流+触摸感应的基本原理和具体实现。

如果对你有帮助,不妨点赞收藏备用。

固件已做好,放到小智Pro官方文档,免费自取👇:

https://ai.feishu.cn/wiki/IfTawES0mi0YTqk8GQ4cw4qOnD3

有任何想法,欢迎来聊👇:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/23 14:52:51

终极免费方案:AppSmith零代码构建企业级Web应用完整指南

终极免费方案&#xff1a;AppSmith零代码构建企业级Web应用完整指南 【免费下载链接】appsmith appsmithorg/appsmith: Appsmith 是一个开源的无代码开发平台&#xff0c;允许用户通过拖拽式界面构建企业级Web应用程序&#xff0c;无需编写任何后端代码&#xff0c;简化了软件开…

作者头像 李华
网站建设 2025/12/25 3:05:51

Cplex优化求解终极指南:1200页中文完整教程

Cplex优化求解终极指南&#xff1a;1200页中文完整教程 【免费下载链接】Cplex中文教程全资源下载 Cplex中文教程全资源下载 项目地址: https://gitcode.com/Open-source-documentation-tutorial/5a735 还在为复杂的优化问题而烦恼吗&#xff1f;这份长达1200页的Cplex中…

作者头像 李华
网站建设 2025/12/24 13:49:39

告别“知识黑洞”:当毕业论文写作变成一场与AI的优雅探戈

图书馆角落&#xff0c;咖啡因与焦虑混合的气味中&#xff0c;一位大四学生打开笔记本电脑&#xff0c;屏幕上不再是十几个散乱窗口&#xff0c;而是一个整洁的学术空间——这里&#xff0c;她的思考将与智能工具共舞。夜深了&#xff0c;实验室灯光仍然明亮&#xff0c;屏幕上…

作者头像 李华
网站建设 2025/12/24 15:29:15

学术迷宫的破局者:书匠策AI如何重塑毕业论文写作范式

当凌晨三点的实验室灯光依然明亮&#xff0c;屏幕前的你或许正盯着空白的文档&#xff0c;为选题迷茫、为逻辑混乱焦虑、为格式调整抓狂。在传统科研写作的迷宫中&#xff0c;研究者往往需要耗费80%的精力在技术性劳动上&#xff0c;而真正属于学术创新的思考空间却被不断挤压。…

作者头像 李华