作者:Matthew Yu
来自:Fab academy
在数字化时代的浪潮中,柴火创客空间作为创新与实践的摇篮,不仅为Fab Academy 2024的学员们提供了一个充满活力的学习和创作环境,更是将科技的力量与人文关怀深度融合。今天,我们自豪地介绍柴火创客空间辅导毕业的其中一位学员Matthew Yu的终极项目------Mr.M,一个集成了大型语言模型(LLM)的本地个人助理。其独特的设计理念和强大的功能,重新定义了我们与智能设备之间的互动。让我们深入了解Mr. M的诞生历程!
项目介绍
data:image/s3,"s3://crabby-images/9bb28/9bb28b45971a513861ef170c65ddfb258382e949" alt=""
项目概述
Mr.M基本工作:
-
它将在同一个 Wi-Fi 上接收来自 INMP441 和 XIAO ESP32C3 移动模块的音频消息(音频到波浪文件)。
-
然后它会将音频转换为单词(文本)并尝试理解它:对于已经提示的任务,将自动生成日历信息(JSX文件)。
-
相应的日历消息或一些也被提示的信息将通过MQTT发送到另一个移动模块,与ILI9341显示屏一起显示。
data:image/s3,"s3://crabby-images/0481f/0481f3b798bad4fada576076bab7968c31ae72fb" alt=""
功能模块介绍
麦克风输入:
data:image/s3,"s3://crabby-images/558f6/558f6fac4a69b995bedc0d85e208dbddda4e07c4" alt=""
这个输入可能看起来不太好,这是它的具体结构:
data:image/s3,"s3://crabby-images/7f011/7f011a27890d7fc4d2ef52720b3c83dc1dd71222" alt=""
PCB可以很好地贴合3D打印部件,但像左边一样,添加卡住柱子令人更加放心。
显示输出:
data:image/s3,"s3://crabby-images/b17e7/b17e71052b8d2325a7475bc28644d0e688a060b8" alt=""
UI操作图像(我真的为此感到非常自豪):
data:image/s3,"s3://crabby-images/93808/938083f21f5cc7d62f9a03ea762168649c00adc9" alt=""
材料清单
|--------------------------------------------------------|----|
| 原件 | 数量 |
| reComputer J4012 | x1 |
| reRouter | x1 |
| Monitor | x1 |
| XIAO ESP32C3 | x2 |
| INMP441 | x1 |
| 3 Pin Header SMD | x2 |
| Grove Female Header | x1 |
| ILI9341 | x1 |
| Grove RGB LED Ring | x1 |
| Power Supply Extension | x1 |
| Network Cable | x1 |
| Type-C Male Connector to Three Type-C Female Connector | x1 |
| M5*60 screw | x4 |
| M5 nut | x8 |
以下是材料总览:
data:image/s3,"s3://crabby-images/3d5c2/3d5c2f057b01b02434c5874a31523489c8d41b58" alt=""
微控制器接口与编程
首先是我的软件测试部分:
(输入)移动模块 - 原始音频数据到 WAV 文件:
功能:为电路板通电,它将记录并生成WAV文件并传输到服务器,其中IP由网络提供。
data:image/s3,"s3://crabby-images/d40b9/d40b94b5290935a068167cd93e80911a69b60ffb" alt=""
reComputer 可以读取 IP 并从临时服务器下载文件。
data:image/s3,"s3://crabby-images/d21f4/d21f4c0c37bdbb977bd1bc37dd3b577c22e290a2" alt=""
相关参考:(input) Mobile Module - Raw Audio Data to Words | Matthew's FabLab Journey (fabacademy.org)
WAV文件转文本 reComputer:
将WAV文件转换为文本,并将文本输入到LLM(Ollama API)中:
-
WAV 文件位于显示器的右上角。
-
左下角是交互式页面(docusaurus pages)运行的地方
-
左上角是下载音频文件的地方
相关参考:(input) Mobile Module - Raw Audio Data to Words | Matthew's FabLab Journey (fabacademy.org)
为了实现这部分,我需要在我的 reComputer 上设置一个 LLM 驱动的机器人:
data:image/s3,"s3://crabby-images/0f302/0f30278d067b2c5fde114bec8f894c3eddb8b85e" alt=""
有关聊天机器人的更多详细信息:Chat Bot(Local Server) | Matthew's FabLab Journey
为了让这个机器人看起来更好,我使用 GPT 本身来生成代码。
data:image/s3,"s3://crabby-images/5dd21/5dd217ea1ecc8babb283b54cc615a1ad1cd584ac" alt=""
有关UI操作页面设置的更多信息:Operating UI Setting | Matthew's FabLab Journey
音频文本到设计的日历标准(JSX):
我需要能够将我的单词(音频文本文件)翻译成docusaurus平台可以渲染的日历JSX标准文件:
data:image/s3,"s3://crabby-images/7918d/7918dea0ac738548e92232bc48ed33e5ec3081eb" alt=""
!注意:代码目前正在MAC上进行测试。但是 reComputer 和 MAC 都共享 Linux,因此代码是共享的。
有关本地LLM和自动生成tsx文件的更多信息:Local LLM and Auto-generation tsx file | Matthew's FabLab Journey (fabacademy.org)
为了正确使用 LLM,我需要使用 Prompt Enginner 很好地学习和应用:
data:image/s3,"s3://crabby-images/0ac55/0ac5550a6a929ad0f2f217b91f13f758ea7534d7" alt=""
有关提示设置的更多详细信息:Prompt Setup | Matthew's FabLab Journey (fabacademy.org)
(输出)移动模块 - 接收和显示日历信:
在reComputer生成标准JSX日历文件后,从处理后的文本文件。我将把消息从文本文件传输到移动模块并显示它,同时还可以控制一些东西。
data:image/s3,"s3://crabby-images/9f269/9f269d1b405d5441d3c925fb746442aad7258a18" alt=""
有关移动模块的更多详细信息 -接受和显示日历信息:(Output) Mobile Module - Receive and Display Calendar Information | Matthew's FabLab Journey
!注意:为了应用此功能,它需要 MQTT 函数,我已经在 reComputer 中应用,让它充当代理进行运行。
data:image/s3,"s3://crabby-images/84148/84148beaf34d008a4ec901e37683a842c972772c" alt=""
有关MQTT连接XIAO板子和Docusaurus-website的更多详细信息:MQTT connect with XIAO boards and Docusaurus-website | Matthew's FabLab Journey (fabacademy.org)
同时需要使用Docusaurus页面在network(reRouter)下构建和实现MQTT功能:
接口:
我使用我的作业网站页面设计机器人,并将所有无线功能放在一起。这些可以自动完成。
data:image/s3,"s3://crabby-images/d5307/d5307522dc31ddf7641f11aec83f39b377622bf3" alt=""
!注意:
自动化操作对于用户来说十分方便,但他们也可以在FAB Academy MQTT(MQTT broker (#18) · 议题 · Academany / Fab Academy / 2024 / Fab Academy 2024 Class · GitLab (fabcloud.org)) 下手动控制。例如:
data:image/s3,"s3://crabby-images/21ac6/21ac672caf162b544e57619fc892dd23ac188e97" alt=""
data:image/s3,"s3://crabby-images/edc42/edc42e7fff33a643df7423cc704aef0cf552ad33" alt=""
电子设计与生产
(输入)移动模块 - 原始音频数据转换文字:
我希望这个模块可以接收我的声音,它可以显示一些 RGB LED 灯,表明它正在工作,或者其他事情。然后我在其中连接两个 3 针接头 SMD。
data:image/s3,"s3://crabby-images/962f8/962f8c686853689d9a0ab5d28a8eef71bf169ffe" alt=""
有关(输入)移动模块的更多详细信息参考:(input) Mobile Module - PCB design | Matthew's FabLab Journey (fabacademy.org)
(输出)移动模块 - 接收和显示日历信息:
我希望这个模块接收日历信息,它可以控制一些东西,比如继电器。然后,我在PCB上添加了一个Grove端口和一个8 PinHeader P2.54mm:
data:image/s3,"s3://crabby-images/6df71/6df71c65323e3f4bf983a4fb7e32f9f9779ba83f" alt=""
data:image/s3,"s3://crabby-images/961c6/961c640993fb468edd05c38b9eeef8a88a025020" alt=""
有关(输出)移动模块的更多详细信息:(Output) Mobile Module - PCB design | Matthew's FabLab Journey (fabacademy.org)
外观结构设计
输入模块设计:
顶盖(3D打印):
data:image/s3,"s3://crabby-images/c4ac8/c4ac8ecf5e1018ad85f482306f0fbeeb55109347" alt=""
中间部分(3D打印):
data:image/s3,"s3://crabby-images/1f535/1f53546dfb18e77063cb68c9c481026a7b5f0c3e" alt=""
RGB灯罩部分(2D设计):
data:image/s3,"s3://crabby-images/08d58/08d5896f9a45c5c267851ac956d5bdc8e18c8adc" alt=""
最终成品:
data:image/s3,"s3://crabby-images/b9edb/b9edb04ee122027c5b5027396410b8edccda32c8" alt=""
将RGB灯接线与XIAO天线一起延长至背部:
data:image/s3,"s3://crabby-images/415a1/415a10f8565e1d4febf7898e1886b5e22e4db14c" alt=""
最后放置亚克力板盖上背部:
data:image/s3,"s3://crabby-images/549e6/549e648ed0726a0de25bcb8452a1cbce802c41bb" alt=""
输出模块设计:
显示器支架和 Grove 继电器支架(3D 打印):
data:image/s3,"s3://crabby-images/5dd7a/5dd7a481180f3ce3d019cf1838c7f09d641e6be5" alt=""
最终成品:
data:image/s3,"s3://crabby-images/6cd86/6cd8665bd31a4a94a1f9423a5a06137dab5c9958" alt=""
外壳设计-2D激光切割:
这部分工作是为了让作品看起来好看、整洁、合乎逻辑。
1、 RGB显示最好带有滤镜层。因此,在蓝图上切割一些亚克力板:
data:image/s3,"s3://crabby-images/d7dbd/d7dbd51d51f4480a7613e0277b427cef17940770" alt=""
data:image/s3,"s3://crabby-images/7dad2/7dad29ccb645567fbdf74aa3ad604006a1c67d33" alt=""
2、 由于我使用了一些大型设备/设备(reComputer 和 reRouter),我将使用两块大亚克力板将所有东西固定在一起:因此激光切割是必要的:
data:image/s3,"s3://crabby-images/8b88b/8b88bb11d54b4f0ffb31ab7628368581a2667f07" alt=""
data:image/s3,"s3://crabby-images/29cce/29cce3f88db0d04ee4000204c1d5f761655fc506" alt=""
机箱设计-3D打印:
这部分是为了让作品看起来好看、整洁、合乎逻辑。
1、我的设备需要得到支持、修复,而不是到处移动。因此,我需要设计一些 3D 零件来固定它们:
data:image/s3,"s3://crabby-images/8321f/8321f3555238913b1414f60d3343e9a534f0bebc" alt=""
出于其他考虑,我修改了初始方案:
data:image/s3,"s3://crabby-images/57e4b/57e4b8aed51260427617b19e630c1ea538d10c86" alt=""
整体搭建与封装
整体系统搭建基本思路:
data:image/s3,"s3://crabby-images/75e9a/75e9afcd3fb885d2b3759742566687e0f9b34dd7" alt=""
-
主要计算设备:reComputer,提供MQTT代理,AI计算,运行LLM和浏览器网站。
-
网络设备(我想确保所有东西都是本地的):reRouter,提供Wi-Fi无线连接和电线连接。
-
一个带INMP441的语音输入移动模块
-
一个带有ILI9341的显示信息移动模块。
整体系统:
data:image/s3,"s3://crabby-images/2dcf5/2dcf54102f8f2f6ffbae779868657b82847ab070" alt=""
显示器与电源适配器:
对于显示器而言,为了整体项目可携带的目标,我不得不考虑一个可携带的监视器。我买了一个显示器,具体尺寸如图所示:
data:image/s3,"s3://crabby-images/c1674/c1674244af7ba35f163b8b9196a569f2faa37a7e" alt=""
显示器后面有四个螺丝孔,然后我测量了螺丝孔到边缘的距离和孔之间的距离:
data:image/s3,"s3://crabby-images/716f6/716f60559b977caf226076c38b02327e5db9d280" alt=""
data:image/s3,"s3://crabby-images/e119c/e119cd93f051375532c440d605e0b7420e911943" alt=""
然后我需要计算显示板的长度,在这里一定要保证不会太长影响美观,也不会太短影响连接:
data:image/s3,"s3://crabby-images/d0a67/d0a670a2c814a0df33420975b03ef1f0e1fab554" alt=""
计算之后,我在OnShape上设计了显示器的附加板:
设计之后通过激光切割获得附加板:
data:image/s3,"s3://crabby-images/e5613/e5613f79f47b1074f331b26359fddb5dd34c2fb1" alt=""
data:image/s3,"s3://crabby-images/145f5/145f577aa6cff705746f7c05b9d4e6b430012d78" alt=""
对于电源适配器,我也需要将安装绑在一起:
data:image/s3,"s3://crabby-images/f89ab/f89ab534fff0838de1e62c6a7fdd726a3fe53a6e" alt=""
并且考虑到稳定显示器等问题,我需要在设计上保留每个板上的间隙:
底部:
data:image/s3,"s3://crabby-images/adfbb/adfbbee90c5784ebcc29db170e74433af80307df" alt=""
顶部:
data:image/s3,"s3://crabby-images/c992c/c992c7c7d48c973d5a8f30e941befdf516da00c2" alt=""
切割电路板并将模块插入其中:
data:image/s3,"s3://crabby-images/6fff1/6fff174a46ff12bfba502adc7dcc9d625b3abbee" alt=""
进行拧紧连接:
data:image/s3,"s3://crabby-images/58052/58052068cb04247bdf21f9cc041dbe4ca8a29633" alt=""
添加移动模块:
data:image/s3,"s3://crabby-images/bcba6/bcba6f0551072d37807fc01bf3fa9ef633171929" alt=""
将移动模块移到外面:
data:image/s3,"s3://crabby-images/e04b9/e04b9f84b10d3d8ab0809e62c45048e0ab9cafac" alt=""
至此,一个基于XIAO ESP32C3的本地个人助理已经搭建完成!