OpenAI API搭建的智能家居助手;私密大型语言模型(LLM)聊天机器人;视频和音频文件的自动化识别和翻译工具

✨ 1: GPT Home

基于Raspberry Pi和OpenAI API搭建的智能家居助手

GPT Home是一个基于Raspberry Pi和OpenAI API搭建的智能家居助手,功能上类似于Google Nest Hub或Amazon Alexa。通过详细的设置指南和配件列表,用户可以自行组装和配置这个设备,实现语音控制和智能家居管理的功能。

核心功能
  • 语音互动: 用户可以通过语音与GPT Home互动,询问天气、新闻、日历等信息。
  • 智能控制: 通过集成其他API和智能设备,如Spotify、Phillips Hue灯泡等,GPT Home能够控制家中的智能设备,实现灯光调节、音乐播放等功能。
  • 家庭助理: 设置提醒、闹钟、计时器,以及其他日常生活中的助理功能。
  • 教育娱乐: 提供互动游戏、教育内容,适合全家人使用。

GPT Home的搭建基于Ubuntu Server操作系统的Raspberry Pi,需要用户按照提供的配件列表购置必要的硬件,包括Raspberry Pi 4B、小型扬声器、OLED显示屏等。随后按照指南配置Wi-Fi、安装系统依赖、配置开机自启等步骤逐步完成。整个搭建过程需要一定的电脑操作能力,但教程提供了详细的指导和示例脚本,用户可以通过跟随教程逐步实施。

地址:https://github.com/judahpaul16/gpt-home

✨ 2: Secret Llama

在浏览器中运行的私密大型语言模型(LLM)聊天机器人

Secret Llama是一个完全在浏览器中运行的私密大型语言模型(LLM)聊天机器人,它支持Llama 3、Mistral等开源模型。借助于webllm提供的推理引擎,Secret Llama可以在不需要服务器和安装的情况下提供与ChatGPT相媲美的用户体验,并且还能够离线使用。最大的卖点是其绝对的隐私性 ------ 任何对话数据都不会离开你的电脑。

Secret Llama是一个面向隐私保护、便捷性和开源爱好者的大型语言模型聊天机器人解决方案,适用于各种希望在保证数据隐私的前提下使用或探索LLM的场景。

地址:https://github.com/abi/secret-llama

✨ 3: Chenyme-AAVT

用于视频和音频的自动识别与翻译

Chenyme-AAVT(AI Auto Video-Audio Translation)是一个针对视频和音频文件的自动化识别和翻译工具。它允许用户快速将视频或音频中的语言内容识别出来,并转换成所需的目标语言字幕,再将这些字幕合并回原视频或与之配合使用。

主要功能:
  1. 全自动识别和翻译: 对视频或音频中的语言内容进行自动识别和翻译,生成字幕文件。
  2. 支持多种语言和模型: 支持多种语言识别和翻译,以及使用不同的模型,如推荐使用faster-whisper和大型模型以获得更佳体验。
  3. GPU加速和VAD辅助: 支持GPU加速以提高处理速度,同时利用语音活动检测(VAD)辅助识别以提升准确性。
  4. 多种字幕格式输出和预览: 支持输出多种字幕格式,并提供字幕预览以及视频预览功能。
  5. 高级功能: 支持字幕编辑、二次精翻,以及视频内容的总结和问答等AI辅助功能。

地址:https://github.com/Chenyme/Chenyme-AAVT

✨ 4: DeepSeek-V2

先进的混合专家(Mixture-of-Experts,简称MoE)语言模型

DeepSeek-V2是一个先进的混合专家(Mixture-of-Experts,简称MoE)语言模型,它在训练和推理方面均体现出经济高效的特点。总的来说,DeepSeek-V2的关键特性包括其强大的性能、经济的训练成本、以及高效的推理能力。下面用通俗的语言对DeepSeek-V2的功能进行详细总结,并说明使用DeepSeek-V2的情况。

聊天模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat

基础模型:https://huggingface.co/deepseek-ai/DeepSeek-V2

地址:https://github.com/deepseek-ai/DeepSeek-V2

✨ 5: LangChain Swift

为iOS、macOS、watchOS 开发的LangChain 的Swift库

LangChain Swift是一个为iOS、macOS、watchOS(部分支持)以及visionOS(测试版)优化的Swift库,它使得在这些平台上使用语言模型变得简单。

LangChain Swift是一套强大的工具集,它使得在苹果的多个平台上整合和使用语言模型变成可能。无论你是想要构建一个简单的聊天机器人,还是开发一个复杂的基于AI的应用程序,LangChain Swift都提供了必要的工具和接口。

地址:https://github.com/buhe/langchain-swift

更多AI工具,参考国内AiBard123Github-AiBard123

相关推荐
vlln4 小时前
【论文速读】递归语言模型 (Recursive Language Models): 将上下文作为环境的推理范式
人工智能·语言模型·自然语言处理
犀思云5 小时前
如何通过网络即服务平台实现企业数字化转型?
运维·网络·人工智能·系统架构·机器人
机器视觉的发动机5 小时前
从实验室到工业现场:机器人视觉感知系统的边缘AI架构实战, 深度解析硬件选型、TensorRT量化加速与多传感器融合的极致优化方案
人工智能·机器人·视觉检测·人机交互·机器视觉
犀思云6 小时前
企业端到端NaaS连接的优势与应用
网络·人工智能·机器人·智能仓储·专线
玄同7659 小时前
告别 AgentExecutor:LangChain v1.0+ Agent 模块深度迁移指南与实战全解析
人工智能·语言模型·自然语言处理·langchain·nlp·agent·智能体
方芯半导体10 小时前
EtherCAT “通信 + 控制“ 的全国产化控制方案,ESC芯片(FCE1323)与国产MCU芯片功能板解析
xml·网络·单片机·嵌入式硬件·网络协议·机器人·自动化
阿杰学AI10 小时前
AI核心知识74——大语言模型之ReAct 范式(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·agent·react范式
2501_9481201510 小时前
大语言模型与爬虫技术融合的智能数据采集系统
人工智能·爬虫·语言模型
三佛科技-1341638421210 小时前
LP3716NCK 隔离型12V1A 12W茶炉板电源方案典型应用电路与设计关键
单片机·嵌入式硬件·物联网·智能家居·pcb工艺
DisonTangor10 小时前
美团龙猫开源LongCat-Flash-Lite
人工智能·语言模型·自然语言处理·开源·aigc