OpenAI API搭建的智能家居助手;私密大型语言模型(LLM)聊天机器人;视频和音频文件的自动化识别和翻译工具

✨ 1: GPT Home

基于Raspberry Pi和OpenAI API搭建的智能家居助手

GPT Home是一个基于Raspberry Pi和OpenAI API搭建的智能家居助手,功能上类似于Google Nest Hub或Amazon Alexa。通过详细的设置指南和配件列表,用户可以自行组装和配置这个设备,实现语音控制和智能家居管理的功能。

核心功能
  • 语音互动: 用户可以通过语音与GPT Home互动,询问天气、新闻、日历等信息。
  • 智能控制: 通过集成其他API和智能设备,如Spotify、Phillips Hue灯泡等,GPT Home能够控制家中的智能设备,实现灯光调节、音乐播放等功能。
  • 家庭助理: 设置提醒、闹钟、计时器,以及其他日常生活中的助理功能。
  • 教育娱乐: 提供互动游戏、教育内容,适合全家人使用。

GPT Home的搭建基于Ubuntu Server操作系统的Raspberry Pi,需要用户按照提供的配件列表购置必要的硬件,包括Raspberry Pi 4B、小型扬声器、OLED显示屏等。随后按照指南配置Wi-Fi、安装系统依赖、配置开机自启等步骤逐步完成。整个搭建过程需要一定的电脑操作能力,但教程提供了详细的指导和示例脚本,用户可以通过跟随教程逐步实施。

地址:https://github.com/judahpaul16/gpt-home

✨ 2: Secret Llama

在浏览器中运行的私密大型语言模型(LLM)聊天机器人

Secret Llama是一个完全在浏览器中运行的私密大型语言模型(LLM)聊天机器人,它支持Llama 3、Mistral等开源模型。借助于webllm提供的推理引擎,Secret Llama可以在不需要服务器和安装的情况下提供与ChatGPT相媲美的用户体验,并且还能够离线使用。最大的卖点是其绝对的隐私性 ------ 任何对话数据都不会离开你的电脑。

Secret Llama是一个面向隐私保护、便捷性和开源爱好者的大型语言模型聊天机器人解决方案,适用于各种希望在保证数据隐私的前提下使用或探索LLM的场景。

地址:https://github.com/abi/secret-llama

✨ 3: Chenyme-AAVT

用于视频和音频的自动识别与翻译

Chenyme-AAVT(AI Auto Video-Audio Translation)是一个针对视频和音频文件的自动化识别和翻译工具。它允许用户快速将视频或音频中的语言内容识别出来,并转换成所需的目标语言字幕,再将这些字幕合并回原视频或与之配合使用。

主要功能:
  1. 全自动识别和翻译: 对视频或音频中的语言内容进行自动识别和翻译,生成字幕文件。
  2. 支持多种语言和模型: 支持多种语言识别和翻译,以及使用不同的模型,如推荐使用faster-whisper和大型模型以获得更佳体验。
  3. GPU加速和VAD辅助: 支持GPU加速以提高处理速度,同时利用语音活动检测(VAD)辅助识别以提升准确性。
  4. 多种字幕格式输出和预览: 支持输出多种字幕格式,并提供字幕预览以及视频预览功能。
  5. 高级功能: 支持字幕编辑、二次精翻,以及视频内容的总结和问答等AI辅助功能。

地址:https://github.com/Chenyme/Chenyme-AAVT

✨ 4: DeepSeek-V2

先进的混合专家(Mixture-of-Experts,简称MoE)语言模型

DeepSeek-V2是一个先进的混合专家(Mixture-of-Experts,简称MoE)语言模型,它在训练和推理方面均体现出经济高效的特点。总的来说,DeepSeek-V2的关键特性包括其强大的性能、经济的训练成本、以及高效的推理能力。下面用通俗的语言对DeepSeek-V2的功能进行详细总结,并说明使用DeepSeek-V2的情况。

聊天模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat

基础模型:https://huggingface.co/deepseek-ai/DeepSeek-V2

地址:https://github.com/deepseek-ai/DeepSeek-V2

✨ 5: LangChain Swift

为iOS、macOS、watchOS 开发的LangChain 的Swift库

LangChain Swift是一个为iOS、macOS、watchOS(部分支持)以及visionOS(测试版)优化的Swift库,它使得在这些平台上使用语言模型变得简单。

LangChain Swift是一套强大的工具集,它使得在苹果的多个平台上整合和使用语言模型变成可能。无论你是想要构建一个简单的聊天机器人,还是开发一个复杂的基于AI的应用程序,LangChain Swift都提供了必要的工具和接口。

地址:https://github.com/buhe/langchain-swift

更多AI工具,参考国内AiBard123Github-AiBard123

相关推荐
道可云24 分钟前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
Yawesh_best32 分钟前
思源笔记轻松连接本地Ollama大语言模型,开启AI写作新体验!
笔记·语言模型·ai写作
人工智能培训咨询叶梓34 分钟前
探索开放资源上指令微调语言模型的现状
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·指令微调
软工菜鸡43 分钟前
预训练语言模型BERT——PaddleNLP中的预训练模型
大数据·人工智能·深度学习·算法·语言模型·自然语言处理·bert
vivid_blog1 小时前
大语言模型(LLM)入门级选手初学教程 III
人工智能·语言模型·自然语言处理
微凉的衣柜1 小时前
Meta AI 推出机器人开源项目:推动触觉感知和人机交互的前沿研究
人工智能·机器人·人机交互
袁牛逼1 小时前
自动打电话机器人,好用吗?
机器人
资源补给站1 小时前
论文2—《基于柔顺控制的智能神经导航手术机器人系统设计》文献阅读分析报告
机器学习·机器人·手术机器人
袁牛逼1 小时前
ai外呼机器人的作用有哪些?
人工智能·机器人
使者大牙2 小时前
【大语言模型学习笔记】第一篇:LLM大规模语言模型介绍
笔记·学习·语言模型