WeChatMsg: 导出微信聊天记录 | 开源日报 No.108

Mozilla-Ocho/llamafile

Stars: 3.5k License: NOASSERTION

llamafile 是一个开源项目,旨在通过将 lama.cpp 与 Cosmopolitan Libc 结合成一个框架,将 LLM (Large Language Models) 的复杂性折叠到单个文件可执行程序中,并使其能够在大多数计算机上本地运行而无需安装。该项目的主要功能和核心优势包括:

  • 可以在多种 CPU 微体系结构上运行
  • 支持六种操作系统:macOS、Windows、Linux、FreeBSD、OpenBSD 和 NetBSD
  • llamafiles 可以嵌入 LLM 权重
  • 用户可以使用外部权重创建自己的 llamafiles 并轻松分享给其他人

LC044/WeChatMsg

Stars: 3.4k License: GPL-3.0

这个项目是一个用于解密微信数据库并还原聊天记录的工具。其主要功能包括解密手机本地和 PC 端微信数据库、还原微信聊天界面中的文本、图片、表情包等内容,并可以导出聊天记录到 sqlite 数据库、HTML 文件以及其他格式,同时也支持分析聊天数据做成可视化年报。该项目不断更新中,且提供了 QQ 群方便用户交流反馈问题或建议。

  • 解密手机本地和 PC 端微信数据库
  • 还原各种类型的消息内容 (文字、图片等)
  • 导出多种格式的聊天记录
  • 支持分析数据制作可视化年报
  • 有定期更新维护
  • 提供 QQ 群进行交流与反馈

pytorch-labs/gpt-fast

Stars: 2.0k License: BSD-3-Clause

gpt-fast 是一个简单而高效的基于 PyTorch 原生实现的 transformer 文本生成工具。其主要功能包括低延迟、少于 1000 行 Python 代码、无需依赖除了 PyTorch 和 sentencepiece 之外的其他库、支持 int8/int4 量化等特性。此项目旨在展示使用原生 PyTorch 可以获得怎样的性能,不打算成为 "框架" 或 "库"。同时该项目还提供了模型下载指南以及针对各种技术评测,并且有一些实验性质的功能。

  • 低延迟
  • 少于 1000 行 Python 代码
  • 无需额外依赖
  • 支持 int8/int4 量化
  • 具备推理加速 (Speculative decoding)
  • 张量并行计算 (Tensor parallelism)
  • 支持 Nvidia 和 AMD GPU

mlabonne/llm-course

Stars: 1.7k License: Apache-2.0

这个项目是一个大型语言模型课程,分为三部分:LLM 基础知识、LLM 科学家和 LLM 工程师。主要功能包括提供与大型语言模型相关的笔记本和文章,并涵盖了有关数学、Python 编程、神经网络以及自然语言处理等方面的重要知识。该项目的核心优势和特点包括:

  • 提供丰富而全面的教育资源,如视频解释线性代数概念 (3Blue1Brown)、统计基础 (StatQuest with Josh Starmer) 等。
  • 介绍 Python 编程在机器学习中的应用,并推荐相应资料如 Real Python 和 freeCodeCamp 的教材。
  • 深入讨论神经网络结构设计原理并提供 PyTorch 教程 (Patrick Loeber - PyTorch Tutorials) 等实践指南。

BurntSushi/ripgrep

Stars: 41.4k License: Unlicense

ripgrep 是一个面向行的搜索工具,可以递归地在当前目录中搜索正则表达式模式。默认情况下,ripgrep 会遵守 gitignore 规则,并自动跳过隐藏文件/目录和二进制文件。核心优势如下:

  • 可以替代其他搜索工具并且通常更快
  • 默认进行递归搜索并自动过滤
  • 支持多种 grep 特性,例如显示匹配结果上下文、同时搜索多个模式等
  • 有 PCRE2 引擎支持及部分替换功能
  • 支持不同编码格式和压缩格式的文件检索

abhishekkrthakur/approachingalmost

Stars: 4.1k License: NOASSERTION

Approaching (Almost) Any Machine Learning Problem 是一个开源项目,它提供了一本关于机器学习问题的书籍。

该项目具有以下核心优势和特性:

  • 提供全面而深入的指导:这本书涵盖了接近 (几乎) 任何机器学习问题所需的基础知识和技能。无论您是初学者还是经验丰富的专业人士,都可以从中获得实用、可操作且易于理解的建议。
  • 实践驱动方法:通过示例代码、案例研究和真实数据集等方式,作者帮助读者将概念应用到实际场景中,并展示如何处理各种挑战与难题。
  • 广泛覆盖不同领域:该书介绍了多个常见领域内最重要或最困难的机器学习问题,并为每个问题类型提供详尽说明。无论您在自然语言处理、计算机视觉还是推荐系统方面工作,在这里都能找到相关内容。
相关推荐
埃菲尔铁塔_CV算法22 分钟前
深度学习神经网络创新点方向
人工智能·深度学习·神经网络
艾思科蓝-何老师【H8053】40 分钟前
【ACM出版】第四届信号处理与通信技术国际学术会议(SPCT 2024)
人工智能·信号处理·论文发表·香港中文大学
SafePloy安策1 小时前
ES信息防泄漏:策略与实践
大数据·elasticsearch·开源
weixin_452600691 小时前
《青牛科技 GC6125:驱动芯片中的璀璨之星,点亮 IPcamera 和云台控制(替代 BU24025/ROHM)》
人工智能·科技·单片机·嵌入式硬件·新能源充电桩·智能充电枪
学术搬运工1 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理
用户3157476081351 小时前
成为程序员的必经之路” Git “,你学会了吗?
面试·github·全栈
右恩1 小时前
AI大模型重塑软件开发:流程革新与未来展望
人工智能
学编程的小程1 小时前
【安全通信】告别信息泄露:搭建你的开源视频聊天系统briefing
安全·开源·音视频
问道飞鱼2 小时前
【微服务知识】开源RPC框架Dubbo入门介绍
微服务·rpc·开源·dubbo
图片转成excel表格2 小时前
WPS Office Excel 转 PDF 后图片丢失的解决方法
人工智能·科技·深度学习