datawhale

华尔街的幻觉

Datawhale AI夏令营——列车信息智能问答——科大讯飞AI大赛（基于结构化数据的用户意图理解和知识问答挑战赛）坐火车的你，遇到过这样的场景吗？我们这次将一起来探索——如何让AI“看懂”列车时刻表！你随口一问（比如“K123在哪检票？”），AI秒回精准答案！告别抓狂！

我怎么又饿了呀

DataWhale-零基础络网爬虫技术（三、爬虫进阶技术）

IT从业者张某某

大语言模型-2.1-Transformer架构及详细配置本博客内容是《大语言模型》一书的读书笔记，该书是中国人民大学高瓴人工智能学院赵鑫教授团队出品，覆盖大语言模型训练与使用的全流程，从预训练到微调与对齐，从使用技术到评测应用，帮助学员全面掌握大语言模型的核心技术。并且，课程内容基于大量的代码实战与讲解，通过实际项目与案例，学员能将理论知识应用于真实场景，提升解决实际问题的能力。

土豆土豆，我是洋芋

《大语言模型》学习笔记（二）对于大语言模型，本书泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模型相比，大语言模型的构建过程涉及到更为复杂的训练方法，进而展现出了强大的自然语言理解能力和复杂任务求解能力（通过文本生成的形式）。本部分将介绍大语言模型的构建过程、扩展法则（ScalingLaw）、涌现能力（EmergentAbilities）。

IT从业者张某某

大语言模型-1.3-GPT、DeepSeek模型介绍本博客内容是《大语言模型》一书的读书笔记，该书是中国人民大学高瓴人工智能学院赵鑫教授团队出品，覆盖大语言模型训练与使用的全流程，从预训练到微调与对齐，从使用技术到评测应用，帮助学员全面掌握大语言模型的核心技术。并且，课程内容基于大量的代码实战与讲解，通过实际项目与案例，学员能将理论知识应用于真实场景，提升解决实际问题的能力。

IT从业者张某某

大语言模型-01-语言模型发展历程-02-从神经网络到ELMo本博客内容是《大语言模型》一书的读书笔记，该书是中国人民大学高瓴人工智能学院赵鑫教授团队出品，覆盖大语言模型训练与使用的全流程，从预训练到微调与对齐，从使用技术到评测应用，帮助学员全面掌握大语言模型的核心技术。并且，课程内容基于大量的代码实战与讲解，通过实际项目与案例，学员能将理论知识应用于真实场景，提升解决实际问题的能力。

Datawhale 组队学习 wow-agent task1 学习总结比喻：想象一下，LLMs（大语言模型）就像是一个超级聪明的图书管理员，它知道很多书里的知识，但它只能告诉你书里写的内容，不能去外面帮你买新书或者帮你做饭。Agents就像是给这个图书管理员配了一个“机器人助手”，这个助手不仅知道书里的知识，还能帮你跑腿、做饭、甚至帮你解决实际问题。

使用DeepSeek构建Camel多智能体框架：基本环境配置Hello，大家好，我是GISer Liu😁，一名热爱AI技术的GIS开发者，本系列是作者参加DataWhale2025年2月份组队学习的技术笔记文档，这里整理为博客，希望能帮助学习Agent的开发者少走弯路！

DataWhale组队学习 leetCode task4想象你正在用一台望远镜观察一片星空。望远镜的镜头大小是固定的，你可以通过滑动镜头来观察不同的星区。滑动窗口算法就像这台望远镜，它通过一个固定或可变大小的“窗口”来观察数组或字符串中的连续区间。

DataWhale组队学习 fun-transformer task5首先，我们定义了四个单词的词向量，每个向量维度为3。你可以把这些词向量想象成每个单词的“身份证”。每个身份证上有3个特征，用来描述这个单词的“性格”或“特点”。

Transfoemr的解码器（Decoder）与分词技术在自然语言处理（NLP）领域，解码器（Decoder）和分词技术是两个至关重要的概念。解码器是序列生成任务的核心组件，而分词则是将文本数据转换为可处理形式的基础步骤。

LeetCode从入门到超凡(四)深入浅出理解贪心算法大家好，我是GISer Liu😁，一名热爱AI技术的GIS开发者。本系列文章是我跟随DataWhale 2024年9月学习赛的LeetCode学习总结文档；本文主要讲解贪心算法。💕💕😊

DataWhale AI夏令营 2024大运河杯-数据开发应用创新赛-task3多的不说少的不唠，之前说过初赛基本就是比谁的数据好了，因为原始数据的质量太低了想跑到0.25都很难所以需要使用一些数据增强策略以及收集一些新的数据集。

【Datawhale X 李宏毅苹果书 AI夏令营】《深度学习详解》Task2 打卡本文是【Datawhale X 李宏毅苹果书 AI夏令营】的Task2学习笔记打卡。李宏毅老师对应视频课程：https://www.bilibili.com/video/BV1JA411c7VT?p=3 《深度学习详解》第一章主要介绍了深度学习中的基础数学知识。

沙雕是沙雕是沙雕

Datawhale X 李宏毅苹果书 AI夏令营入门 Task1-机器学习机器学习：机器具备有学习的能力/让机器具备找一个函数的能力。比如语音识别、图像识别、机器学习有不同的类别。 1）回归：假设要找的函数的输出是一个数值/标量，这种机器学习的任务称为回归。 2）分类：分类任务要让机器做选择题。人类先准备好一些选项，这些选项称为类别。 3）结构化学习：机器不只是要做选择题或输出一个数字，而是产生一个有结构的物体，比如让机器画一张图，写一篇文章。这种叫机器产生有结构的东西的问题称为结构化学习。

Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——进阶上分实战优化 Task3笔记Hi，大家好，我是半亩花海。在上一个任务中，我们逐行精读baseline，掌握了利用AI工具提升学习效率，并制作了话剧连环画，初步了解Secpter WebUI。今天，我们将深入探讨微调的基本原理及其参数，旨在优化效果。同时，介绍文生图工作流平台ComfyUI，帮助实现更高度定制的文生图生成，进一步提升我们的创作和应用能力。

如果皮卡会coding

【Datawhale AI 夏令营】第四期基于2B源大模型RAG 的三体问答【定位】：Datawhale AI 夏令营第四期 Task3 应用练手demo 【学习手册链接】：https://linklearner.com/activity/14/11/25 【练手材料来源】：《三体》 https://github.com/JessyTsui/awesome_LLM_beginner.git

精读代码，实战进阶&实践Task2好的，根据您的要求，我为您编写了一套适用于每个场景的生图提示词。以下是每个场景的详细描述：女主正在上课

Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——精读baseline 实战进阶 Task2笔记Hi，大家好，我是半亩花海。最近在继续学习Datawhale X 魔搭举办的2024年AI第四期夏令营的AIGC文生图方向，本次Task2的主要学习内容是借助通义千问、文心一言等大模型工具（无广）进行精读baseline代码，并进行新项目的实战进阶。

Datawhale X 魔搭 AI夏令营（2024第四期）AIGC方向学习笔记这一期是使用可图+lora微调进行文生图任务的比赛文生图也算是跨模态了，输入Prompt文本，输出图片。Prompt很重要，分为prompts和negative prompts。可以指导结果图片的生成。