java后端工程师+AI大模型进修ing(研一版‖day57)

今日总结

  • java随笔录------Redis数据持久化,RDB,AOF
  • AI随探录------智能输入法案例,数据集处理,模型结构设计,环境配置
  • 代码随想录------回溯+电话号码的数字组合

目录

今日总结

详细内容

java随笔录

Redis数据持久化

RDB

AOF

AI随探录

智能输入法案例

数据集处理

模型结构设计

环境配置

代码随想录

------电话号码的数字组合


详细内容

java随笔录

Redis数据持久化

RDB

RDB:全称RedisDatabaseBackupfile(Redis数据备份文件),也被叫做Redis数据快照。简单来说就是把内存中的
所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。
RDB的执行原理:

  1. 首先在开始时会fork(复制页表)主进程得到子进程,子进程共享主进程的内存数据
  2. 在Linux系统中,所有进程无法直接操作物理内存,因此只能操作虚拟内存,通过页表进行映射
  3. 因此就无需拷贝数据了,直接拷贝页表映射关系
  4. 子进程将读到的数据写入RDB中,替换旧的RDB
  5. 在子进程写入RBD中,主进程会发生写入新的数据情况,造成数据不一致,可以采用copy-on-write技术:当主进程读操作时,访问共享内存,当主进程写的时候,会拷贝一份数据,在执行写操作

AOF

AOF全称为AppendOnlyFile(追加文件)。Redis处理的每一个写命令都会记录在AOF文件,可以看做是命令日志
文件。
每执行完一次写命令,就会先放入到AOF缓冲区,然后根据刷新频率,将记录写入到AOF文件中。
AOF有三种刷盘的频率(折中采取everysec)

AOF是记录命令,因此文件体积会很大,而且会记录同一个key的多次写操作。可以通过一些命令来让AOF执行重写功能。会让redis触发阈值时自动取重写AOF文件。
二者对比:在实际开发中,往往二者结合来使用

AI随探录

智能输入法案例

数据集处理

本任务使用的数据集为https://huggingface.co/datasets/Jax-dan/HundredCV-Chat

首先要分词,在分词的序列中提取上下文片段,并以每个窗口的下一个词作为预测目标,构成输入-输出对

模型结构设计

本任务采用基于循环神经网络(RNN)的语言模型结构来实现"下一词预测"功能。模型整体由以下三个主要部分组成:

  • 嵌入层(Embedding)

将输入的词或字索引映射为稠密向量表示,便于后续神经网络处理。

  • 循环神经网络层(RNN)

用于建模输入序列的上下文信息,输出最后一个时间步的隐藏状态作为上下文表示。

  • 输出层(Linear)

将隐藏状态映射到词表大小的维度,生成对下一个词的概率预测。

环境配置

先搭配好虚拟环境,创建一个nlp虚拟环境,创建一个python项目

在空项目面先构建一个requirement.txt文件,里面下载一些需要用的依赖

python 复制代码
# 基础NLP工具
nltk
jieba
spacy
textblob
gensim
stanza

# 深度学习与预训练模型
transformers
tensorflow  # 可选,若用PyTorch可删除此行
torch       # 可选,若用TensorFlow可删除此行

# 中文NLP增强工具
pyhanlp
thulac

# 数据处理与机器学习
pandas
scikit-learn
sklearn-crfsuite

# 可视化工具
matplotlib
wordcloud
imageio

代码随想录

------电话号码的数字组合

给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。

给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。

示例 1:

复制代码
输入:digits = "23"
输出:["ad","ae","af","bd","be","bf","cd","ce","cf"]

示例 2:

复制代码
输入:digits = "2"
输出:["a","b","c"]

提示:

  • 1 <= digits.length <= 4
  • digits[i] 是范围 ['2', '9'] 的一个数字。
java 复制代码
class Solution {
    List<String> result = new ArrayList<>();
    String[] str = {"","","abc", "def", "ghi","jkl", "mno", "pqrs","tuv", "wxyz"};
    StringBuilder aaa = new StringBuilder();
    private void back(String digits,int indexstart) {
        if(indexstart == digits.length()) {
            result.add(aaa.toString());
            return;
        }
        String ss = str[digits.charAt(indexstart) - '0'];
        for(int i = 0; i < ss.length(); i++) {
            aaa.append(ss.charAt(i));
            back(digits,indexstart + 1);
            aaa.deleteCharAt(aaa.length() - 1);
        }
    }

    public List<String> letterCombinations(String digits) {
        if (digits == null || digits.length() == 0) {
            return result;
        }
        back(digits,0);
        return result;
        
    }
}
相关推荐
菜菜小狗的学习笔记1 小时前
剑指Offer算法题(四)链表
数据结构·算法·链表
dehuisun1 小时前
国安部发布:“龙虾”(OpenClaw)安全养殖手册
人工智能
Echo_NGC22371 小时前
【贝叶斯公式】从先验到后验的概率推演
人工智能·贝叶斯·概率论·扩散模型
myloveasuka1 小时前
[Java]查找算法&排序算法
java·算法·排序算法
Shining05961 小时前
AI 编译器系列(七)《(MLIR)AscendNPU IR 编译堆栈》
人工智能·架构·mlir·infinitensor·hivm·ascendnpu ir
清水白石0081 小时前
Free-Threaded Python 实战指南:机遇、风险与 PoC 验证方案
java·python·算法
We་ct1 小时前
LeetCode 148. 排序链表:归并排序详解
前端·数据结构·算法·leetcode·链表·typescript·排序算法
GJGCY1 小时前
中小企业财务AI工具技术评测:四大类别架构差异与选型维度
大数据·人工智能·ai·架构·财务·智能体
weixin_Todd_Wong20101 小时前
基于宠物行为识别在宠物医疗健康领域的应用
人工智能·宠物
wWYy.1 小时前
STL:list
开发语言·c++