java后端工程师+AI大模型进修ing(研一版‖day57)

今日总结

  • java随笔录------Redis数据持久化,RDB,AOF
  • AI随探录------智能输入法案例,数据集处理,模型结构设计,环境配置
  • 代码随想录------回溯+电话号码的数字组合

目录

今日总结

详细内容

java随笔录

Redis数据持久化

RDB

AOF

AI随探录

智能输入法案例

数据集处理

模型结构设计

环境配置

代码随想录

------电话号码的数字组合


详细内容

java随笔录

Redis数据持久化

RDB

RDB:全称RedisDatabaseBackupfile(Redis数据备份文件),也被叫做Redis数据快照。简单来说就是把内存中的
所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。
RDB的执行原理:

  1. 首先在开始时会fork(复制页表)主进程得到子进程,子进程共享主进程的内存数据
  2. 在Linux系统中,所有进程无法直接操作物理内存,因此只能操作虚拟内存,通过页表进行映射
  3. 因此就无需拷贝数据了,直接拷贝页表映射关系
  4. 子进程将读到的数据写入RDB中,替换旧的RDB
  5. 在子进程写入RBD中,主进程会发生写入新的数据情况,造成数据不一致,可以采用copy-on-write技术:当主进程读操作时,访问共享内存,当主进程写的时候,会拷贝一份数据,在执行写操作

AOF

AOF全称为AppendOnlyFile(追加文件)。Redis处理的每一个写命令都会记录在AOF文件,可以看做是命令日志
文件。
每执行完一次写命令,就会先放入到AOF缓冲区,然后根据刷新频率,将记录写入到AOF文件中。
AOF有三种刷盘的频率(折中采取everysec)

AOF是记录命令,因此文件体积会很大,而且会记录同一个key的多次写操作。可以通过一些命令来让AOF执行重写功能。会让redis触发阈值时自动取重写AOF文件。
二者对比:在实际开发中,往往二者结合来使用

AI随探录

智能输入法案例

数据集处理

本任务使用的数据集为https://huggingface.co/datasets/Jax-dan/HundredCV-Chat

首先要分词,在分词的序列中提取上下文片段,并以每个窗口的下一个词作为预测目标,构成输入-输出对

模型结构设计

本任务采用基于循环神经网络(RNN)的语言模型结构来实现"下一词预测"功能。模型整体由以下三个主要部分组成:

  • 嵌入层(Embedding)

将输入的词或字索引映射为稠密向量表示,便于后续神经网络处理。

  • 循环神经网络层(RNN)

用于建模输入序列的上下文信息,输出最后一个时间步的隐藏状态作为上下文表示。

  • 输出层(Linear)

将隐藏状态映射到词表大小的维度,生成对下一个词的概率预测。

环境配置

先搭配好虚拟环境,创建一个nlp虚拟环境,创建一个python项目

在空项目面先构建一个requirement.txt文件,里面下载一些需要用的依赖

python 复制代码
# 基础NLP工具
nltk
jieba
spacy
textblob
gensim
stanza

# 深度学习与预训练模型
transformers
tensorflow  # 可选,若用PyTorch可删除此行
torch       # 可选,若用TensorFlow可删除此行

# 中文NLP增强工具
pyhanlp
thulac

# 数据处理与机器学习
pandas
scikit-learn
sklearn-crfsuite

# 可视化工具
matplotlib
wordcloud
imageio

代码随想录

------电话号码的数字组合

给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。

给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。

示例 1:

复制代码
输入:digits = "23"
输出:["ad","ae","af","bd","be","bf","cd","ce","cf"]

示例 2:

复制代码
输入:digits = "2"
输出:["a","b","c"]

提示:

  • 1 <= digits.length <= 4
  • digits[i] 是范围 ['2', '9'] 的一个数字。
java 复制代码
class Solution {
    List<String> result = new ArrayList<>();
    String[] str = {"","","abc", "def", "ghi","jkl", "mno", "pqrs","tuv", "wxyz"};
    StringBuilder aaa = new StringBuilder();
    private void back(String digits,int indexstart) {
        if(indexstart == digits.length()) {
            result.add(aaa.toString());
            return;
        }
        String ss = str[digits.charAt(indexstart) - '0'];
        for(int i = 0; i < ss.length(); i++) {
            aaa.append(ss.charAt(i));
            back(digits,indexstart + 1);
            aaa.deleteCharAt(aaa.length() - 1);
        }
    }

    public List<String> letterCombinations(String digits) {
        if (digits == null || digits.length() == 0) {
            return result;
        }
        back(digits,0);
        return result;
        
    }
}
相关推荐
handsome_sai10 小时前
【Java 线程池】记录
java
buttonupAI10 小时前
今日Reddit各AI板块高价值讨论精选(2025-12-20)
人工智能
2501_9048764810 小时前
2003-2021年上市公司人工智能的采纳程度测算数据(含原始数据+计算结果)
人工智能
咖啡の猫10 小时前
Python字典推导式
开发语言·python
大学生资源网11 小时前
基于springboot的唐史文化管理系统的设计与实现源码(java毕业设计源码+文档)
java·spring boot·课程设计
leiming611 小时前
C++ vector容器
开发语言·c++·算法
竣雄11 小时前
计算机视觉:原理、技术与未来展望
人工智能·计算机视觉
guslegend11 小时前
SpringSecurity源码剖析
java
救救孩子把11 小时前
44-机器学习与大模型开发数学教程-4-6 大数定律与中心极限定理
人工智能·机器学习
SystickInt11 小时前
C语言 strcpy和memcpy 异同/区别
c语言·开发语言