java后端工程师+AI大模型进修ing(研一版‖day57)

今日总结

  • java随笔录------Redis数据持久化,RDB,AOF
  • AI随探录------智能输入法案例,数据集处理,模型结构设计,环境配置
  • 代码随想录------回溯+电话号码的数字组合

目录

今日总结

详细内容

java随笔录

Redis数据持久化

RDB

AOF

AI随探录

智能输入法案例

数据集处理

模型结构设计

环境配置

代码随想录

------电话号码的数字组合


详细内容

java随笔录

Redis数据持久化

RDB

RDB:全称RedisDatabaseBackupfile(Redis数据备份文件),也被叫做Redis数据快照。简单来说就是把内存中的
所有数据都记录到磁盘中。当Redis实例故障重启后,从磁盘读取快照文件,恢复数据。
RDB的执行原理:

  1. 首先在开始时会fork(复制页表)主进程得到子进程,子进程共享主进程的内存数据
  2. 在Linux系统中,所有进程无法直接操作物理内存,因此只能操作虚拟内存,通过页表进行映射
  3. 因此就无需拷贝数据了,直接拷贝页表映射关系
  4. 子进程将读到的数据写入RDB中,替换旧的RDB
  5. 在子进程写入RBD中,主进程会发生写入新的数据情况,造成数据不一致,可以采用copy-on-write技术:当主进程读操作时,访问共享内存,当主进程写的时候,会拷贝一份数据,在执行写操作

AOF

AOF全称为AppendOnlyFile(追加文件)。Redis处理的每一个写命令都会记录在AOF文件,可以看做是命令日志
文件。
每执行完一次写命令,就会先放入到AOF缓冲区,然后根据刷新频率,将记录写入到AOF文件中。
AOF有三种刷盘的频率(折中采取everysec)

AOF是记录命令,因此文件体积会很大,而且会记录同一个key的多次写操作。可以通过一些命令来让AOF执行重写功能。会让redis触发阈值时自动取重写AOF文件。
二者对比:在实际开发中,往往二者结合来使用

AI随探录

智能输入法案例

数据集处理

本任务使用的数据集为https://huggingface.co/datasets/Jax-dan/HundredCV-Chat

首先要分词,在分词的序列中提取上下文片段,并以每个窗口的下一个词作为预测目标,构成输入-输出对

模型结构设计

本任务采用基于循环神经网络(RNN)的语言模型结构来实现"下一词预测"功能。模型整体由以下三个主要部分组成:

  • 嵌入层(Embedding)

将输入的词或字索引映射为稠密向量表示,便于后续神经网络处理。

  • 循环神经网络层(RNN)

用于建模输入序列的上下文信息,输出最后一个时间步的隐藏状态作为上下文表示。

  • 输出层(Linear)

将隐藏状态映射到词表大小的维度,生成对下一个词的概率预测。

环境配置

先搭配好虚拟环境,创建一个nlp虚拟环境,创建一个python项目

在空项目面先构建一个requirement.txt文件,里面下载一些需要用的依赖

python 复制代码
# 基础NLP工具
nltk
jieba
spacy
textblob
gensim
stanza

# 深度学习与预训练模型
transformers
tensorflow  # 可选,若用PyTorch可删除此行
torch       # 可选,若用TensorFlow可删除此行

# 中文NLP增强工具
pyhanlp
thulac

# 数据处理与机器学习
pandas
scikit-learn
sklearn-crfsuite

# 可视化工具
matplotlib
wordcloud
imageio

代码随想录

------电话号码的数字组合

给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。

给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。

示例 1:

复制代码
输入:digits = "23"
输出:["ad","ae","af","bd","be","bf","cd","ce","cf"]

示例 2:

复制代码
输入:digits = "2"
输出:["a","b","c"]

提示:

  • 1 <= digits.length <= 4
  • digits[i] 是范围 ['2', '9'] 的一个数字。
java 复制代码
class Solution {
    List<String> result = new ArrayList<>();
    String[] str = {"","","abc", "def", "ghi","jkl", "mno", "pqrs","tuv", "wxyz"};
    StringBuilder aaa = new StringBuilder();
    private void back(String digits,int indexstart) {
        if(indexstart == digits.length()) {
            result.add(aaa.toString());
            return;
        }
        String ss = str[digits.charAt(indexstart) - '0'];
        for(int i = 0; i < ss.length(); i++) {
            aaa.append(ss.charAt(i));
            back(digits,indexstart + 1);
            aaa.deleteCharAt(aaa.length() - 1);
        }
    }

    public List<String> letterCombinations(String digits) {
        if (digits == null || digits.length() == 0) {
            return result;
        }
        back(digits,0);
        return result;
        
    }
}
相关推荐
甲维斯12 分钟前
还要啥Codex!DeepSeek接入Zcode远程连接!
人工智能
百胜软件@百胜软件24 分钟前
百胜软件亮相“AI消费新生活”主题日活动,AI智能运营平台入选市级案例征集
人工智能·生活·零售数字化·数智中台·珠宝行业
JAVA面经实录91726 分钟前
操作系统面试题
java·服务器·数据库·计算机网络·面试
一杯奶茶¥1 小时前
基于springboot的失物招领管理系统带万字文档 校园失物招领管理系统 失物认领管理系统java springboot vue
java·vue.js·spring boot·java项目
在放️1 小时前
Python 爬虫 · 第三方代理接入与合规使用
开发语言·爬虫·python
不能只会打代码1 小时前
边缘视频分析平台的架构设计与性能优化——从750ms到190ms的调优之路
java·spring boot·redis·性能优化·边缘计算·物联网竞赛
小刘|1 小时前
Spring AI Alibaba 集成和风天气 API 实战
java·服务器·前端
KANGBboy1 小时前
java知识五(继承)
java·开发语言
c++之路1 小时前
Bazel C++ 构建系列文档(三):构建第一个 C++ 项目
开发语言·c++
AI人工智能+电脑小能手1 小时前
【大白话说Java面试题 第117题】【并发篇】第17题:线程有几种状态,之间如何转换?
java·开发语言·面试