1-4 NLP发展历史与我的工作感悟

1-4 NLP发展历史与我的工作感悟

主目录点这里

第一个重要节点:word2vec词嵌入

能够将无限的词句表示为有限的词向量空间,而且运算比较快,使得文本与文本间的运算有了可能。

第二个重要节点:Transformer和bert

为预训练语言模型发展奠定坚实基础

我的工作感悟

随着拖布式工作流的workspace发展,开发一个对话机器人更加的便利。另外实体抽取,数据标注的工具做的也是越来越便利,这让对话系统对信息的理解与提取更上一层楼。我这里向大家推荐的有GitHub的dify、阿里云的unit、label studio等等,我用着挺方便的。

虽然有些事情便利了,但还是有很多很多的问题要解决,比如对于企业如何实时追踪与用户对话的数据信息,如何进一步提高机器人对用户话语分类的准确性,如何解决对话系统高并发的问题,如何提高系统的可维护性和可拓展性,如何兼容外语理解(因为有可能有外国人使用该系统,我自己就碰到过哈哈哈哈,叽里呱啦看不懂),prompt的设计减少大模型的已读乱回行为,如何提高对话系统的反应能力(我现在只做到了平均0.7s),如何减少大模型使用到的token等等一系列棘手的企业落地问题,对我们这些NLP算法工程师任重而道远!

相关推荐
Shockang6 小时前
AI 设计工作流全景拆解:Figma MCP / Claude Design / Codex / Google Stitch
人工智能
To_OC7 小时前
数据集划分不是随便切:手把手切分大众点评情感数据集
人工智能·llm·agent
冬奇Lab8 小时前
每日一个开源项目(第142篇):android/skills - Google 官方 Android 开发 AI Skill 库
人工智能·开源·资讯
冬奇Lab8 小时前
Skill 系列(06):Skill 工程化与治理——路由准确率 38%、压缩节省 76%
人工智能·开源·agent
IT_陈寒10 小时前
Vue这个坑我跳了两次,原来问题出在这
前端·人工智能·后端
新新技术迷11 小时前
Node给AI接口做SSE代理与鉴权
人工智能
redreamSo11 小时前
大模型是不是到顶了?瓶颈到底在哪
人工智能·openai
Oo92011 小时前
Tool Use 背后的技术逻辑
人工智能
姗姗来迟了12 小时前
Vue3封装AI流式对话组件踩坑实录
人工智能