浙江华昱欣实习第一周
2026年4月23日:浙江华昱欣报道(周四)
早上10点报道,是行政部门的小姐姐接待的我,她特别好,主动递给我一瓶水,然后开始讨论实习协议的事情,签了一堆的保密协议和公司物件的使用事项规定,然后,我的面试官(也是之后带我的导师)就过来接我到我们部分参观,认识了很多前辈,有博士大美女、硕士大哥哥,还有一个部门年龄最小的我(本科),大家都挺热情,组长也挺好。上午安排好我的工位后,跟组内的前辈们吃了个饭,没掏钱,怪不好意思的。下午因为刚入职,公司相关权限还在处理中,暂时没什么具体工作。13点45分,我们组开了内部会议,前辈们围绕与客户对接的细节、模型性能的优劣及原因、当前项目的完成进度展开了讨论,他们聊到的git clone、down、跑yolov6、yolov7需要的显卡数量、Auto research等相关内容,我还需要慢慢消化。开完会后我就趴在工位上睡到了16点,16点30分又接着开部门会议,然后来了个措不及防的自我介绍,了解到公司每周四有羽毛球约球活动,恰好撞见了我的点,然后每个组开始轮流介绍自己这周的工作情况,我感觉在所有组中,就我导师,最自信、最强了,了解到公司正式岗位可以加班,但实习生也不要求加班,于是便回酒店休息了。明天我会去办理工牌和人脸录入,等权限全部开通后,就可以正式进入公司的带薪培训阶段了。总体来说,当初拒绝天津等公司的offer,选择来杭州实习,真的是非常幸运的决定。不过还是得吐槽一句,滨江区的房租是真的贵啊!
2026年4月24日:华昱欣报道的第二天(周五)
今天在公司依旧是没啥事干,开通相关的权限,比如我们组的gitlab,git权限,熟悉巨灵训练流程,开通外网权限,然后就一直摸鱼直到下班,放双休了,开心
2026年4月27日:华昱欣正式实习的第一天(周一)
今天,我导师王哥给我发了一份我们组25年12月更新的Agent V1.1版本的智能助手的算法说明,文档详细介绍了该智能助手的各类核心模块,包括意图识别、知识库查询、数据库查询、任务拆解、图表生成、问题回复、文档索引及界面索引等。这种模块化的分解设计,不仅能丰富用户使用体验,还便于后续对智能助手的功能进行拓展升级和模块迭代更新。
各模块的具体情况如下:
- 语音识别:目前暂未实现相关功能。
- 意图理解/任务拆解:可基于用户提出的问题,精准拆解核心需求并给出对应回复,为后续ReAct架构的搭建奠定基础。
- 数据库查询:主要用于查询公司内部的发用电数据、设备信息等相关数据。
- 图表生成:能够根据用户的具体请求,自主选择合适的图表类型,并向平台发起调用请求,完成图表生成。
- 界面索引:可根据用户需求,自主对相关界面进行索引匹配,提升使用便捷性。
- 文档索引:会输出相关参考资料,方便用户自行查询对应文档,获取更详细的信息。
后面就是一些模块标识符、AI标识、接口协议等等。看完文档后,下午就进入公司自己的模型训练平台JINN,申请A40 GPU,进行Agent v1.1 demo的跑通,目的在于构建一个基于大模型的Agent调度系统,能够处理多种任务,也了解到了公司其他同事对各种开源OCR应用于pdf识别任务的优势于不足。15:05王哥、枫哥和我在会议室开了个会,讲了讲我实习这3个月的工作安排:
- 第⼀阶段:熟悉业务、环境搭建与⽇志Pipeline开发
- 第⼆阶段:OCR Pipeline开发、联调优化与检索技术预研
- 第三阶段:检索优化落地、交付⽀持与能⼒闭环
目前,我初期的核心任务聚焦于智能助手相关的日志解析,以及文档VLM识别相关工作。终于正式开工啦!
2026年4月28日 周二 华昱欣正式实习第二天
今天,我继续推进Agent智能助手项目的相关工作,重点梳理了项目中服务端进程Server_daemon.py与测试文件test_request.py之间的交互逻辑及数据流转机制。由于我目前仅掌握基础的git操作与Linux操作,在学习过程中遇到了一定难度,尤其是日志解析相关内容------因此前对日志相关知识接触较少,在导师王哥向我讲解本月工作任务时,我对日志内容的理解、以及日志相关任务的执行思路未能快速掌握。加之个人记忆力有限,初期学习进度较为缓慢,好在王哥耐心指导、反复讲解,最终我通过录音方式,完整记录了本月需完成的具体工作要求与执行细节。
当天16:30,我已掌握大模型调用方法,并能够根据日志中的用户输入,完成任务分类工作,具体分类包括操作指引、产品咨询、功能解答、行业知识、客诉宣泄、闲聊无效等类别。
2026年4月29日 周三 华昱欣正式实习第三天
今天,我对各用户输入内容及对应日志目录中是模块内容(含logs、logs_details等子目录)进行了聚合分析,借助公司本地大模型,对前期大模型根据用户输入生成的回复进行逻辑性校验(即判断回复是否符合要求、是否合格)。
同时,我将日志分析功能封装为HTTP接口,便于其他设备调试我本地的日志相关情况;此外,还开发并对外暴露了一款日志分析工具,在日志目录结构保持一致的前提下,其他设备可通过调用该工具,实现自身设备日志的提取与解析功能,提升日志处理的便捷性与效率。
2026年4月30日 周四 还没到的第四天
明天按照惯例,下午开组内会议和部门会议了,也是五一假期前的最后一天班,自从上了班,对放假的渴望愈发强烈了。