它思科技CTO聂玮奇:消除“AI幻觉”,搭建高可靠对话云平台丨数据猿专访

大数据产业创新服务媒体

------聚焦数据 · 改变商业


近年来,大模型技术在全球范围内引起了广泛关注和应用热潮。

提到人工智能,很多人会想到它强大的运算能力和广泛的应用场景。如今,语言模型的发展如火如荼,但其中的"幻觉"问题却带来了诸多困扰。这一问题有哪些有效的应对策略?新的研究能为解决"幻觉"问题带来突破性进展吗?

在成都,有一家本土高新技术企业迅速崛起------成都它思科技有限公司(以下简称"它思科技")。这家公司专注于高可靠对话云技术的研发,由一群清华大学的优秀校友组成的领导团队,致力于利用先进的大模型技术解决行业中的诸多难题。

它思科技的核心目标包括消除AI幻觉内容、解决数据稀缺问题、提高模型训练效率,并实现算力配置的国产化。这些目标不仅旨在提升技术能力,还致力于推动企业在人工智能领域的稳健发展。

近日,数据猿走访并采访了它思科技CTO聂玮奇,深入探讨了AI幻觉的概念以及公司在解决这一问题方面所采取的创新方法。通过这次采访,聂玮奇阐述了它思科技如何通过技术创新和团队合作,成功应对AI幻觉这一行业挑战。

解决"AI幻觉"问题,清华团队搭建高可靠对话平台

什么是AI幻觉?

"AI幻觉"是指人工智能在生成内容时出现的错误或不准确信息。通俗来说,我们在使用AI的时候,不知道哪句话是正确的,哪句话是瞎编的。采访中,聂玮奇解释说,常见的AI错误包括推理中断和逻辑偏差。推理中断是指,AI在推理过程中忘记了自己的论点,导致内容混乱。逻辑偏差则是指,AI的推理过程看似合理,但得出的结论却是错误的。

AI幻觉在行业内是一个重要的挑战。实际上,人类在记忆和处理信息时也会出现类似的问题。例如,当我们被要求回忆并详细描述今年发生了哪些事情时,人也可能会忘记一些细节,甚至记错。"这是因为人脑在处理信息时会进行压缩,并不是所有信息都能准确存储。类似地,AI模型在生成内容时也会因为数据压缩和抽象处理而出现不准确的情况。"

聂玮奇解释说:"我们希望AI模型能够在某些工作中替代人类,因此对模型的要求更高。如果要让AI模型替代人类的部分工作,必须解决其出现的幻觉问题。"

为了解决这一问题,它思科技专注研究高可靠对话云平台。它思科技即将发布的TasiChat人机对话产品,通过"检索增强生成"(RAG)和引用溯源技术,在大模型生成的内容中明确地标记出哪些部分的信息来自知识库中的文档,用户可以更好地评估生成内容的可信度和准确性,增强生成内容的可靠性。

具体来看,该平台依赖用户自己上传相关文件,通过大模型技术的应用,解决当前人工智能领域的AI幻觉问题。它思科技的平台允许用户上传各种类型的文件,如Pdf 文档、word 文档、excel表格、markdown 文档、txt文档等,并根据这些文件内容生成对话或其他文本输出。

"我们在产品中提供了参考来源功能,用户可以直接查看生成内容的出处。这在写论文等需要严谨引用的场景中尤为实用,因为用户可以轻松追溯到内容的原始来源。" 聂玮奇解释道。

据他介绍,解决AI幻觉问题并不能通过简单的算法调整来实现,而是需要通过改进算法和数据来源来缓解。例如,人类在撰写报告时,通常会参考外部数据来源,确保信息的准确性。同样,为了提升AI模型的可靠性,需要为模型提供可靠的数据来源,并进行严格的验证。

目前,公司正不断对产品进行迭代。尽管已经将大约50-60%的积累技术应用到产品中,但产品化的过程依然复杂,需要考虑使用场景、使用方法、用户习惯以及多端适配等多个因素,公司第一个版本已于去年3月启动。

据悉,目前公司的版本更新到1.1版本,并计划每两周发布一个新版本。据悉,目前公司大模型已经完成备案准备,已经提交国家网信办审核。在这段时间内,公司将继续进行内部测试和更新,目标是在11月正式上线运营。

高可靠性是件知易行难的"苦差事"

虽然高可靠性在AI领域被广泛提及,并成为行业共识,但真正投入资源和精力去实现高可靠性的企业却很少。这背后的原因主要集中在技术门槛和实际操作的复杂性上。

聂玮奇指出,解决AI幻觉问题是一个复杂且漫长的过程,可能需要数年的持续努力。尽管从业者们也在不断研究如何提高可靠性,但真正愿意投入资源去解决这些问题的企业却很少。这是因为实现高可靠性,不仅需要强大的技术能力和资金支持,还需要长期的投入和耐心。

据悉,目前它思科技是业内在解决幻觉问题上投入最多的企业。"高可靠性是一个知易行难的事情。"聂玮奇解释道,从理论上看,搭建一个简单的基于文档的大模型检索系统似乎很容易,只需要几分钟的时间写几行代码,就可以搭建一个看似运行良好的系统。然而,当尝试处理更复杂的任务,比如分析多个公司的财务报告之间的联系时,会发现系统无法提供更可靠的结果。

实际上,这背后的原因在于,各个环节都需要深入的工作。检索增强生成(RAG)技术虽然在理论上很简单,但实际操作起来却比较难。例如,模型需要从各种格式的文档中提取和理解信息,并在回答问题时高效地检索相关内容。这不仅需要强大的计算能力和高效的检索算法,还需要对各种文档格式进行预处理和转换。

此外,高可靠性的大模型开发需要大量的资金和人力资源。然而,这些投入在短期内可能看不到显著的回报,使得很多企业在投资时缺乏信心。市场对高可靠性模型的需求尚不明确,进一步增加了企业的投资风险。

总的来说,虽然高可靠性在AI领域的重要性毋庸置疑,但由于其技术复杂性和巨大的资源需求,很多企业选择避而不谈。

在技术复杂性中迎难而上,采用检索增强生成(RAG)技术

高可靠性技术的开发充满挑战,但其潜在价值和市场需求是不可忽视的。随着时间的推移,越来越多的重度用户,会逐渐认识到高可靠性的重要性。

它思科技的高可靠对话云平台,通过用户上传的各种文档,如PDF、DOC和TXT等格式,结合检索和生成两个步骤,提升了模型的可靠性。具体来看,用户上传的文档首先会被转换为模型可以理解的形式,随后模型在回答问题时,从大量文档中高效检索相关信息。

同时,平台采用了"检索增强生成"(RAG)技术,该技术能够根据知识库中的信息生成可靠的答案,降低了编造答案的可能性,从而降低了模型的幻觉。在这个过程中,需要企业一定量的标注数据对检索、生成等环节进行优化。

与同行相比,它思科技的独特之处在于其高可靠性解决方案的全面性和实用性。平台不仅提供参考来源功能,让用户可以直接查看生成内容的出处,还通过不断的迭代和改进,提升模型的性能和可靠性。

据了解,尽管它思科技于2024年才全面投入大模型的开发,但团队此前在技术积累上已有很多年时间。它思科技的总部位于清华大学附近,由清华团队孵化而成,自成立以来一直致力于语音识别和大模型的研究,依托清华大学语音与智能实验室(THU-SPMI)的深厚研究成果,它思科技拥有一流的语音与语言处理技术,涵盖人机对话系统、语音识别与理解、自然语言处理等多个前沿领域。自2017年起,团队成员开始转向大模型领域,并在这方面积累了丰富的经验,完成了诸多早期项目,在技术积累奠定了基础。

为什么要做高可靠性?

"我们认为确保信息的准确性至关重要,所以在成立之初就把解决幻觉问题当作头号问题,我们认为高可靠性的大模型是未来发展的重要方向。"如今,它思科技的云对话平台致力于解决三个问题:高可靠、高效益和国产化,尤其是高可靠性方面,从一开始就瞄准这一方向。尽管市场上有许多诱惑,但它思始终坚持在高可靠性技术上发力。

所有产品都值得用大模型重新做一遍,成都在我心中是国内城市前十

虽说做高可靠领域是件"苦差事",但聂玮奇认为,做大模型是一件快乐的事情。他分享,在推出产品前,公司会去对大模型进行对话训练,在对话过程中,AI会触发很多很好玩的对话,团队在这个过程中也收获颇多。

实际上,成都本地涌现的大模型公司相比北上广要少一些,它思科技为什么会选择在成都发展呢?成都的独特环境对AI企业开展业务和研发活动有哪些影响?

在聂玮奇心中,成都是一个能够发展大模型公司的理想城市,并且在国内城市中排名前十。

聂玮奇笑着说:"我们这栋办公楼里,许多都是我们的客户。"一栋楼里都是潜在的客户和合作伙伴,这种紧密的产业链条使公司能够快速找到合作机会。在他看来,成都拥有良好的科技创新氛围。

目前,它思科技在成都的团队已经发展到20多人,成都是它思科技大模型研发的主要基地。虽然部分核心算法研发仍在北京进行,但公司新招聘的大部分人员都在成都开展工作。北京的团队主要负责核心技术的研究,而成都团队则专注于大模型的应用和优化。

相比北上广,成都的运营成本更低,无论是人力成本还是办公成本,成都都具备显著优势。"公司能够以较低的成本,吸引到高质量的人才,并为他们提供更好的生活和工作条件。我们发现,许多在北京、上海等一线城市工作的高端人才,愿意为更好的生活质量和较低的生活成本而选择来到成都。"据了解,它思科技的团队中,有很多是从外省来到成都的技术人才。

除此之外,算力也是吸引它思来到成都的原因。对于AI企业来说,算力是不可或缺的资源。成都的算力资源丰富,能够满足公司大规模模型训练和数据处理的需求,这一点对于依赖高性能计算的大模型公司尤为重要。

聂玮奇谈到,在政策方面,成都的政府政策对企业有不少的倾斜,几乎每一两周都会有新的政策出台,为企业的发展提供了丰富的资源和支持。政策红利也为在成都的发展的AI公司提供了坚实保障,也对企业的发展起到了积极的推动作用。

未来,它思科技计划是与更多本土的成都企业进行合作。"在我看来,所有的产品,都可以用大模型重新做一遍。"利用大模型技术为各类产品进行革新。未来,它思科技将深耕成都市场,利用大模型技术为各类产品进行革新。

文:梦芸 / 数据猿

责编:凝视深空 / 数据猿

相关推荐
兰亭妙微30 分钟前
用户体验的真正边界在哪里?对的 “认知负荷” 设计思考
人工智能·ux
13631676419侯35 分钟前
智慧物流与供应链追踪
人工智能·物联网
TomCode先生37 分钟前
MES 离散制造核心流程详解(含关键动作、角色与异常处理)
人工智能·制造·mes
zd2005721 小时前
AI辅助数据分析和学习了没?
人工智能·学习
johnny2331 小时前
强化学习RL
人工智能
乌恩大侠1 小时前
无线网络规划与优化方式的根本性变革
人工智能·usrp
放羊郎1 小时前
基于萤火虫+Gmapping、分层+A*优化的导航方案
人工智能·slam·建图·激光slam
王哈哈^_^1 小时前
【数据集+完整源码】水稻病害数据集,yolov8水稻病害检测数据集 6715 张,目标检测水稻识别算法实战训推教程
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
SEOETC1 小时前
数字人技术:虚实交融的未来图景正在展开
人工智能
boonya2 小时前
从阿里云大模型服务平台百炼看AI应用集成与实践
人工智能·阿里云·云计算