调用大模型API 给产业分类

文章目录

  • [大模型API 给产业分类](#大模型API 给产业分类)

大模型API 给产业分类

简要描述

从全国几亿条企业工商登记数据中,抽取出与氢能领域的企业;

根据关键词匹配,看企业的名称和经营范围中,是否包含"氢",若包含则将该条企业挑选出来,从几亿条全国工商登记数据中,最终筛选出3000条相关数据。再将筛选出的企业分类到预先设定的氢能类别。

领域类别如下:

python 复制代码
cls_name = [
    "化石燃料制氢",
    "工业副产氢",
    "电解水制氢",
    ...
    "氢气发电",
]

大模型企业分类的提示词(prompt)如下:

python 复制代码
prompt_cls = """
你是一位氢能领域企业分类的专家。请仔细阅读企业信息:{industry_info}  
接下来,请从 {cls_name} 中选出一个最符合该企业信息的类别,若企业信息不属于任何类别,请返回['其他']。  
下述是这些类别的定义:
{kv}
返回格式:['类别名']  
"""

主要根据每个企业的企业名称和企业的经营范围,利用大模型将其划分到预先设定的类别中去;

这样就可以根据省份信息、每个类别上的企业数量,对不同的地区的产业进行分析;

最终的分类结果:

企业名称 大模型分类原因 企业类别
深圳氢元素xx科技有限公司 要完成这个任务,我们首先要分析深圳氢元素智能科技有限公司的经营范围。从提供的信息中,我们可以看到该公司主要涉及的领域包括智能共享技术综合服务平台搭建、市场营销策划服务、国内贸易以及健康产品饮料、纯净水、矿泉水、苏打水、氢水及其相关设备和配件的销售推广。这些信息主要涉及产品的销售和市场推广,而没有明显涉及到氢能的生产、储存或应用技术的具体领域。 在给定的类别列表中,大多数类别都与氢能的生产、储存、应用技术或特定领域的应用(如氢燃料电池汽车、绿色航运等)相关。然而,深圳氢元素xx科技有限公司的经营范围似乎并不直接对应于这些类别。 因此,根据提供的信息和类别定义,我们可以得出结论,深圳氢元素智能科技有限公司的经营范围不属于给定的任何一个类别。所以,最符合该企业信息的类别是"其他"。 返回的结果为:['其他'] ['其他']
xx氢能科技有限公司 要完成这个任务,我们首先需要仔细分析企业的经营范围,以确定其主营业务和涉及的氢能领域。根据提供的信息,x x氢能科技有限公司的经营范围涉及多个方面,包括新兴能源技术研发、技术服务与咨询、站用加氢及储氢设施销售、新能源原动设备销售与制造等。 现在,我们需要将这些业务与给定的类别进行匹配。企业经营范围中的"站用加氢及储氢设施销售"与"加氢站"这一类别直接相关,因为加氢站涉及储氢和加氢设施的建设与运营。此外,尽管企业也涉及新兴能源技术的研发和设备制造与销售,但这些业务更偏向于技术研发和设备制造,并不直接对应其他特定的氢能领域类别。 因此,根据企业经营范围中最直接和显著的业务内容,我们可以确定海泽氢能科技(山东)有限公司最符合的类别是"加氢站"。 所以,返回的类别是:['加氢站']。 ['加氢站']

大模型API Tips

本文试过 Qwen 14B 的企业分类,效果一般;30B以上的开源大模型的效果好很多,但其需要大显存,硬件配置要求高;

于是本文采取调用LLM API的方式,对企业进行分类,主要应用的是百度云的API。

根据本文的实验:100条企业数据分类,大约需要1块钱。

免费的API:Yi-34B 在百度云上现在免费给大家使用,每条可以免费分类400条企业数据。

联系方式

若你对本文使用到的数据和代码感兴趣欢迎联系我们!

若有数据清洗、大模型应用的商务咨询服务,欢迎联系我们!

相关推荐
IT古董32 分钟前
【机器学习】机器学习的基本分类-强化学习-Actor-Critic 方法
人工智能·机器学习·分类
martian66532 分钟前
【人工智能数学基础】——深入详解贝叶斯理论:掌握贝叶斯定理及其在分类和预测中的应用
人工智能·数学·分类·数据挖掘·贝叶斯
weixin_443290695 小时前
【阅读记录-章节6】Build a Large Language Model (From Scratch)
人工智能·语言模型·自然语言处理
地中海~5 小时前
Stealthy Attack on Large Language Model based Recommendation
人工智能·语言模型·自然语言处理
三月七(爱看动漫的程序员)8 小时前
HiQA: A Hierarchical Contextual Augmentation RAG for Multi-Documents QA---附录
人工智能·单片机·嵌入式硬件·物联网·机器学习·语言模型·自然语言处理
18号房客12 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
强哥之神13 小时前
Nexa AI发布OmniAudio-2.6B:一款快速的音频语言模型,专为边缘部署设计
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·openai
18号房客13 小时前
一个简单的深度学习模型例程,使用Keras(基于TensorFlow)构建一个卷积神经网络(CNN)来分类MNIST手写数字数据集。
人工智能·深度学习·机器学习·生成对抗网络·语言模型·自然语言处理·tensorflow
企业管理8MSaaS14 小时前
如何选择适合Scrum团队的项目管理系统?
云计算·scrum
企业管理8MSaaS14 小时前
如何在 Scrum 管理中化解团队冲突?
云计算·scrum