python单例模式、大模型一次加载多次复用

文章目录

类似于java的单例模式,python中也有。

例如大模型加载起来很慢,如果每次都加载,那不用干活了,光加载吧。

代码
python 复制代码
import time

class QwenModelSingleton:
    """
    单例模式:保证全局只加载一次模型
    """
    _instance = None
    _model = None  # 用来存放真正的模型对象

    def __new__(cls):
        # __new__ 是创建实例的第一步,在这里控制"只创建一次"
        if cls._instance is None:
            cls._instance = super().__new__(cls)
            # 只有第一次创建实例时,才执行加载逻辑
            cls._instance._load_model()
        return cls._instance

    def _load_model(self):
        """真正的加载逻辑只在这里执行一次"""
        print("🚀 [系统] 正在初始化并加载千问模型到内存... (耗时操作)")
        time.sleep(2)  # 模拟加载耗时
        
        # 【在这里替换你的真实加载代码】
        # self._model = AutoModel.from_pretrained("Qwen/Qwen-7B")
        self._model = "Qwen_Model_Obj_Loaded" 
        
        print("✅ [系统] 模型加载完成!")

    def generate(self, prompt):
        """对外提供推理接口"""
        if not self._model:
            raise RuntimeError("模型尚未加载")
        
        # 【在这里替换你的真实推理代码】
        # return self._model.generate(prompt)
        return f"这是千问模型对 '{prompt}' 的回复..."

# ==========================================
# 下面是演示:模拟在两个不同的业务类中使用
# ==========================================

class ChatService:
    """业务类 A:聊天服务"""
    def __init__(self):
        # 注入单例
        self.model = QwenModelSingleton()

    def chat(self, text):
        return self.model.generate(text)

class SearchService:
    """业务类 B:搜索服务"""
    def __init__(self):
        # 注入单例
        self.model = QwenModelSingleton()

    def search_and_summarize(self, text):
        # 比如先搜索,再用模型总结
        return self.model.generate(f"总结搜索结果关于:{text}")

# ==========================================
# 运行测试
# ==========================================
if __name__ == "__main__":
    print("--- 启动服务 A ---")
    service_a = ChatService()
    print(service_a.chat("你好"))

    print("\n--- 启动服务 B ---")
    service_b = SearchService()
    print(service_b.search_and_summarize("人工智能"))

    print("\n--- 再次使用服务 A ---")
    # 此时不会再加载模型,直接复用内存中的对象
    print(service_a.chat("再见"))
相关推荐
weixin_580614001 天前
如何提取SQL日期中的年份_使用YEAR或EXTRACT函数
jvm·数据库·python
2301_813599551 天前
SQL生产环境规范_数据库使用最佳实践
jvm·数据库·python
李可以量化1 天前
QMT 量化实战:用 Python 实现线性回归通道,精准识别趋势中的支撑与压力(下)
python·qmt·量化 qmt ptrade
a9511416421 天前
Go 中通过 channel 传递切片时的数据竞争与深拷贝解决方案
jvm·数据库·python
Dxy12393102161 天前
Python 使用正则表达式将多个空格替换为一个空格
开发语言·python·正则表达式
qq_189807031 天前
如何修改RAC数据库名_NID工具在集群环境下的改名步骤
jvm·数据库·python
zhangchaoxies1 天前
如何检测SQL注入风险_利用模糊测试技术发现漏洞
jvm·数据库·python
Luca_kill1 天前
MCP数据采集革命:从传统爬虫到智能代理的技术进化
爬虫·python·ai·数据采集·mcp·webscraping·集蜂云
zhangchaoxies1 天前
CSS如何实现响应式弹性网格布局_配合media query修改flex-wrap属性
jvm·数据库·python
故事和你911 天前
洛谷-数据结构1-1-线性表1
开发语言·数据结构·c++·算法·leetcode·动态规划·图论