Stock Agent AI 模型的选股器实现 [五]

05 - 第三步:消息面与新闻摘要

消息面负责拉取「近期新闻」,并可选地用 LLM 做成一两句话摘要,再和原标题一起喂给综合评分,这样 LLM 既能抓住重点又能看到具体标题。本篇讲数据从哪来、摘要怎么生成、以及如何拼进 Prompt。


一、消息面在整体里的作用

  • 输入:一只股票的代码(ticker)。
  • 原始数据 :通过 yfinance 的 stock.news 拿到近期新闻列表(标题、链接、发布时间、来源等)。
  • 可选加工:用 LLM 对这批标题做「1~2 句话摘要 + 对股价偏多/中性/偏空」的概括。
  • 输出
    • 给报告展示:保留标题、链接、时间等,方便在卡片里看「近期新闻」。
    • 给综合 Prompt:若有摘要,就写「新闻摘要:xxx」再跟「近期标题:...」;没有摘要则只给标题列表。

这样综合评分时,模型既能看到「提炼后的观点」,又能按需参考具体新闻标题,可解释性更好。


二、新闻从哪里拉(get_news_summary)

  • 调用 yf.Ticker(ticker).news(或等价的 stock.news),取前 max_items 条(默认 10)。
  • 每条整理成:titlelinkpublisherpublished(时间截到秒)。
  • 返回格式:{"ok": True, "ticker": ticker, "news": [ ... ]}
  • 若接口异常或没有新闻,news 为空列表,后续摘要不会调用,Prompt 里消息面会写成「无」。

实现位置:agents/news.get_news_summary(ticker, max_items=10)


三、新闻摘要 LLM(get_news_summary_llm)

  • 输入 :ticker + 上面拿到的 news 列表(或任意「标题+时间」的列表)。
  • 做法 :把前几条标题(可带时间)拼成一段文字,调用 llm.ask_llm,Prompt 大意是:「请用 1~2 句话概括要点,并说明对股价影响偏多、中性还是偏空;直接输出摘要不要标题。」
  • 输出:一段纯文本摘要;若没有新闻或 LLM 调用失败,返回空字符串。

full_analysis 里:先 get_news_summary,若有 news 再调 get_news_summary_llm;然后把摘要和原标题列表一起交给 _build_prompt

实现位置:agents/news.get_news_summary_llm(ticker, news_items, max_titles=8)


四、在综合 Prompt 里长什么样

  • 有摘要时,消息面段落大致是:
    新闻摘要:<LLM 的 1~2 句 + 偏多/中性/偏空>\n近期标题:\n- 标题1 (时间1)\n- 标题2 (时间2)\n...
  • 无摘要时:只保留「近期标题」列表(最多 5 条在 Prompt 里,和前面「第一步」里说的数据来源一致)。

这样 LLM 在写「分析原因、评分理由」时,可以引用摘要或某条新闻,而不必自己从一堆标题里再归纳一遍。


五、小结与代码位置

  • 拉新闻agents/news.get_news_summary(ticker)
  • 新闻摘要agents/news.get_news_summary_llm(ticker, news_items)
  • 拼进 Promptagents/full_analysis._build_prompt 里根据 news_llm_summary 是否为空,决定消息面是「摘要+标题」还是「仅标题」。

下一步:06 - 第四步:财报与估值 ------ 财报数据、当前价/涨跌幅、PE/市值、以及财报解读 LLM 怎么用。

相关推荐
PaperRed ai写作降重助手2 小时前
AI 论文写作工具排名(实测不踩坑)
人工智能·aigc·ai写作·论文写作·智能降重·辅助写作·降重复率
qwy7152292581632 小时前
10-图像的翻转
人工智能·opencv·计算机视觉
霍格沃兹测试学院-小舟畅学2 小时前
Playwright企业级测试架构设计:模块化与可扩展性
人工智能·测试工具
地球资源数据云2 小时前
SCI制图——云雨图
python·信息可视化·数据分析
独自破碎E2 小时前
Spring Boot + LangChain4j 报错:Bean 类型不匹配的解决办法
spring boot·python·pycharm
卡奥斯开源社区官方2 小时前
深度拆解:Clawdbot“集体永生”技术内核,是AI协同突破还是营销噱头?
人工智能
小W与影刀RPA2 小时前
【影刀 RPA】 :文档敏感词批量替换,省时省力又高效
人工智能·python·低代码·自动化·rpa·影刀rpa
Python+JAVA+大数据2 小时前
TCP_IP协议栈深度解析
java·网络·python·网络协议·tcp/ip·计算机网络·三次握手
小咖自动剪辑2 小时前
12306余票监控辅助工具详解:自动查询/多方案预约/到点提交
人工智能