o1

qfcy_8 小时前
人工智能·python·chatgpt·claude·gemini·o1·网络api
Python sider-ai-api库 — 访问Claude、llama、ChatGPT、gemini、o1等大模型API目前国内少有调用ChatGPT、Claude、Gemini等国外大模型API的库。 Python库sider_ai_api 提供了一个完整的解决方案。通过调用 sider.ai 的API,开发者可以实现对这些大模型的访问。
羊羊洒洒_Blog1 个月前
人工智能·语言模型·自然语言处理·openai·推理·o1
【翻译】审慎对齐:推理使更安全的语言模型成为可能原文:https://arxiv.org/abs/2412.16339 出自OpenAI随着大规模语言模型对安全关键领域的影响越来越大,确保它们可靠地遵守定义良好的原则仍然是一个基本挑战。本文提出慎思校准,一种新的范式,直接教模型安全规范,并训练它在回答之前明确地回忆和准确地推理规范。我们使用这种方法来对齐OpenAI的o系列模型,并实现了对OpenAI安全政策的高度精确遵守,而不需要人工编写思维链或答案。审慎对齐提升了帕累托边界,提高了对越狱的鲁棒性,同时降低了过度拒绝率,还提高了分布外泛化能力。通过对
Nicolas8931 个月前
大模型·大模型推理·o1·强化推理·多步推理·glm强化推理
【大模型实战篇】GLM-Zero模型初代版本的尝鲜在 2024 年的最后一天,智谱发布了 GLM-Zero 的初代版本 GLM-Zero-Preview,是基于扩展强化学习技术训练的推理模型【1】。GLM-Zero-Preview的推理能力还挺强的,类似于open ai的o1模型,擅长在一些有确定性结果的场景,比如逻辑推理、数学、编程。
OneFlow深度学习框架3 个月前
gpt·语言模型·大模型·openai·gemini·o1
LLM长上下文RAG能力实测:GPT o1 vs Gemini本文深入探讨了检索增强生成(RAG)技术在AI工作流中的应用,特别是OpenAI的o1系列模型和Google的Gemini 1.5模型在长上下文RAG任务中的性能,分析了不同模型在长上下文RAG任务中的失败模式,为开发者构建RAG系统提供了宝贵参考。
聚梦小课堂4 个月前
gpt·cot·技术文档·openai o1·o1·o1 preview·填词游戏
OpenAI GPT o1技术报告阅读(4)- 填字游戏推理原文链接:https://openai.com/index/learning-to-reason-with-llms/
聚梦小课堂4 个月前
gpt·大模型·cot·openai o1·o1
OpenAI GPT o1技术报告阅读(2)- 关于模型安全性的测试案例首先是原文链接:https://openai.com/index/learning-to-reason-with-llms/