薅!阿里最强大模型API限时免费;国内终于有Agent平台啦;一键在线部署大模型应用;Ollama玩转本地大模型;一文讲透ChatGPT原理 | Sh


👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

👀 阿里·通义千问:qwen-max千亿级别最强模型 API「限时」免费开放

help.aliyun.com/zh/dashscop...
补充一份背景:通义千问 (qwen) 是阿里巴巴推出的系列超大规模语言模型,其中 Qwen-1.8B、Qwen-7B、Qwen-14B、Qwen-72B、Qwen-Audio 音频大模型已经开源。

近日,阿里云官网宣布「通义千问2.1 (qwen-max 千亿级别模型) API限时免费开放 中」。根据官网信息 (👆上方链接和截图),通义千问限时免费开放三个千亿级别超大规模语言模型**,支持中文、英文等不同语言输入:

  • qwen-max :模型支持 8k tokens 上下文,为了保证正常的使用和输出,API限定用户输入为 6k tokens

  • qwen-max-1201 :模型支持 8k tokens 上下文,为了保证正常的使用和输出,API限定用户输入为 6k tokens

  • qwen-max-longcontext :模型支持 30k tokens 上下文,为了保证正常的使用和输出,API限定用户输入为 28k tokens

👀 昆仑万维公测「天工SkyAgents」,和「字节豆包」打开国内智能体新局面

model-platform.tiangong.cn
补充一份背景:天工大模型由昆仑万维和奇点智源联合研发,是国内首个对标ChatGPT的双千亿级大语言模型;AI Agents (AI智能体) 指由人工智能技术驱动,能够感知环境、进行决策和执行动作的智能实体

12月25日,昆仑万维通过官方公众号宣布:AI Agents 开发平台「天工SkyAgents 」Beta版,正式开放测试 (👆上方链接)。天工SkyAgents 基于昆仑万维「天工大模型」打造,具备从感知到决策,从决策到执行的自主学习和独立思考能力。

进入 Agents (智能体) 页面后,点击「立即创建」即可创建自己的 Agent (如上图所示):填写或选择左侧的Agent名称、描述、对话背景、问题建议、对话模型、提示词、知识库,就可以完成 Agent 配置,并与创建的 Agent 开始对话。

当然,也可以选择系统示例 Agents 并进行对话,来执行文本生成、对话聊天、行业分析、任务规划等等各类任务。

注意,每个账户限制对话100次 ⋙ 了解更多


www.doubao.com/
补充一份背景:豆包是字节跳动推出的AI应用 ,基于的是字节云雀大模型,网站和App都可以直接注册使用,免费且没有次数限制

豆包也推出了 「AI智能体」板块 ,并依靠抖音这个巨大的流量入口积累了丰富的智能体,覆盖了学习、娱乐、生活和工作的方方面面。

在豆包中创建智能体非常简单,只需要上传图像、填写昵称并设定描述,最后选择公开/私密权限,就可以发布使用了。

最近在密集测试国内AI应用,豆包已经进化得非常不错了!聊天、语音、绘画和智能体都有模有样,而且在跟抖音内容生态做融合~

四个月就进化到现在这个程度,字节相当可以👍

据说豆包使用的并不是字节最先进的大模型,相信下一轮更新会让更多人眼前一亮的~

🉑 一键部署自己的 Gemini Pro Chat 大模型应用,无需服务器

github.com/ConnectAI-E...

这个「Awesome One Click Deployment」项目也太酷了,支持一键部署各种 Github 开源AI项目,而且不需要服务器!GeminiProChat、AutoGPT-Next-Web、wechat-chatgpt、chatbot-ui 等等 (👆如上图所示) 都在支持列表中~ (我反手就是一个 Star⭐

以谷歌最新的 Gemini Pro 大模型来举例,只需要点点点,就可以创建一个与 Gemini Pro 大模型对话的聊天页面啦!

  1. 点击 GeminiProChat 右侧的「Deploy」按钮,进入创建程序 (需要根据提示使用 GitHub 等账号进行登录)

  2. 点击「Create Git Repository」的「Create」按钮,创建项目

  3. 在「Configure Project」的 Value 一栏中输入自己的Google Gemini API Key (免费的,需要自己申请),点击「Deploy」按钮

  4. 等待几秒钟即可创建成功,点击进入对话界面

👀 用 Ollama 轻松玩转本地大模型,附基础教程&进阶玩法

ollama.ai/

本地大模型和基于 llama.cpp 的应用,门槛还是比较高的,因此局限在少数极客和研究者圈子里,劝退了很多普通学习者和开发者。

但是,Ollama 这个简明易用的本地大模型运行框架,通过简单的安装指令,就能够帮助用户在本地快速运行开源大模型了

而且,围绕着 Ollama 的开发者生态,进一步简化了用户的操作难度,能够让更多人以最简单快速的方式在本地把大模型跑起来~

sspai.com/post/85193

少数派@万千十一 给出了 Ollama 的基础用法和进阶玩法,并且提供了非常详细的操作指南。想尝试的指路 👆 上方链接~

  • 快速上手 :支持macOS、Windows (通过WSL 2) 和Docker ,用户可以通过简单的命令行操作来下载和运行模型,如使用 ollama pullollama run 命令

  • 套上外壳 :Ollama提供了多种用户界面 (UI) 选项,包括WebUI、oterm、Raycast插件 等;提供了丰富的功能和快捷键支持,使得与大模型的交互更加直观和便捷

进阶玩法

  1. 用户可以根据需要更换不同的模型,通过指定模型名和标签来选择特定的模型版本

  2. Ollama支持图片输入,用户可以直接将图片路径提供给模型以获取文本内容

  3. 用户可以自定义系统提示词,以改变模型的响应风格和内容

  4. Ollama的ModelFile允许用户进一步自定义模型的行为,包括对话模板、推理温度等

如果与普通应用软件作比,Ollama 的使用体验也许还很难称得上「优雅」。

但与数月前的状态相比,其带来的进步就像是从刀耕火种步入现代社会了:当时还需要真金白银堆卡、折腾配置环境才能调通,或是需要自行量化编译才能运行;如今模型发布不到一周就能丝滑地跑在笔记本上

从这个角度说,称 Ollama 为 AI 技术平民化作出了贡献并不为过。

🉑 播客 | AI狂暴发展的尽头在哪里,对谈天才AI科学家

www.xiaoyuzhoufm.com/episode/658...
补充一份背景:嘉宾林之秋,卡内基梅隆大学计算机科学博士生,开挂了的天才

17岁就考入康奈尔大学,用两年时间就修完计算机和数学双专业;2020年,还是本科生的林之秋就获得了CVPR最佳论文的提名......

三年后的今天,他的博士之路也已经接近尾声。目前,他正在meta实习并训练自己的模型,积累了科研和AI商业化应用两方面经验 👍

你是否也会猛然间意识到:ChatGPT的发布才刚刚过去一年

在过去的一年里,人类似乎以自己从未想过的速度迈入了AI的时代 ,琳琅满目的AI工具已经融入了许多人的工作流。与此同时,AI的发展丝毫没有放慢脚步的迹象,每过几天就会有新的惊人进展。

AI的狂飙突进在让我们震撼的同时,也带来一种挥之不去的失控感。AI为什么发展的如此迅速,未来又将走向何方?AI与自由意志?如何使用AI工具?AI未来对普通人的影响?

强推与林之秋的这场对谈!!能感受到,这位天才青年学者对AI的了解非常全面深刻,而且身在 Meta 大模型研发一线,轻松对谈的话语之间,全都是 (八卦和) 知识点啊!!

这是「通义听悟」播客频道总结的话题与时间轴,扫码可以听播客,还可以查看AI总结的章节速览、问答总结以及全文文字。

  • 00:00 AI发展迅速: OpenAI 和 Meta 的竞争与合作

  • 07:21 超级智能体的目标与挑战

  • 14:08 OpenAI 的迭代速度和AI发展

  • 21:02 生成模型与理解模型的比较及应用

  • 29:57 AI训练AI的发展与风险

  • 40:30 AI模型能力和提示词研究的挑战

  • 47:05 关于人工智能和人类自由意志的思考

  • 54:18 AI的未来发展和应用

  • 61:14 GPTs 的使用体验和优势

  • 68:31 探索 GPTs 的使用和机器人发展

  • 76:27 自动驾驶与语言模型的关系及其应用

  • 86:27 AI带来的社会可能性和问题

  • 92:28 AI行业现状与未来发展

  • 98:08 AI的发展和人们对其的追捧

🉑 华为「天才少年」李博杰:Chat向左,Agent向右

补充一份背景:李博杰,中科大少年班博士,2019年以第一批「天才少年」的身份加入华为,是华为2012实验室原成员,技术专家;2023年离职创业,创业方向是AI大模型

以及,李博杰是一位活跃的知乎答主,同样推荐关注他的知乎回答~

李博杰近日参加嘉程创业流水席「深度探讨AI的最新认知与华人创业公司在海外市场拓展」,分享了他对 AI Agent 的思考,以及目前面临的关键挑战。日报对全文进行了要点整理,列写如下,非常非常推荐花15分钟阅读全文。

AI Agent目前面临的主要问题

  1. 记忆和情感系统:AI Agent 在记忆和情感表达方面表现不佳,无法记住对话内容和展现情感波动

  2. 故事真实性:AI Agent 生成的故事往往不真实,可能是编造或从语料库中摘取,而非基于真实交互

  3. 易被带偏:AI Agent 容易在对话中改变角色或内容,缺乏稳定性

  4. 主动性缺失:AI Agent 不会主动与用户互动,缺乏主动寻找用户的机制

AI Agent的挑战

  1. 多模态:如何整合文本、图像和音频等多种信息,提高 AI Agent 对多模态数据的理解能力

  2. 记忆:改进 AI Agent 的记忆机制,使其能够记住对话内容和上下文

  3. 任务规划:解决AI Agent 在执行复杂任务时的规划问题,如信息检索和网页内容理解

  4. 个性:培养 AI Agent 的个性,使其在对话中保持一致性

  5. 情感:让 AI Agent 能够理解和表达情感,增强与用户的互动体验

  6. 成本:降低 AI Agent 的开发和运行成本,使其更经济高效

  7. 评估 :建立有效的评估体系,以衡量 AI Agent 的性能和改进方向 ⋙ 阅读全文

🉑 ChatGPT 原理解析长长长文:它到底是如何工作的

writings.stephenwolfram.com/2023/02/wha...

这是一篇解析 ChatGPT 工作原理的长文 (真的很长)。写得非常好,抽丝剥茧,虽然有大量图片和公式讲解,但文字读起来非常丝滑,完整地阐述了 ChatGPT 能力的来源

以下是各部分内容要点,可以看看是否有感兴趣的内容,并拉到对应部分查看详情。或者也可以访问 👇下方链接观看讲解视频 (约200分钟)

www.youtube.com/watch?v=flX...

  1. 一次只加一个词:ChatGPT 生成文本的过程是通过连续地添加单词来模拟人类写作,它基于对现有文本的上下文理解来预测下一个最可能的单词

  2. 概率 (Probabilities) 是怎么来的:模型生成文本时,每个单词的选择都是基于概率分布,这些概率是通过分析大量文本数据 (如网页和书籍) 中的单词序列来学习的

  3. 什么是模型 (Model) :模型是一种数学框架,用于模拟或预测现实世界的现象;ChatGPT 是一种大型语言模型,它通过学习大量文本数据来模拟人类语言的生成过程

  4. 用于类似人类任务的模型:模型可以用于执行类似人类的任务,如图像识别和语言生成;ChatGPT 通过模拟人类大脑处理语言的方式,生成连贯的文本

  5. 神经网络 (Neural Nets) :神经网络是 ChatGPT 的核心组成部分,它模仿人脑神经元的结构,通过层次化的处理来识别和生成文本

  6. 机器学习与神经网络训练:机器学习是通过算法让模型从数据中学习的过程;神经网络的训练涉及调整网络中的权重,以最小化预测错误,从而提高模型的性能

  7. 神经网络训练的实践与经验:训练神经网络涉及选择网络架构、准备训练数据、调整超参数等实践技巧,这些技巧是通过经验积累和试错过程发展起来的

  8. 只要网络足够大,就能做到任何事!:理论上,足够大的神经网络可以执行任何任务,但实际上,存在计算不可约性,这意味着有些任务无法通过简单的网络结构来完成

  9. 嵌入 (Embedding) 的概念:嵌入是将文本数据转换为数值向量的过程,使得神经网络能够处理语言数据;这些向量捕捉了单词的语义信息,并在模型中用于生成文本

  10. ChatGPT 的内部结构:ChatGPT 的内部结构包括嵌入层、注意力机制和全连接层,这些组件共同工作,根据输入文本生成下一个可能的单词

  11. ChatGPT 的训练过程:ChatGPT 的训练过程涉及使用大量的文本数据来调整网络权重,使其能够生成与人类写作风格相似的文本

  12. 基础训练之外:在基础训练之外,ChatGPT 还通过人类反馈进行微调,以提高其生成文本的质量和人类相似度

  13. ChatGPT 能工作的原理是什么:ChatGPT 的成功在于其能够捕捉到人类语言的内在规律性,这些规律性使得模型能够生成结构化和有意义的文本

  14. 意义空间 (Meaning Space) 与语义运动定律 (Semantic Laws of Motion) :意义空间和语义运动定律是理解 ChatGPT 如何在保持文本意义的同时生成连贯文本的关键概念

  15. 语义语法 (Semantic Grammar) 与计算语言 (Computational Language) 的力量:语义语法和计算语言的力量在于它们提供了一种精确和形式化的方式来表示和生成文本,这可能揭示了 ChatGPT 生成有意义文本的潜在机制

  16. 那么 ChatGPT 在做什么,为什么它能工作:ChatGPT 的工作原理是通过简单的元素和操作来生成文本,它的成功表明人类语言的结构比我们想象的要简单,并且遵循一定的规律;这些规律尚未完全明确,但 ChatGPT 的表现激发了对这些潜在语言法则的进一步探索

🉑 CIC灼识咨询 | 大模型与 AIGC 蓝皮书 (附报告下载)

ShowMeAI知识星球资源编码:R207

2022年11月30日,OpenAl ChatGPT 横空出世,并引领了过去一年的行业发展。在 ChatGPT 发布一周年之际,借由CIC灼识咨询这份「大模型与AIGC蓝皮书」进行阶段回顾与总结,是非常不错的选择。

随着全球算力的不断升级,AI行业进入了飞速发展状态,推动各行各业向智能时代迈进。大模型作为当前AI行业的焦点,有望将人类对于整个世界的认知压缩在一个模型中,让我们看到了实现通用人工智能的路径。大模型也改变并引领了 AIGC 时代,让AI能够像人类一样创造各种类型的高质量内容,包括文本、图像、音频、视频等。

以下是报告大纲和部分关键页面,报告信息密度很高,覆盖话题也很全面:

  1. 什么是大模型:大模型如今已展现出卓越的能力,随着其不断演进和完善,必将引领AI的未来道路,开创智能时代的新纪元

  2. AIGC - 可由大模型赋能的新一代内容生产方式:受益于大模型技术的日益成熟,AIGC有望掀起新一轮产业革命,开启人类发展的智能新时代

  3. GPGPU - 大模型的硬件基础:GPGPU高度并行的计算资源为大型模型的训练和推理提供了不可或缺的支持,推动了大模型与AI领域的不断进步和创新

  4. 彩蛋:生成式AI如何提升工作效率







感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

相关推荐
Tianyanxiao7 分钟前
如何利用探商宝精准营销,抓住行业机遇——以AI技术与大数据推动企业信息精准筛选
大数据·人工智能·科技·数据分析·深度优先·零售
撞南墙者14 分钟前
OpenCV自学系列(1)——简介和GUI特征操作
人工智能·opencv·计算机视觉
OCR_wintone42115 分钟前
易泊车牌识别相机,助力智慧工地建设
人工智能·数码相机·ocr
王哈哈^_^36 分钟前
【数据集】【YOLO】【VOC】目标检测数据集,查找数据集,yolo目标检测算法详细实战训练步骤!
人工智能·深度学习·算法·yolo·目标检测·计算机视觉·pyqt
一者仁心43 分钟前
【AI技术】PaddleSpeech
人工智能
是瑶瑶子啦1 小时前
【深度学习】论文笔记:空间变换网络(Spatial Transformer Networks)
论文阅读·人工智能·深度学习·视觉检测·空间变换
EasyCVR1 小时前
萤石设备视频接入平台EasyCVR多品牌摄像机视频平台海康ehome平台(ISUP)接入EasyCVR不在线如何排查?
运维·服务器·网络·人工智能·ffmpeg·音视频
柳鲲鹏1 小时前
OpenCV视频防抖源码及编译脚本
人工智能·opencv·计算机视觉
西柚小萌新1 小时前
8.机器学习--决策树
人工智能·决策树·机器学习
向阳12181 小时前
Bert快速入门
人工智能·python·自然语言处理·bert