👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
👀 北京互联网法院审理全国首例「AI声音侵权案」,五被告都否认侵权
补充一份背景:点击了解事件说明与当前进展 ⋙ AI生成图片著作权侵权第一案、AIGC训练数据集侵权首批案件
大模型技术在一年时间里狂飙突进,但相关法律法规和实施细则还不完善,很多领域的「AI第一案」进入法律流程和公众视野。比如 👆 前段时间的这两个案子,以及最新的AI声音侵权第一案。
配音师殷某某发现自己的声音被「魔音工坊App」AI处理并对外出售了,因此以侵害声音权 为由将相关五被告 起诉到北京互联网法院。12月12日,北京互联网法院首次组成五人合议庭,依法公开审理。五被告均否认侵权。
梳理了一下案件背景,经过各方合作,魔音工坊获得了原告殷某某的声音产品:殷某某 → 中广影音 (北京) 文化传媒有限公司 → 微软 (中国) 有限公司 → 北京小问智能科技有限公司 [魔音工坊App];另两家被告为微软中国的平台运营商与涉案产品的经销商 ⋙ 阅读全文了解详情
针对AI (参与) 创作的作品是否拥有版权,各个国家的观点和判例并不统一。2023年8月,美国华盛顿 一家法院裁定,未经人工输入只由AI创作的艺术作品,不受版权保护 。11月,北京互联网法院 则认为,AI生成图片时作者进行了提示词设计等智力投入,因此作品享有著作权 。12月,韩国文化体育旅游部 明确表示,AI创作的内容将不会获得版权注册。
🉑 AI的进攻 VS 艺术家的防守:从6年前一部「AI无限电影」说起
补充一份背景:在 Runway、Pika 疯狂进化的当下,在技术人试图向传统影视行业发起冲锋的浪潮之巅,在AI电影呼之欲出的历史转折点,我们有必要听听艺术家们的观点
12月2日-3日,浦东美术馆主办了「在新技术下的重新对焦------徐冰艺术研讨会 」主题研讨会,邀请了国内外12位嘉宾参与讨论分享。其中,第三场的主题是 《人工智能无限电影》:可编程世界对艺术家的新挑战。
- 纽约现代艺术博物馆 (MoMA) 电影部门策展人 La Frances Hui在演讲中提到,徐冰的「蜻蜓之眼」让观众忘却传统而熟知的电影语言,去抛弃我们原有的看电影的评价方式,重新去审视我们所处的现实和世界
- 哥伦比亚大学终身人文讲席教授刘禾 ,对AI和当代艺术都提出了尖锐的问题:假如AI成为艺术,那么艺术将成为什么?当代艺术家不但要充分吸收新的材料和新的技术语言,更重要的是,他还要迫使人们去重新思考什么叫「观看」这件事,改变人们对事物的认识
- 亚马逊云科技资深首席科学家张峥, 从专业角度分享了「斯坦福小镇 」项目,以及AI自动合成电影的技术路径 及其本质是去艺术化的特点
- 复旦大学新闻学院陆晔教授 ,认为「人工智能无限电影」最有意思的地方是它的极端性, 把它所有的控制权和选择判断的标准都交给了机器,这就带来了数字叙事将给当下带来的改变 ,包括着危机与可能性 ⋙ 了解这场活动的全部信息
补充一份背景:徐冰,中央美术学院副院长,以「天书」「地书」等作品闻名于世,近几年在实验长片领域倾注了大量研究与实践
2017年,徐冰开始组织艺术家与人工智能科学家 创作「人工智能无限电影 (AI-IF) 」,让观众与AI交互创作,没有导演 、没有编剧 、没有摄影师 、也没有演员......
影片中所有的视听语言,如图像、声音、旁白以及剧情走向和叙事逻辑,都是由计算机在深度学习后根据观众的指令生成的。
观众在电脑页面上挑选一个电影类型 (战争、爱情、科幻、犯罪、前卫) 并给出希望的片长,再输入关键词或句子让AI生成电影片段;播放中,观众还可以输入新词汇来改变电影中的角色和叙事情节 (👆如上图所示)。
徐冰在接受访谈时表达了对AI电影创作 的观点:AI是不可能代替人去拍电影的,但它可以做出人拍不出的东西。人有局限性------有自己的盲点,有私心杂念,拍出来的东西是偏颇的,AI做出来的电影是可以超越这些的。我想,AI可以提示一种我们看不到的、隐蔽在大数据背后的东西,可以总结出人类生存的规律性的东西,具有「元电影」的属性 ⋙ 了解徐冰与AI更多的故事
👀 AIGC 花样催生新岗位:Chaos is a ladder (混乱是阶梯)
补充一份背景:FlowGPT 定位是成为AI原生应用的孵化平台 (类似移动互联网时代的安卓平台) ,目前已经成为最大规模的第三方 GPTs Store (早于 OpenAI 官方几个月),目前发展和融资进程都非常不错~
听过 Jay 的播客,FlowGPT 团队在招聘方面非常开放自由,甚至允许应聘者自定义一个岗位,非常有意思~ 如果你想加入 FlowGPT 不妨主动自荐呀!
FlowGPT 创始人党嘉成在其即刻账号发布了国内招聘信息:资深产品经理 ,base 北京海淀区,40-65K * 15薪。
今天社群里讨论比较热烈的另一个招聘话题,就是「贝壳找房」发布的这个招聘岗位:Prompt 运营师~
如果你对提示工程有所了解,应该能感受到这是「硬拆」出来的一个新岗位,跟 Prompt Engineer (提示词工程师) 配合完成提示词任务。群里有相关经验的伙伴表示,这的确是一个比较忙碌的干活岗~
不过!这个新岗位传达出一种积极的信号,产业正在逐渐发展起来 ,因为业务规模增大才需要分工协作。行业早期的机会还是要努力抓住!入局早可以随着业务一起成长,入局越晚分工越细致,成长链路会被拉得越长~
🉑 28套AI表情提示词,生成的人物情绪饱满更灵动
觉得AI人物不够传神?情绪不够饱满?即刻 @AIGC指南针-阿鱼 分享的这套提示词,可以帮助你精准提升人物的灵动性。这是非常全面且实用的一套人物情绪提示词组合,非常值得收藏~
- Scared / 害怕
- Grumpy / 脾气不好的
- Smile / 微笑
- Frowning / 皱眉
- Laughing / 大笑
- screaming / 尖叫
- Angry / 生气
- yawning and rubbing her eyes / 打着哈欠,揉着眼睛
- Shy and Blushing and looking down / 害羞、脸红并低头看着地面
- Downturned mouth and indicating disappointment / 嘴角下垂,表示失望
- Gazing into the distance and deep in thought / 看向远方,思考中
- Mouth agape and expressing shock / 嘴巴张开,表示震惊
- Tightlipped and showing dissatisfaction / 嘴角微抿,表示不满
- Downturned lips and looking sad / 嘴角下弯,表示难过
- Softly smiling and expressing tenderness / 眼含笑意,表示温柔
- smirk / 嘴角微扬
- Tearful eyes and expressing sadness / 眼泪汪汪,表示悲伤
- Eyes tightly shut / 眼睛闭紧
- Smiling with eye closed / 闭着眼睛微笑
- Crossing arms and displaying indifference / 交叉双臂,显露冷漠
- Waving goodbye / 挥手告别
- Tilting head back and Gazing upwards / 向后仰头,仰望天空
- Pouting and crossing arms / 撅嘴叉臂
- Thumbs up and beaming / 竖起大拇指并露出笑容
- face with medical mask / 戴着医用口罩的表情
- expressionless / 无表情的
- open mouth / 嘴巴张开的
- Crying Profusely / 大哭不止
🉑 爆款AI搜索引擎 devv.ai 做对了什么,开发者分享 RAG 实践心得
devv.ai
补充一份背景:devv.ai 是一款专门面向开发者群体的AI搜索引擎,能够在编程领域提供比 ChatGPT 更准确的回答 。产品在一个月时间里收获了6位数的用户、日搜索5万次且每周翻倍
最近,开发者 Jiayuan 开始写系列长文,解释构建 devv.ai 需要的底层技术 & 生产环境中的一些实践经验:开发团队基于文档、代码、实时搜索数据从零到一构建了一套高效、准确的 RAG 系统。
twitter.com/Tisoga/stat...
补充一份背景:RAG (Retrieval Augmented Generation,检索增强生成) 系统是为了解决「语言模型无法有效获得与利用新知识」这一问题而设计的一种架构与技术方案,在最近几年强大语言模型和训练计算能力的支持下,终于得以实现和应用。
第一篇文章的主题是「devv.ai 是如何构建高效的 RAG 系统的 🔎」。RAG目的是让语言模型使用外部知识进行生成。RAG 系统由①语言模型 、②模型所需外部知识集合 、③当前场景下需要的外部知识 这三部分组成。优化 RAG 系统就是分别优化这三个模块。
- 语言模型
- GPT-3 的出现使得RAG系统变得可用,因为它具有较强的理解和生成能力。第一波基于 RAG + GPT-3 的公司 (Copy AI、Jasper等) 都获得了非常高的估值 & ARR。
- 从2023年开始,出现了大量的开源和闭源的基座模型,如 GPT-3.5 / GPT-4 (闭源方案) 和Llama 2 / Mistral (开源方案),这些模型都可以在上面构建 RAG 系统。
- 模型所需的外部知识集合
- 这个模块主要包括两个部分:embedding 模型 和存储 embedding vector 的数据库
- 前者基本上都使用 OpenAI 的 embedding 模型,后者可选方案包括Pinecone、Zilliz (国内团队)、Chroma (开源的解决方案)、关系型数据库上的 pgvector 等
- devv.ai 采用的方式:embedding + 传统的relation db + Elasticsearch,并使用 Rust 构建了整套 knowledge index
- 更好地召回当前场景下需要的外部知识
- 作者团队在 encoding 过程中对原始 knowledge 数据进行了大量处理,以确保在 retrieve 时获取到结构化的数据,减少后续处理的复杂性,并提高召回准确率
第二篇文章的主题是「如何评估一个 RAG 系统」
- 建立整个 RAG 系统的评估体系
- 原理解析 :引用了斯坦福大学论文「Evaluating Verifiability in Generative Search Engines」,指出 LLM 可能会生成错误的信息,而 RAG 系统通过提供外部知识来减少这种幻觉
- 评估指标 :fluency / 流畅性、perceived utility / 实用性、citation recall / 引文召回率、citation precision / 引文精度 ;流畅性和实用性是一定要满足的基础指标,而理想的 RAG 系统应具备高引文召回率 & 高引文精度
- 评价框架 :使用人工评测的方式,通过 Likert 量表来评估流畅性和实用性;对于引文召回率和引文精度的评估,需要识别生成内容中值得验证的部分,并评估这些内容是否得到相关引文的支持
- devv.ai 实践经验 :每次 RAG 优化之后就可以重新跑一遍评测集来确定相关指标的变化;评测集的选定应该与 RAG 对应的场景所吻合;构建一套自动化测评框架 👇
- 构建一套自动化的评测框架
- 自动化评测框架的核心思路 :使用基于 llama 2 训练的评测模型 来验证引文召回率和引文精度;构建大量的评测集并通过线上数据自动抽样生成评测集;在 RAG 核心模块改动后,使用持续集成动运行评测框架,并生成数据埋点和报表
- devv.ai 实践经验: 内部正在构建和实验这套评测框架,未来可能会考虑开源相关的评测模型和框架代码
👀 AI独立创始人成长手册:如何成功运营自己的初创公司
传统创业文化和投资机构都更倾向于团队合作,但是独立创始人的各种优势在这轮AI浪潮里得到了凸显,并且已经有许多成功的案例。
文章为独立创始人提供了非常全方位的指导,只有相同经历才能共情的压力和焦虑,以及那些行家老手才懂的「成功诀窍」。
- 独立创始人的利弊
- 优势-更多控制权:独立创始人拥有完全的控制权和决策权,无需与他人分享股权
- 优势-灵活的决策:可以快速转型和改变产品方向,无需他人支持
- 优势-享有所有成果:所有回报和成就完全属于独立创始人
- 挑战-身兼数职:需要承担从产品开发到营销的所有角色
- 挑战-融资难度:投资者通常对独立创始人持怀疑态度,融资可能更难
- 挑战-独自承担失败:所有的压力和风险都落在独立创始人身上
- 独立创始人如何打造 MVP
验证极端假设:重点放在验证客户需求和问题
使用无代码工具:如Bubble、WebFlow和AppGyver
将开发外包:雇用自由开发人员
小范围测试:与潜在用户一起测试MVP
- 独立创始人如何获得融资
了解投资人偏好:投资人通常更喜欢团队而非单一创始人
降低风险:从投资人的角度出发,减少他们对独立创始人的担忧
- 独立创始人如何逐步建立团队
- 初期雇佣自由职业者:填补技能空缺,保持灵活性
- 对第一批员工挑剔:选择拥有股权的一流员工
- 外包销售和营销工作:使用工具减轻工作负担
- 考虑选择联合创始人:在适当时候引入经验丰富的联合创始人
- 独立创始人取得成功的 9 个秘诀
- 保持学习劲头:掌握商业各个方面的知识
- 委派外包薄弱环节:将时间优先考虑在强项上
- 建立个人支持网络:寻求建议、支持和反馈
- 尽早验证想法:通过MVP降低风险
- 精益创业自力更生:避免过早扩张
- 底线思维严控风险:购买保险,制定业务连续性计划
- 利用过往工作阅历:强调在融资时的相关经验
- 必要时找一位联创:在项目有一定进展后引入联合创始人
- 专注目标全力打造 :专注于目标,全力打造理想公司 ⋙ 阅读原文(中文)
🉑 GPTs 万字教程:入门 → 进阶 → 实践 → 防护全覆盖
11月,OpenAI 开放了 GPTs 功能。国产相关大模型公司紧随其后陆续推出类似功能。
Coze 是一个应用程序编辑平台,旨在帮助用户快速开发下一代AI聊天机器人 ,需要魔法,免费 ⋙ 详细介绍看这里
天工SkyAgents 是基于昆仑万维「天工大模型」打造的AI Agents 开发平台 ,国内IP可访问,免费 ⋙ 详细介绍看这里
一直在找 coze、SkyAgents等 Agents 网站的操作教程,不过它们的发布时间太短了,大家应该都还处于摸索尝试阶段。
但是!万变不离其宗,我们充分搞懂 OpenAI GPTs 的操作就可以了!这篇教程就很不错,不仅知识点覆盖全面,而且给出了非常多的效果截图、拓展链接、Prompt等资源。日报整理了重点内容,推荐阅读并收藏原文呀!需要的时候翻出来看一看~
- 引言
- 本文深入探讨了 GPTs 的基本概念、入门指南、应用技巧、案例分析以及安全防护措施,帮助读者全面理解 GPTs 的潜力和应用价值
- GPTs 是什么
初始使用者:通过简单的对话或参数设置,快速创建具备特定技能的 GPTs,主要用于娱乐和日常问题解答
进阶使用者:能够编写复杂的提示词,处理数据分析、内容创作等任务,并通过封装提示词提升工作效率
提示词开发者:通过封装提示词,为特定场景提供解决方案,从而创造经济价值
技术开发者:利用官方 API 开发应用,结合 GPTs 和外部接口,解决运营和推广难题
- GPTs 如何创造收益
辅助创作: GPTs 在文案撰写、文章创作等领域的应用,是其最常被利用的功能
盈利-直接收益:通过销售 GPTs 模型,设定使用费用,直接获得经济回报
盈利-间接收益:通过 GPTs 中的广告或推广信息,间接获取收益
盈利-品牌建设:通过 GPTs 建立个人或企业品牌,长期积累品牌价值
- GPTs 入门
创建流程:包括添加 Logo、命名 GPT、编写提示词、设置对话示例等步骤
发布流程:涉及域名注册与绑定,以及 GPTs 的公开发布,具体操作详见文档
- GPTs Action 介绍与创建教程
Action作为 GPTs 的核心功能,通过执行外部动作,如获取网页内容、图片等,极大地扩展了 GPTs 的应用范围
通过 GPTs Action在Unsplash上搜索图片,展示了其实际应用效果
实践步骤:包括接口功能的查找、授权方式的了解、接口的测试、Schema 的生成、 GPTs 的创建和功能测试等
- GPTs 与 Zapier 实战
Zapier 作为一个自动化工具,与 GPTs 结合,能够实现工作流程的自动化,提升效率
实际案例:展示了如何通过自动化处理邮件摘要和智能分类邮件
- GPTs 与 Gapier 实战
通过 GPTs Action 调用 Gapier 提供的 API,实现了代码和文章内容的思维导图生成
具体案例:包括代码思维导图助手和文章内容的思维导图转换
- 免费 API 资源站点
- 提供了一些提供免费 API 的网站,如 GitHub、The Movie DB、Unsplash 等,供用户探索和利用
- GPTs 导航站
- 推荐了几个 GPTs 导航站,但提醒用户注意甄别 GPTs 的质量
- 防止 GPTs 内部信息泄露
- 介绍了如何防止 GPTs 内部信息泄露,包括攻击指令和防护措施
- 防护策略 :使用防护提示词、关闭代码解释器功能等,以保护 GPTs 的安全性 ⋙ 推荐阅读并收藏原文
👀 LangChain 2023 年度洞察:为开发者的灵魂提问找到了答案
blog.langchain.dev/langchain-s...
补充一份背景:LangChain是基于大语言模型进行应用开发的框架,提供了一套工具、组件和接口,可以简化基于LLM 构建应用程序的开发过程
LangChain 通过其云平台 LangSmith 的匿名元数据,分析了用户在7月-12月之间的开发行为,尝试回答大中小企业的这些灵魂提问:如何将GenAI融入产品?应该遵循哪些参考架构?哪些模型最适合我们的用例?应该使用什么样的技术栈?如何测试我们的LLM应用?
- LLM应用开发现状
检索成为与 LLM 结合的主要方式,LangChain 提供了60多个向量存储库的集成,42%的复杂查询涉及检索
约 17% 的复杂查询是代理的一部分,尽管代理在处理复杂查询或边缘情况方面有潜力,但目前还不够可靠或高效
15%的用户不使用 LangChain 进行开发
- LCEL (LangChain表达式语言)
- LCEL 是用于组合组件的简易方式,适合创建复杂、定制化的链,其使用量在过去几个月中迅速增长
- LLM 提供商使用情况
- OpenAI 和 AzureOpenAI 是最受欢迎的 LLM 提供商,Anthropic、Vertex AI 和 Amazon Bedrock 也受到关注
- 开源模型提供商
- 用户主要在本地运行开源模型,Hugging Face、LlamaCpp、Ollama 和 GPT4All 等工具受欢迎
- 提供API访问的服务商中,Fireworks AI 领先,其次是 Replicate、Together 和 Anyscale
- 向量存储库使用情况
- 本地向量存储库最常用,Chroma、FAISS、Qdrant 和 DocArray 排名前五
- 托管服务中,Pinecone 是唯一进入前五的托管向量存储库,Weaviate 紧随其后
- 在添加了向量功能的数据库中,Postgres (PGVector)、Supabase、Neo4j、Redis、Azure Search 和 Astra DB 领先
- 最常用的嵌入
- 开发者在计算文本片段的嵌入时,OpenAI 是最受欢迎的选择,但开源提供商如 Hugging Face、GPT4All 和 Ollama 也得到了广泛使用
- 在托管服务方面,Vertex AI 超过了 AzureOpenAI,而 Cohere 和 Amazon Bedrock 也表现不俗
- 最先进的检索策略
- 用户倾向于依赖自定义的检索策略,这反映了在 LangChain 中实现自定义策略的便利性以及为了达到最佳性能而需要的定制逻辑
- 常见的自定义策略包括 Self Query、Hybrid Search、Contextual Compression、Multi Query 和 TimeWeighted VectorStore
- 人们如何测试
大多数用户能够为他们的 LLM 应用制定一些评估指标,83%的测试运行都有某种形式的反馈
开发者通常使用多种不同的评估指标,这表明找到一个单一的可靠指标是困难的
- 人们在测试什么
- 大多数人仍然主要关注应用的正确性,而不是毒性、提示泄露或其他防护措施
- 低使用率的 Exact Matching 技术表明,准确评估输出的正确性是一个复杂的过程,不能仅仅通过直接比较输出的准确性来完成
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
👆 订阅合集 #ShowMeAI日报 ,一览AI领域发展前沿,抓住最新发展机会!点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!