基于大模型的剧本创作实践;从互联网转行AIGC经验分享;复旦大学LLM最新教科书(电子版);真格基金被投企业2023秋季联合校招 | ShowMeAI日报


👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🎯 真格基金被投企业 2023 秋季联合校招启动,提供超过400个岗位

app.mokahr.com/social-recr...

真格基金创立于2011年,是国内最早的天使投资机构之一。9月,真格基金集结20+优秀被投企业,在华北、华东、华南、西南等多个区域进行多场宣讲活动,覆盖人工智能、生命科学、半导体、新能源、电子商务、消费等热门行业,在北上广深杭等城市开放超过200个岗位,提供超过400个工作机会,包含以下种类:

  • 软件研发

  • 产品研发

  • 管培生

  • 销售运营

  • 算法

  • 测试

  • 项目管理

  • 职能 ⋙ 了解更多

🏆 Founder Park x Zilliz x 智谱 AI 联合发起,不一样的 AGI 黑客松

founderpark.mike-x.com/UB5j4

Founder Park (极客公园) 联合 Zilliz (向量数据库)、智谱 AI (大模型) 联合发起大模型领域的黑客松------AGI Playground Hackathon。优胜团队可以获得10 万元现金奖励及技术资源支持、深度创业辅导和优质大模型产业资源深度连接及品牌曝光资源等。

团队报名时间自即日起至10月10日23:00,包含以下三个赛题,感兴趣可以报名试试看!

  1. 生产力工具的新想象:面向工作场景,参赛者须考虑如何运用 AI (大模型+向量数据库) 提升任务完成的效率,甚至是对于工作流的重塑

  2. 泛娱乐体验的新可能:参赛者须考虑如何运用 Al (大模型+向量数据库),为用户带来更有趣和多样的娱乐体验

  3. 创新开发 :参与者须同时使用大模型和向量数据库在以上 2 个赛题以外,探索应用创新开发的可能性。总之,主打一个 freestyle! ⋙ 了解更多 | AGI Playground Hackathon FAQ

🧩 大模型创作实践,以「更可控」的方式写「刘姥姥一进荣国府」剧本

作者在以红楼梦为背景设计文字 RPG 游戏时,遇到了 token 超过长度限制、人物语言混乱等问题,一不小心就创作走向就不受控制了。

在经过了多次尝试后,作者使用「规划-校准-推理」这个思想设计的大模型创作流程,终于可以将剧情发展约束在可控范围内了!

这篇文章以「刘姥姥一进荣国府」为创作背景,分享了这个创作流程和执行细节,以及很多血泪踩坑经验~ 果断收藏!这就是提高自己写作能力的秘籍呐~

  1. 设计思想 - 规划-校准-推理。明确核心处理单元的功能及其目的,包括故事背景、人物解析、行为规划、行为校准、状态推理、剧本生成、主角状态历史等

  2. 故事解析 - 探究人物特征。使用 Prompt 从小说原文中摘取故事背景,地理位置,人物的长期目标和短期目标,以及人物的名字、位置、和谁在一起、在做什么

  3. 行为规划 - 脑暴剧情走向。使用 Prompt 一次生成 3 个可能的行为,通过后面的处理对行为进行筛选,效果还不错

  4. 行为校准 - 匹配主线目标。使用 Prompt 对上方的 3 个计划进行打分,选择最有助于长期目标或者短期目标的一个行动

  5. 状态推理 - 引领情节发展。让模型执行选中的计划,并观察人物有没有更新位置、有没有产生下一个目标,并通过 Prompt 让角色进入到下一个状态

  6. 剧本生成 - 微调说话风格 。通过 Prompt 让大模型优化表达方式,给游戏玩家和读者更身临其境的体验 ⋙ 阅读原文

👀 从互联网大厂人到AIGC践行者,百度裸辞 Gap 3个月后成功转行

这是一篇非常有意思的分享,主角 Jaby 今年从百度Apollo智能驾驶事业部产品经理岗位裸辞,在gap 3个月后入职 AIGC 明星公司,成为一名大模型产品经理,顺利踏入了新的行业。

在当下的环境中,「裸辞+Gap」听起来似乎有点何不食肉糜的感觉,但 Jaby 自洽且平静地享受了过渡期,并开启了新的职场大门。

为什么裸辞?Gap期间都做了什么?如何合理规划职业路径?对自己未来发展的期待?

Jaby 非常真诚地回答了上面这些问题,对于当下大厂人转向AIGC领域,有着足够多值得借鉴的思考。如果你也想转行,那么这篇文章值得一读,从作者坚定的步伐中获得前进的力量 ⋙ 阅读原文

🚀 创业者在产品方面遇到的困扰,红衫给出了详细的解决方案

红杉公众号征集了一批创业者遇到的问题和困境,邀请内部团队给出了详细的解决思路,包含怎么做、注意事项等方方面面,可操作性极强。红衫这波很接地气啊!推荐开发者和初期创业者们都读一读!

  1. 如何判断正确的市场切入点?
  • 可以采用A/B测试法或《精益创业》书中讲到的甲乙测试法,准备两个及以上的切入点,两两对比测试,数据表现较好的就是相对正确的切入点

  • A/B测试要注意问对问题,本质是产品优化,要控制其他变量,测试要完整等

  1. MVP会不会是在做无用功?
  • 充分的用户调研很重要,可以帮助明确定位,做得好可以找到最核心的痛点

  • MVP可以验证产品在市场中的可行性,相比直接上线,成本较低,即使失败也损失有限

  1. 客户不多,如何扩大市场规模?
  • 可以制定进入市场战略,从一开始就培养客户群体,找到理想客户画像,传达清晰价值主张,尝试新的增长渠道等

  • 对于B2B公司,实现「客户成功」很关键,要提供培训、解决方案等全面支持

  1. 如何实现产品的持续盈利?
  • 重要的是打造持续盈利机制,而不是一次盈利,要深入洞察市场真正痛点,调整MVP和PMF

  • 可以制定年度战略计划,组建跨职能小团队,鼓励创新想法等

  1. 产品开发和验证又难又慢,怎么办?
  • 确保对产品充满热情,理解过程缓慢是正常的

  • 借鉴不同的产品创新模型,循序渐进推进,可以从1%用户开始测试并逐步扩大 ⋙ 阅读原文

👩‍💻 我建立了我的第一个AI NPC队友,这是我学到的

Matt Webb 进行了一项非常有趣的思考和行为探索:在程序开发的过程中,AI有可能成为我团队的 Teammate (队友) 么 ?为了验证这个想法,作者开发了几个简单程序,并在其中加入AI角色来模拟AI队友的行为

经过这次尝试,作者给出的结论是,各种AI角色各有特色,就像人类团队的成员各有专长一样,人类队员与AI队员的协作式一种非常有前途的程序协作开发方式 。但是目前来看,这个尝试还处于非常初级的阶段,距离成熟的产品还有相当大的差距,并且需要在交互设计、技术实现等方面做大量的工作 ⋙ 阅读原文

👩‍💻 LangChain 启动2023秋季学期新计划,招募学生共建创新型 LLM 应用

9月6日,LangChain 在其官方博客宣布启动 Student Hacker in Residence Program (学生黑客驻地计划),在2023年秋季学期招募3-5名学生,在8周的时间里与LangChain团队一起工作并创建创新型 LLM 应用

入选的同学不仅可以获得 LangChain 团队的指导和全方位支持,还有机会在官方博客分享开发经验,并极大拓展自己的技术社交圈层。当然如果顺利完成每周至少10小时的工作,则可以获得一笔7500美元的津贴。

这么有吸引力的职位当然要求也不低且竞争激烈,如果你是在校生且有开发 Demo或应用的经验,就可以开始申请啦!当然也期待国内大模型团队也开放类似的机会呀! ⋙ 阅读原文 | 申请链接

📚 复旦大学LLM最新教科书(电子版):大规模语言模型,从理论到实践

ShowMeAI知识星球资源编码:R183

大语言模(Large Language Models,LLM)是一种由包含数百亿以上权重的深度神经网络构建的语言模型,使用自监督学习方法通过大量无标记文本进行训练。大语言模型展现出了强大的对世界知识掌握和对语言的理解,用户可以使用自然语言与系统交互,从而实现包括问答、分类、摘要、翻译、聊天等从理解到生成的各种任务。

自2018年以来,包含Google、OpenAI、Meta、百度、华为等公司和研究机构都纷纷发布了包括BERT、GPT等在内多种模型,并在几乎所有自然语言处理任务中都表现出色。2021年开始大模型呈现爆发式的增长,特别是2022年11月ChatGPT发布后,更是引起了全世界的广泛关注。

本书介绍了大语言模型的基础理论,包括语言模型、分布式模型训练、强化学习、并以Deepspeed-Chat框架为例介绍了实现大语言模型和类ChatGPT系统的实践。期待本书可以为读者提供一个入门指南,并可作为高年级本科生和研究生相关课程的补充教材:

1 绪论

1.1 大规模语言模型基本概念

1.2 大规模语言模型发展历程

1.3 大规模语言模型构建流程

1.4 本书的内容安排

2 大语言模型基础

2.1 Transformer 模型

2.2 生成式预训练语言模型 GPT

2.3 大语言模型结构

3 语言模型训练数据

3.1 数据来源

3.2 数据处理

3.3 数据影响分析

3.4 开源数据集合

4 分布式训练

4.1 分布式训练概述

4.2 分布式训练并行策略

4.3 分布式训练的集群架构

4.4 DeepSpeed 实践

5 有监督微调

5.1 提示学习和语境学习

5.2 高效模型微调

5.3 模型上下文窗口扩展

5.4 指令数据构建

5.5 Deepspeed-Chat SFT 实践

6 强化学习

6.1 基于人类反馈的强化学习

6.2 奖励模型

6.3 近端策略优化

6.4 MOSS-RLHF 实践

7 大语言模型应用

7.1 推理规划

7.2 综合应用框架

7.3 智能代理

7.4 多模态大模型

7.5 大语言模型推理优化

8 大语言模型评估

8.1 模型评估概述

8.2 大语言模型评估体系

8.3 大语言模型评估方法

8.4 大语言模型评估实践

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

相关推荐
埃菲尔铁塔_CV算法24 分钟前
深度学习神经网络创新点方向
人工智能·深度学习·神经网络
艾思科蓝-何老师【H8053】43 分钟前
【ACM出版】第四届信号处理与通信技术国际学术会议(SPCT 2024)
人工智能·信号处理·论文发表·香港中文大学
weixin_452600691 小时前
《青牛科技 GC6125:驱动芯片中的璀璨之星,点亮 IPcamera 和云台控制(替代 BU24025/ROHM)》
人工智能·科技·单片机·嵌入式硬件·新能源充电桩·智能充电枪
学术搬运工1 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理
右恩1 小时前
AI大模型重塑软件开发:流程革新与未来展望
人工智能
图片转成excel表格2 小时前
WPS Office Excel 转 PDF 后图片丢失的解决方法
人工智能·科技·深度学习
Just Jump2 小时前
大语言模型LLM综述
llm·大语言模型
ApiHug2 小时前
ApiSmart x Qwen2.5-Coder 开源旗舰编程模型媲美 GPT-4o, ApiSmart 实测!
人工智能·spring boot·spring·ai编程·apihug
哇咔咔哇咔3 小时前
【科普】简述CNN的各种模型
人工智能·神经网络·cnn
李歘歘3 小时前
万字长文解读深度学习——多模态模型CLIP、BLIP、ViLT
人工智能·深度学习