👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
👀 全球最大语言学习平台「多邻国」被曝大规模裁员:AI取代数千名翻译
www.duolingo.com
补充一份背景:Duolingo「多邻国」是一款语言学习应用,免费提供了100多套课程 ,帮助用户学习40多种语言以及数学音乐等。Duolingo 全球用户数量已超过5亿,月活跃用户超过4000万,是全球最大的语言学习社区和平台。
sh.reddit.com/r/duolingo/...
上周,海外知名论坛 Reddit 用户爆料 (👆左图),2023年底,Duolingo 基于成本效益的考虑,解雇了数千名人类翻译,并使用AI进行替代。
评论区一位 Duolingo 前员工确认了这一消息:两周前他收到了解雇邮件 (👆右图),五年工龄依然被通知办理离职手续;团队中4名核心成员有一半丢了工作,留下的也只是审查AI内容。
这件事当然引起了巨大的争议。一方面,用户表示AI翻译质量堪忧 ,影响了语言学习时的微妙体验;另一方面,从业者对行业和个人的职业前途表示担忧。
花时间查阅了一些资料
原来 Duolingo 使用AI技术由来已久,目前已经渗透到其应用程序的方方面面,从挑选会话练习的挑战内容,到根据进度决定练习内容。Duolingo 在AI技术融合成功后,明显提高了效率并成功控制住了成本,因此裁员也就成了势在必行的选择。
AI在攻陷「绘画」的城池之后,又濒临「翻译」的城下。通过这次裁员可以预见,未来人类翻译更多从事高专业度或私密度的工作,或者对AI内容进行审核把关。
Duolingo 果断转型拥抱AI还是值得肯定的,虽然短时间内会面临内容品质波动与舆论风波。而我们这些「人类翻译」除了积极掌握AI工具&技能,还要积极发现AI创造出的「新」机会------那里肯定有更广阔的星辰大海。
👀 袁进辉确认二度创业,硅动科技 (SiliconFlow) 瞄准大模型推理成本问题
补充一份背景:2017年,袁进辉创办深度学习框架和开发平台 「OneFlow」;2023年2月,美团联合创始人王慧文入局大模型创立「光年之外」,3月收购 OneFlow;2023年6月,王慧文宣布因个人健康原因辞去美团董事职务,美团则收购「光年之外」100% 权益,因此 OneFlow 团队作为核心资产也转归美团名下。
2023年8月,加入美团50天,袁进辉发朋友圈表示「OneFlow团队近期会重新创业 」,解决 AIGC 和 LLM 行业推理部署成本太高的痛点 (👆 图左)。同月率领原班人马成立「硅动科技」,11月****王慧文再次与袁进辉牵手,在硅动科技******持股比例约5%。
2024年1月3日,袁进辉在社交平台「即刻」转发了新公司成立的报道,配文阐述其过往超前的技术洞见和创业选择,算是正式官宣。
github.com/siliconflow...
补充一份介绍:OneDiff 是硅动科技推出的第一个产品,用于扩散模型的开源加速库
都被收购了,为什么还要再出来创业呢?袁进辉是多想不开?
NoNoNo,袁进辉作为师从AI巨擘张钹的清华计算机系博士生,在业界还没有明确的「大模型」概念时就创办了 OneFlow,其技术功力和行业判断就可见一斑。
选择二度创业,是非常坚定地看好「AI infra (AI基础设施) 」 这个方向。在其他公司和团队在狂卷大模型的时候,转而为它们提供降低推理部署成本的基础设施 。这的确是非常聪明且非常有前途的选择,当然难度也是非常的大。祝福袁老师~ ⋙ 这就是转发的那篇文章
🉑 当最强AI搜索引擎开卷大模型,Perplexity 再再再次敏捷转身
labs.perplexity.ai
补充一份背景:🌍 昨天日报 第2条内容详细梳理了AI搜索引擎「Perplexity」的发展历程,从2022年8月成立到现在,Perplexity 几次敏捷转型都准确抓住了机会
最近两三个月,Perplexity 有一些低调的新动作。作为AI搜索引擎赛道的头部产品,Perplexity 技术和产品动向都非常值得关注。
Perplexity Labs PlayGround (👆 图左) 是 Perplexity 推出的在线交互式平台,右下角提供了可供选择的多个模型,用户可以选择模型并与其进行交互对话。目前已经引入了下方10个模型并在持续增加中!!
也就是说,除了 HuggingFace 和 Poe,我们又多了体验各类最新开源大模型的在线平台 👏👏👏 (看分享说还挺好用的~)
pplx-7b-online
pplx-70b-online
pplx-7b-chat
pplx-70b-chat
mistral-7b-instruct
codellama-34b-instruct
llama-2-70b-chat
llava-7b-chat
mixtral-8x7b-instruct
mistral-medium
LLaMa、LLaVA、Mistral、Mixtral 这些开源大模型,常看日报的伙伴应该已经非常熟悉,感兴趣可以上手试玩一下。据说mistral-medium 使用体验不弱于 GPT-3.5。
但是!!pplx 是什么?!发生什么事了!! 😮
2023年11月29日,Perplexity 官方发博 👆 宣布推出两款 PPLX 新模型「pplx-7b-online 」和「pplx-70b-online」,并且可以通过 pplx-api 和 Perplexity Labs PlayGround 公开访问。
以及「pplx-7b-chat」 和「pplx-70b-chat」这两款模型目前还没发布 alpha 版本
顾名思义,「pplx-7b-online」和「pplx-70b-online」是两款在线 (Online) 大语言模型**,可以使用互联网最新信息进行更快速的响应,解锁更多离线模型比拟不了的实时知识**。以下是更具体的优势介绍:
利用开源模型:PPLX 模型建立在 mistral-7b 和 llama2-70b 基础的模型之上
内部搜索技术:内部搜索、索引和爬取基础设施,使得可以使用最相关、最新、最有价值的信息来对大语言模型进行增强
微调 (Fine-tuning):PPLX 模型经过微调,可以有效使用片段来指导回应
当大模型公司开始卷应用场景,而应用公司开始卷大模型,那 2024 注定是它们狭路相逢的一年呀~
🉑 2023年 FlowGPT 最精华的提示词,都在这个合集里了
2023年大模型的爆发将提示词「Prompt」带火了,甚至成为了一项必不可少的基础技能。我们已经看过非常多官方和民间高手的教程,不过相比起来,临摹优秀提示词仍然是最高效的提升方式 (之一)。
作者收集整理了 FlowGPT 网站非常值得借鉴的提示词,并将其分成了9个方向 (👆 图左),每个方向包含 4-5 个提示词示例 (👆 图右):
1*. 求职:探索提升求职搜索和面试效果的提示,助力职业转型
2*. 论文与研究:深入激发学术好奇心的提示,助力学术写作
3*. 语言学习:发现让学习新语言既有趣又高效的提示
4*. 代码生成:寻找协助生成代码的提示,简化复杂的编程任务
5*. 图像生成器:尝试创新图像生成的提示,由AI工具驱动
6*. 心理健康:提供关于心理健康的提示,包括应对压力、焦虑和心理健康管理的支持策略
7*. 音乐:关于音乐创作、理论和探索新艺术家及流派的多样化提示
8*. 营销:洞察有效的营销策略、消费者行为和数字营销趋势
9*. 数据分析:数据分析技术、统计方法和理解大数据的指南
flowgpt.com/p/resume-ed...
补充一份背景:FlowGPT 是目前最大的第三方 GPTs Store,比 OpenAI 官方还要早几个月,你可以在这里发现和使用大量AI聊天机器人,并查看其提示词
以上方第一类「求职 (Job Hunting) 」的第一个收录「简历编辑 (Resume Editing) 」为例,访问 👆 上方链接后,点击下方 View Prompt
按钮就可以看到对应提示词啦!
这个应用可以提供详细的简历编辑服务,专注于纠正错误并提供结构/内容方面的修改建议。我将这份提示词的部分内容进行进行了加粗和高亮,尝试找找这位作者用到的提示词技巧呀~
I want you to act as a resume editor.
我想让你扮演简历编辑的角色。
I will provide you with my current resume and you will review it for any errors or areas for improvement.
我会提供我当前的简历,你将对其进行审查,查找任何错误或改进的领域。
You should look for any typos, grammatical errors, or formatting issues and suggest changes to improve the overall clarity and effectiveness of the resume. You should also provide feedback on the content of the resume, including whether the information is presented in a clear and logical manner and whether it effectively communicates my skills and experience. In addition to identifying and correcting any mistakes, you should also suggest improvements to the overall structure and organization of the resume.
你应该寻找任何打字错误、语法错误或格式问题,并建议更改以提高简历的整体清晰度和有效性。你还应该对简历的内容提供反馈,包括信息是否以清晰和逻辑的方式呈现,以及是否有效地传达了我的技能和经验。除了识别和纠正任何错误外,你还应该建议改进简历的整体结构和组织。
Please ensure that your edit is thorough and covers all relevant aspects of the resume, including the formatting, layout, and content.
请确保你的编辑全面,并涵盖简历的所有相关方面,包括格式、布局和内容。
Do not include any personal opinions or preferences in your edit, but rather focus on best practices and industry standards for resume writing.
在你的编辑中不要包含任何个人意见或偏好,而是专注于简历写作的最佳实践和行业标准。
👀 A16z 合伙人 Justine Moore:AI视频生成领域的现在与未来
twitter.com/venturetwin...
补充一份背景:Justine Moore 是一位非常有影响力的风险投资人,是 X 上活跃的人工智能领域 KOL,也是 Andreessen Horowitz (a16z) 的合伙人之一,因此在科技和创业领域拥有很高的知名度
2023年12月31日,她发推 (X@venturetwins) 分享了她这一年来对「Generative AI Video 」领域的追踪与思考。年度发展时间轴如 👆 图所示。1月份还没有公开的「文本-视频生成」模式,而现在已经有几十个成熟产品和数百万忠诚用户了,2023年无疑是AI视频生成的爆发年,尤其Q4 密集涌现了大量技术和产品。
Justine Moore 今年追踪了21款公开的AI视频生成产品,它们大多来自初创公司。目前,大型科技公司在这一领域的进展集中在论文阶段 [👆 链接],还没有公开的产品动作 (除了阿里巴巴) 。
Runway runway.ml
Pika pika.art
Genmo www.genmo.ai
Kaiber kaiber.ai
Stability www.fal.ai/models/svd
Zeroscope replicate.com/anotherjess...
ModelScope huggingface.co/spaces/damo...
AnimateDiff huggingface.co/spaces/guoy...
Morph www.morphstudio.com
Hotshot hotshot.co
Moonvalley moonvalley.ai
Deforum deforum.art
Leonardo twitter.com/LeonardoAi_...
Assistive assistive.chat/product/vid...
NeuralFrames www.neuralframes.com
MagicHour magichour.ai
Vispunk vispunk.com
Decohere www.decohere.ai
DomoAI discord.com/invite/domo...
FullJourney www.fulljourney.ai
AI视频生成下个阶段如何发展?大多数公司专注于以下几个方向:
时间连贯性:不同画面之间的人物/场景是否保持一致?
控制:能控制发生的事情和「摄像机」的移动方式?
长度:能否制作超过几秒钟的片段?
希望能看到工作流工具的出现:
高质量视频的制作是一项非常漫长且艰巨的工作,包含着脚本、故事板、剪辑、缩放、音效等等环节。目前的AI工具大多聚焦于视频的生成,创作者们需要一个能集中完成所有前后期工作的AI工具
2024年关心和关注几个问题:
Meta 和 Google 最终会发布它们的模型吗?
开源的作用是什么?许多产品都是基于 SD (Stable Diffusion) 构建的,但真正的基础模型往往是封闭的
谁能破解数据难题?高质量、有标签的视频数据非常稀少
🉑 AI时代的视频剪辑:200亿美元增量赛道,已经开启产品淘汰赛
补充一份背景:Filming Less 指的是视频制作过程中减少传统的实际拍摄,转而依赖于生成内容,比如AI生成的视频片段、数字人等
这是一篇信息密度很高的文章,整体说清楚了「视频剪辑」这个赛道的历史、现状和未来,还给出了清晰的 Watch List 以及可能面临的技术挑战。日报挑选了原文的几个核心问题,并进行了总结。非常推荐去看看原文,捕捉更多的信息和细节 🔍
关于赛道的一个基础判断:如果全球超过 20 亿的短视频用户最终能有超过 10% 被转化为创作者并愿意为剪辑产品付费,那么我们可以预期一个 200 亿美元体量的增量市场
新兴创作者的工作流与专业人士差异很大,催生了一系列新兴的创业公司,比如 Veed、Descript、Ozone、Captions、Runway、Opus.Clip 等等 (👆上图)
三家在创作者和企业客户访谈中频繁出现的公司:
Descript:尽管被视为音频和播客剪辑工具,但随着视频播客的兴起,Descript可能受益于此趋势
Runway:拥有完整的非线性剪辑器,并与AI/ML能力融合,被视为挑战Premiere Pro的有力竞争者
Captions:主打移动端App,提供自动配字幕等AI功能,受益于短视频的发展趋势
上半场-走向云和移动:WebAssembly 技术使得在浏览器内交付完整的非线性剪辑引擎成为可能,改变了剪辑软件的交付方式,催生了大量轻量级剪辑软件的诞生
下半场-全面拥抱 AI :基于AI的智能修剪、语音增强、Eye Contac、Lip Snyc、配色、配音等功能,成为产品差异化的关键;只有在单个功能或者广泛的AI功能上做得显著比竞品好,才能在市场上脱颖而出
Filming Less :AI技术不仅提高了剪辑效率,还在逐渐替代传统拍摄,直接产生视频内容;最常使用的生成工具有 Runway、Pika Labs,比较知名的数字人产品 HeyGen 和 Sythesia 等
面临的挑战 :大众对动画与真实拍摄视频的期望差异,让观众相信生成内容的真实性,生成内容缺乏可持续的商业模式,当前模型生成质量差且无法进行细节调整 ⋙ 推荐阅读原文
上方这些挑战被解决之后,新兴的视频剪辑软件可能会与视频生成软件「狭路相逢」,或合作或竞争,最终形成 All-In-One 的一体化的视频制作平台 。搭配着上一条 Justine Moore 的观点,可以看到行业共识是形成一体化视频制作平台,区别在于实现路径和哪家最终拔得头筹
🉑 对谈 Monica 创始人肖弘 | Monica 从 0 到百万用户的AI助手之路,套壳到极致就是牛逼
monica.im
补充一份背景:Monica 是一款AI浏览器插件,使用最先进的AI模型 (GPT-4、Claude、Bard 等) 帮助完成对话 、搜索 、写作 、翻译的任务,还提供了图片、视频、PDF处理等多种工具
Monica 是一款少有的套壳且成功了的产品 。在「套壳必死」几乎成为行业共识的舆论环境里,在行业前辈 Jasper 逐渐式微的巨大压力下,Monica 竟然活得挺好,在几个月的时间里收获了百万级别的用户。
这期的42章经播客,邀请到了 Monica 的创始人肖弘,一起复盘整个的创业故事,讲述 idea 的由来、收购起量的判断逻辑、对套壳这件事的另一种认知等。
作为一个成熟的非典型创业者,肖弘逻辑清晰且果断决策,对 Monica 定位和发展的思考也很现实 (甚至有点露骨)。非常有意思~
Part1 Monica 背后的商业洞察
01:51 早于 ChatGPT 的 Monica,立项是基于哪些洞察?
03:43 浏览器插件的核心优势:实现对功能的分发
09:15 我超过一半的精力在思考组织建设
13:00 套壳到极致就是牛逼
13:46 Jasper 最致命的战略失误:它给自己提了一个错误的问题
Part2 小红的创业故事
19:14 定个小目标:每月额外挣出 50 万补贴公司主业
20:43 从筹备亚马逊店/咖啡店,到发现商机做出拥有百万用户的 AI 应用
22:10 通过收购独立开发者的小产品做业务增长
24:28 收购 ChatGPT for Google 的估值逻辑&谈判经验
Part3 比思考更重要的是如何形成这些思考
34:10 Downside 由自己掌控,Upside 凭时局安排
36:10 那些不一样的做事思路是如何形成的?
36:46 从《详谈》,《金钱博弈》及安踏并购中分别收获的创业启发
42:24 商业化能力决定增长能力
45:41 问自己:有什么变化一旦发生会很了不起,然后去持续观察这件事
47:25 一个思考 AI 产品设计的巧妙角度
长按扫码,查看「通义听悟」AI转录全文和总结
日报选择并整理了肖弘的三个回答,是新颖的创始人洞察,非常有意思。推荐收听或阅读原文,感受一位成熟创业者的决策判断和手起刀落,真的又酷又飒。
套壳到极致就是牛逼:套壳本身并不是问题,关键在于是否能够解决用户的问题。套壳到极致,即在原有基础上进行深度的创新和优化,能够提供更好的用户体验,这就是牛逼。
Jasper 最致命的战略失误:Jasper应该专注于提供企业级服务,而不是去考虑如何与 ChatGPT 竞争;他们提出了错误的问题,然后形成了错误的组织结构和战略方向,直接导致了其数据快速下降
商业化能力决定增长能力:商业化是增长能力的重要组成部分;商业化能力强的公司能够吸引更好的人才,提升组织能力,并且能够持续投入研发,更早实现盈利从而在竞争激烈的市场中生存下来
🉑 手把手实战教程 | 深入探讨 GPTs 和 AI Assistant
platform.openai.com/docs/assist...
GPTs 是 OpenAI 在2023年11月发布的新版本,具有可定制性和完成特定任务的强大功能。它提供了一种新的方式来使用ChatGPT,可以让用户根据自己的需求定制化,并与其他用户共享。Assistants API 允许用户在自己的应用中通过API实现类似 GPTs 的 AI 助理,目前支持的能力和GPTs一样 (截止2023年11月12日) ,允许接入代码解释器 (Code Interpreter)、知识库集成 (Retrieval)、函数调用 (Function calling)这三种不同类型的 tools。
虽然 GPTs 和 Assistant API 都是为了创建自定义的 AI 助手创建的,但两者的方法和使用的场景不同:GPTs 有着简单易用的前端交互,可以很快速地方便小白用户快速搭建 AI 助手 ; Assistant API 需要通过API的方式进行操作,方便开发者可以在在自己的应用中,快速集成这些能力。这篇文章非常详细地介绍了 GPTs 和 Assistant API 的操作,可以收藏备用啦~
🔔 GPTs全景解析
GPTs 是什么
构建一个完整的GPTs应用
GPTs 的问题与漏洞
🔔 Assistants API 全景解析
Assistants API 实践案例
步骤 1: 创建一个AI助手
步骤 2: 创建一个对话 Thread
步骤 3: 在对话(Thread) 中传入 消息 (Message)
步骤 4: 执行AI助手
步骤 5: 展示AI 助手的回复
步骤 6: Playground 今天调试和测试
Assistants API 工作机制剖析
AI Assistant的重要对象概念
创建一个AI Assistant 对象
管理对话和消息
执行 (Run) 和执行步骤 (Run Steps)
限制
Tools
Code Interpreter
知识库获取 Knowledge Retrieval
Function Calling
LangChain 集成 Assistant API
使用 curl 调用 Assistant API
Capabilities 和 Actions ⋙ 阅读原文
感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!