思考与发现
AI时代,工具的价值在于降低专业门槛,让更多人能够实现以往需要专业人士才能完成的工作。无论是生图、生成视频还是对话,其"难"与"易"取决于使用者的需求和学习意愿。对于开发者而言,真正的挑战在于打造一款能在普通用户电脑上流畅运行、真正成为生产力助手的AI工具,而非仅仅停留在概念或云端服务。同时,个人计算机的算力资源在AI时代是一笔巨大的、未被充分利用的财富,通过P2P技术实现去中心化的算力共享,是一个极具潜力的未来方向。此外,行业中对"低代码"、"云端"等新名词的过度包装,本质上是商业策略,其核心技术与多年前的"可视化开发"、"服务器托管"一脉相承,需要为技术"祛魅",回归本质。
工作总结
主要完成了"幻灯看图"功能的配置完善与代码重构,使其操作更舒适、性能更优。同时,开始测试基于ComfyUI的多音频对口型工作流,探索在个人电脑上实现高质量AI视频生成的可行路径。
工作内容
1. "幻灯看图"功能优化与重构
作为AI浏览器和工作平台的一部分,针对传统浏览器看图功能单一、操作不便的问题,对内置的看图组件进行了全面升级。利用软件BS/CS混合架构和网页UI的优势,集成了自研与开源组件,实现了更舒适、美观的看图体验。具体优化包括:
- 增加了背景图、背景颜色、工具栏等显示配置选项。
- 对相关代码逻辑和数据传递方式进行了彻底重构,摒弃了初版的技术方案。
- 目标是追求代码简洁,并持续提升运行速度和整体性能。
2. 探索本地AI视频生成工作流
开始尝试在本地运行基于ComfyUI的、支持多音频对口型的AI视频生成工作流。使用16G显存的显卡进行测试,发现运行较高精度模型时仍感吃力。正在持续测试不同工作流,寻找在个人电脑配置下能够兼顾效果与效率的最佳方案,为未来向普通用户推广落地积累实践经验。
问题与解决
本地AI视频生成的性能瓶颈
在测试ComfyUI多音频对口型工作流时,遇到显存(16G)制约问题,运行高质量模型不够流畅。计划继续尝试ComfyUI自带的工作流进行优化测试,目标是找到一个在主流个人电脑配置上能够"跑得通、跑得快"的稳定流程,这是产品能否真正服务于个人用户的关键。
后续计划
1. 构建P2P算力共享平台
规划在凤希AI伴侣软件内集成一个去中心化的AI算力资源共享平台。用户可以将自己电脑(安装有Ollama、ComfyUI等AI服务)在闲置时(如睡眠时段)共享出来。其他配置较低的用户可以通过软件直接P2P连接并使用这些共享资源进行对话、生图、生视频等操作,资源提供者可以因此获得收益(补偿电费、硬件损耗等)。这将极大降低个人使用AI的门槛,并激活海量的个人算力资源。
2. 开发P2P视频通信功能
基于同样的P2P架构,计划开发一对一视频聊天功能,适用于在线教学等场景。服务器仅负责连接匹配,实际音视频数据端对端直连,保障通信私密性与安全性,同时减少服务器中转的流量成本。
此工作日记由"凤希AI伴侣"的AI语音功能生成,经过以下步骤:主人口述 > AI语音识别 > AI纠正整理 > 凤希AI开发助手智能体生成最终日记。