Created
Jul 28, 2024 03:48 AM
Favorite
Favorite
Priority
备注
推荐
🌟🌟🌟
类型
模型应用
大家好,我是橙哥!今天我们来梳理一下在目前的形势下,如何用AI工具打造一个躺赚的副业,实现被动收入?有哪些方法和途径?在本篇文章我主要提供一些已有的AI工具,后面我们再根据具体的AI工具和场景来详细聊聊!
1、pyVideoTrans
pyVideoTrans是一个集成多种功能的视频翻译工具,能够一键实现语音识别、字幕翻译和配音,并生成带字幕和配音的新视频。工具支持多种配音和翻译渠道,如edgeTTS、AzureTTS、OpenAiTTS等,并可完全离线使用。该工具免费、开源,代码在GitHub上公开。
notion image
2、MoneyPrinterTurboMoneyPrinterTurbo 是一个全自动视频生成工具,用户只需提供视频主题或关键词,即可自动生成视频文案、素材、字幕和背景音乐,并合成高清短视频。支持 Web 界面和 API 接口,提供多种视频尺寸选择,支持中文和英文文案,以及多种语音合成。项目采用 MVC 架构,代码结构清晰,易于维护。未来计划包括优化语音合成、增加视频转场效果和素材来源,以及支持更多语音合成服务商。
notion image
3、CrawleeCrawlee是一个用Python开发的网络抓取和浏览器自动化库,用于构建可靠的爬虫。提取 AI、LLMs、RAG 或 GPT 的数据。从网站下载 HTML、PDF、JPG、PNG 和其他文件。适用于 BeautifulSoup、Playwright 和原始 HTTP。
notion image
4、DomoAI
DomoAI 是一款 AI 视频工具,可以将真人视频转换为多种风格,如动漫、3D 卡通、像素、中式水墨等。最近,DomoAI 推出了多项新功能,包括更多样化的风格选择、提升的转绘质量和新增的角色动态功能。此外,DomoAI 还支持自定义风格和背景替换,提供更自由多样的视频生成选项。
notion image
5、EchoMimic
EchoMimic 是一个音频驱动的数字人项目,由蚂蚁集团支付宝终端技术部开发。该项目自2024年7月起陆续发布了多个更新,包括加速模型、WebUI、GradioUI版本、ComfyUI支持等,显著提升了推理速度和用户体验。此外,还提供了详细的安装指南和预训练权重下载方法,方便用户进行音频和姿势驱动的算法推理。
notion image
6、RAGFlowRAGFlow 是一个开源 RAG(检索增强生成)引擎,旨在提供简化的 RAG 工作流程。主要功能包括深度文档理解、智能分块、减少幻觉的可视化文本分块、兼容异构数据源、自动化的 RAG 工作流程等。支持Word、PPT、Excel、txt、图像、扫描件、网页等复杂的非结构化数据解析,包含各种不同场景模版,比如发票、简历、财报等。用户可以通过 Docker 快速启动服务,并根据需要进行配置和自定义。
notion image
7、ChatTTS-ui
ChatTTS-ui 是一个支持ChatTTS的web端和API,用于将文字合成为语音,支持中英文和数字混杂。用户可以通过网页或API接口使用,且支持GPU加速。项目需要安装ffmpeg,音色文件需重新生成。Windows预打包版可直接下载使用,源码部署需安装特定环境。Linux和MacOS下也可进行源码部署,需配置Python环境和安装相关依赖。API请求可通过POST方法进行,支持自定义音色和参数。
notion image
8、Lobe Chat
Lobe Chat 是一个开源的ChatGPT/LLMs UI 框架,支持语音合成、多模态和可扩展的插件系统。它允许一键免费部署私有 OpenAI ChatGPT/Claude/Gemini/Groq/Ollama 等聊天应用。Lobe Chat 提供多模型服务提供商支持、本地大模型支持、模型视觉识别、TTS & STT 语音对话、文本到图像生成、插件系统(函数调用)、代理市场(GPTs)、支持本地/远程数据库、支持多用户管理、渐进式 Web 应用(PWA)、移动设备适配和自定义主题等功能。
notion image
这些工具涵盖了视频翻译、短视频生成、网络爬虫、动漫视频生成、数字人、RAG引擎、文字转语音以及AI对话机器人等多个不同领域。只要找到合适的应用场景,这些工具可以为我们的副业创收提供很多便利和机会。我已经利用上面的一些AI工具,构建了一些小应用,并部署到了阿里云服务器,为用户持续提供价值。后面我们将在「AI大模型与技术创业」社群一起进行更加深入的探讨和分享。
notion image
点击阅读原文
加入AI大模型与技术创业」社群
Loading...