在图像、视频、音频领域,各种基于AI云计算、机器学习的开源项目、应用层出不穷,过去那些繁琐的处理,如今借助AI智能,让一切变得简单易用。
目前互联网的大厂,在AI应用领域摩拳擦掌,推出了各种经典的AI算法,被广泛应用于图像、音视频领域,例如腾讯RealSR算法、B站的Real-CUGAN、微软Azure AI等。
在实际应用中,通常需要相关工具开发者引入项目中,为一般用户提供简单直观的GUI界面,免安装即开即用,已支持 40+AI 模型,内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统(这次有了宝子)
#体验分享介绍
AI技术的发展为我们带来了很多便捷高效的工具软件,这些软件可以自动完成许多传统上复杂耗时的任务。本文推荐几款简单易用的AI视频图像处理软件。
Paper2GUI,一个开源的AI智能工具箱
Paper2GUI,是一款面向普通人的AI桌面工具箱,它免安装即开即用,目前已支持18+AI模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR识别等领域。
首先,在图像、语音、视频处理领域,开源免费的AI项目大家已屡见不鲜,通常只要按照开发者所述,创建和配置应用环境,即可上手体验。不过对于一般人而言,大部分的项目还是有一定的难度。
Paper2GUI由此而生,它是基于各种开源项目衍生而来的GUI版,提供了一个操作简单的软件界面,它的主要特点:即开即用。
主要包括:
- AI语音合成:微软、抖音、阿里语音合成
- AI视频超分辨放大:RealESRGAN-GUI、RealCugan、RealSR
- AI视频补帧:RIFE-GUI、DAIN-GUI
- AI图像风格化:AnimeGAN-GUI
- AI人像抠图:RVM-GUI
- AI人像修复:GFPGAN-GUI
- AI视频抠图:MODNet-GUI、MobileNetV2-GUI
- AI目标检测:YOLOv6-GUI
已发布内容【下列独立 APP 完全免费】
语音合成
文字转语音工具,适用于配音、讲解、说书、广告等场景。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
微软语音合成 🔥 | 5Mb | FastSpeech | ✅ | ✅ | ✅ | ✅ | Download |
抖音火山语音 🔥 | 13Mb | Unknown | 🔲 | ✅ | ✅ | ✅ | Download |
阿里云语音合成 | 13Mb | Unknown | 🔲 | ✅ | ✅ | ✅ | Download |
艺术绘画
文本转图片,想象力与 AI 的完美结合
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
StableDiffusion🔥 | 10Mb | Naifu | ✅ | ✅ | 🔲 | 🔲 | Download |
- 视频超分辨放大
视频超分工具,适用于 720p 或 360p 视频转 1080p 或 4k 视频,画质升级且不模糊,目前主要用于动漫视频超分。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
RealESRGAN-GUI(RAM)🔥 | 41.8Mb | RealESRGANv3 | ✅ | ✅ | 🔲 | 🔲 | Download |
waifu2x-GUI | 38.9Mb | waifu2x | ⏳ | ✅ | 🔲 | 🔲 | Download |
RealESRGAN-GUI | 28.8Mb | RealESRGANv2 | 🔲 | ✅ | 🔲 | 🔲 | Download |
RealCugan-GUI | 56.4Mb | RealCugan | 🔲 | ✅ | 🔲 | 🔲 | Download |
RealSR-GUI | 94.5Mb | RealSR | 🔲 | ✅ | 🔲 | 🔲 | Download |
- 视频补帧
运动类视频流畅度升级工具,可以将低帧率 30fps 升级到 60fps 或 360fps。适用于丝滑质感需求。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
RIFE-GUI(RAM)🔥 | 51.2Mb | Rife | ✅ | ✅ | 🔲 | 🔲 | Download |
DAIN-GUI | 72.6Mb | Dain | 🔲 | ✅ | 🔲 | 🔲 | Download |
- 图像风格化(照片转动漫)
图像风格化,可以将照片转换为动漫风格、梵高风格、毕加索风格等等。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
AnimeGAN-GUI🔥 | 8.9Mb | AnimeGANv2 | ✅ | ✅ | 🔲 | 🔲 | Download |
- 人像抠图
AI 一键抠图,可生成透明图、绿幕、红幕、蓝幕等背景图片,头发丝处理良好,适合任意人物抠图需求。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
RVM-GUI🔥 | 12.9Mb | rvm | 🔲 | ✅ | 🔲 | 🔲 | Download |
- 人像修复
人像修复,可以将人像修复为清晰的图片,提升清晰度。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
GFPGAN-GUI🔥 | 242Mb | GFPGAN | ✅ | ✅ | 🔲 | 🔲 | Download |
- 视频抠图
视频抠图,利用 RVM 等算法,可实现无绿幕视频抠图,适合各种自媒体视频制作,节约大量时间。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
MODNet-GUI🔥 | 77.5Mb | modnet | 🔲 | ✅ | 🔲 | 🔲 | Download |
MobileNetV2-GUI🔥 | 34.6Mb | MobileNetV2 | 🔲 | ✅ | 🔲 | 🔲 | Download |
- 目标检测
适用范围太广,比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
YOLOv6-GUI | 46Mb | yolov6n | ✅ | ✅ | 🔲 | 🔲 | Download |
YOLOv5-GUI | 60.2Mb | yolov5s | ✅ | ✅ | 🔲 | 🔲 | Download |
YOLOX-GUI | 50Mb | yolox_nano | ✅ | ✅ | 🔲 | 🔲 | Download |
- 辅助工具
辅助工具,提供了一些常用的辅助工具,比如视频比对工具等。
名称 | 大小 | Model | 多语言 | Windows | Mac | Linux | 下载 |
---|---|---|---|---|---|---|---|
Video_compare🔥 | 56.1Mb | ✅ | 🔲 | 🔲 | Download |
- 小白兔 AI – 聚合版【更专业的选择】
小白兔 AI 是一款功能非常强大的人工智能软件,实现了 AI 绘画、语音合成、视频抠图、动漫超分辨、视频补帧、录音降噪、视频上色、人脸动漫化、图片修图、视频修复等 40 余种功能,致力于打造一款实用、好玩又有趣的 AI 生产力聚合工具箱。面向生产力用户,可免费试用 14 天,支持 Windows 和 Mac 系统。从3.0版起AI绘画、人脸动漫化、图片修复和视频补帧永久免费。
已内置功能 | 适用场景 | 功能简介 |
---|---|---|
RealCugan-Pro 动漫超分辨 | 动漫图片或视频超分辨放大 | 自研 AI 引擎驱动,可获得最高质量的动漫超分辨效果,可能是目前唯一可轻松使用 RealCugan-Pro 模型的软件 |
RealESRGAN 动漫超分辨 | 动漫图片或视频 | 推理速度快,质量比 waifu2x 好太多,常规超分辨首选 |
智能抠图 | 任意图片或视频 | 推理速度快,一键获得透明图片或绿幕视,进行二次创作 |
人像动漫化 | 仅适合头像处理 | 转换效果出众,有趣又好玩 |
语音合成 | 自媒体视频配音、有声读书等 | 效果逼近真人,发音自然、带呼吸声、支持 txt 大文件极速合成 |
录音降噪 | 真人配音后处理 | 一键去除环境和背景噪音,提升录音清晰度,效果明显 |
视频补帧 | 运动类视频流畅度升级工具 | 可获得丝滑观感,已支持 RIFE 和 IFRNET 两种 AI 模型 |
一键超补 | 同时完成超分和补帧 | 融合超分和补帧模型,一键获得超补结果 |
AI 一键跑分 | 一键查看设备 AI 性能数据 | 模拟真实推理任务,统一量化推理任务,耗时越小越好 |
图片 OCR 识别 | 图片转文字 | 基于 Paddle-OCR-v3 模型,迄今最优秀的 OCR 识别模型、效果出众 |
视频字幕 OCR 提取 | 硬字幕提取 | 使用 PP-OCR 自动识别字幕位置及文字,输出字幕文件 |
视频上色 | 老旧黑白照片或视频上色 | 适合风景类黑白视频上色,推理速度快 |
人脸修复 | 人脸照片修复 | 可增强老旧照片、修复人脸,提高清晰度 |
目标检测 | 图像检测和分割 | 展示 AI 技术在通用场景下的检测、分割、追踪等效果 |
图像修复 | 老旧照片修复 | 可全身修复,也可只修复人脸,效果出众 |
视频转动漫 | 风格迁移 | 普通视频转换为动漫画风的视频 |
Whisper语音识别 | 支持十几种语言识别 | 一键本地生成字幕 |
字幕翻译 | 连续语境下的字幕翻译 | 告别传统单条字幕翻译,连续语境更准确,支持28种语言互译 |
聚合版面向专业需求用户,付费只是为了持续产出优质 AI 应用。已开源的 20 个单独 APP 完全免费,各取所需,请勿喷我,如果项目帮到了你,不妨点个 Star。
AI人工智能语音合成:
AI智能语音合成,相关的在线网站,工具已经屡见不鲜,微软包括国内的阿里、抖音均提供了开放的语音合成引擎。实际的应用效果相当逼真,被广泛应用在配音、讲解、广告等场景。
Paper2GUI提供了相应的工具包,集成了火山、抖音、微软的语音合成引擎,简单几步配置即可快速上手应用。
实际的效果相当棒,人声的语调和情感匹配相当的流畅、发音自然,绝对可以以假乱真,或者说基本上听不出这是机器合成的语音,不得不感叹AI的强大。
另外,微软、火山、阿里云所提供的语音合成引擎均有一定的收费项,免费有限制,开发者也给了一个简单的总结:
- 逼真度:微软 > 火山 > 阿里云
- 语言丰富度: 微软 > 火山 > 阿里云
- 中文丰富度: 火山 > 微软 > 阿里云
- 费用:微软 > 阿里云 > 火山
AI智能视频补帧:
DAIN-GUI:无需繁琐设置,零依赖,开箱即用的一款视频补帧工具,经过智能补帧算法,可实现丝滑流畅画质。由于DAIN算法运算超级慢,仅供测试,实际使用推荐RIFE-GUI
AI智能视频补帧测试:
DAIN-GUI和RIFE-GUI两款视频帧率转换软件。这些软件使用AI技术可以自动生成新的帧插在视频帧之间,可以将低帧率视频转化为高帧率,使视频变得更加流畅。如可以将30fps转60fps,大大提高视频流畅度。
测试视频对象是帧速率 30.00帧/秒,目标是帧速率 60.00帧/秒。
实测时间(不到20秒搞定)完美!
AI智能视频超分:
DAIN-GUI:经过智能补帧算法,可实现丝滑流畅画质。由于DAIN算法运算超级慢,仅供测试,实际使用推荐RIFE-GUI
RealCugan-GUI:一款视频超分辨工具,可实现720p转4k甚至8k。
RealESRGANv2-GUI:特别适合动漫超分放大。
RealESRGAN-GUI:纯内存、不消耗硬盘空间,支持多种界面语言 – 支持放大2倍、3倍、4倍 – 特别适合动漫处理 – 去模糊明显 – 支持单张图片或视频放大 – 软件体积小,轻量便捷 – 支持vulkan GPU加速,低显存消耗。
RealSR-GUI:特别适合动单张图片放大。
Waifu2x-GUI:可实现720p转4k甚至8k。
AI智能视频超分测试:
RealCugan-GUI、RealESRGANv2-GUI等是一系列视频超分辨率软件。这些软件可以利用人工智能将视频的分辨率显著提高,如可以把720p视频提高到4K或8K。测试结果表明,这些软件可以将分辨率从478×848提高到956×1696,同时保持图像清晰度。
测试视频对象是478*848
实测时间(不到30秒搞定)完美!结果:956*1696
AI智能视频抠图:
MobileNetV2-GUI:纯内存模式,告别硬盘缓存,体验特别好,不再担心源头视频的大小问题
AI智能视频超分测试:
MobileNetV2-GUI是一款智能视频抠像软件。通过人工智能技术,这款软件可以自动识别视频中的主体物体,并迅速抠取出来,简单易用。测试结果效果很理想。
直接来看测试的效果~
是不是非常完美?川宝看了都直呼牛~~~~~注意看下人物主体身上的光抠像!!!
AI智能图片转漫画:
AnimeGAB-GUI:一键图片转动漫,因出图分辨率低,可以使用AI分辨率增强处理。
AI智能图片转漫画测试:
AnimeGAN-GUI可以将真实照片翻转成动漫风格图片。这款软件通过生成对抗网络,可以把真实图片转换为有着动漫特征的图片,动漫迷们会喜欢。
去年的时候毛毛发过测试教程,今天在带大家来直接测试一下。
#非常值得尝鲜
总体来说,上述AI软件都有强大的人工智能技术支持,功能各异,转化效果理想,值得一试。
#最后
这么干的货你是不是要点点那个东西,免费支持下你们的后期圈
#下载地址来了
小白兔AI人工智能桌面APP合集下载:
百度网盘:https://pan.baidu.com/s/1TfBsmULNJTIYEejBrLiITw?pwd=6sxa
阿里云盘:https://www.aliyundrive.com/s/2b4hyudGkni
—-
做个广告,站长做的GTP+AI绘画系统,喜欢的宝子可以支持下!
购买地址:https://chat.redsex.cc
—-