AI智能工具集(含AI语音合成、视频补帧、视频放大、目标检测、图片风格化等)

158次阅读

前言

AI 智能技术的应用大家应该都遇到过,比如最常见的人脸识别

软件应用中也常会遇到一些 AI 智能配音、视频补帧、超分辨率工具,简单实用

其实这类 AI 算法大都是开源的,不过上手需要一定的编程基础,用起来比较困难

所以便衍生出了很多只是套了个壳的收费工具

今天给大家分享一款无任何上手难度的 AI 智能工具集,内容涵盖 AI 语音合成、视频补帧、视频超分、目标检测、图片风格化等领域。

开源免费,并且是开箱即用的,希望你们喜欢~

AI 语音合成

之前也推荐过一款微软语音合成工具,今天再给大家带来三款

分别为:抖音火山引擎语音合成、阿里云语音合成以及微软语音合成工具

图片

使用说明

其中火山引擎是配音员最多的,总共大概有 50 种,其中有萌娃、海绵宝宝、小新、萝莉、方言、相声等等我们刷短视频时常听到的

只要鼠标指到语音名称上便可以直接试听声音了

然后阿里的只有 5 款声音、微软的有 10 几种与之前推荐过的差不多

图片

然后这些接口其实都是调用对应平台的免费接口

火山引擎不配置密钥信息的话每次可以朗读约 300 字,阿里的必须要配置 AccessKey Id 后才可以使用,这两个都可以在官网申请

微软订阅密钥有一个申请好的,填入后每月可免费 50 万字

差距这就看出来了……

图片

AI 目标检测

目标检测工具适用范围非常广,可以用作物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

也有三款分别为旷视开源的 YOLOX、美团开源的 YOLOv6 以及常用的 YOLOv5

图片

使用也比较简单,有两个拖动条,置信度越低检测内容越多、NSM 值越大重叠框越少

设置完毕后,导入视频或图像点击开始便可以自动框选目标了

大家好奇的话可以玩玩

图片

AI 视频补帧

视频补帧工具应该是有不少朋友需要的

可以为运动类视频流畅度升级,将低帧率 30fps 升级到 60fps 或 360fps,适用于丝滑质感需求。

操作也很简单,可以参考下图

图片

AI 视频超分辨率

超分辨率便是我们常提到的视频放大技术,可以将 720p 或 360p 视频转 1080p 或 4k 视频, 画质升级且不模糊,不过目前主要在动漫领域表现出色

当下视频超分模型算是百花齐放的,其中 RealESGAN、RealCugan 等算法已经明显优于 waifu2x。

这个超分辨率工具有四种,分别为 RealCugan-GUI、RealESRGAN-GUI、RealSR-GUI 以及 waifu2x

内置模型上的不同,界面与使用上都区别不大

图片

其余四款

还有四款就不挨个介绍了

分别为:智能人脸图像修复、视频图像抠图、图像转漫画、视频居中对比辅助工具

也都是免安装开箱即用的小工具,没什么学习成本,基本导入素材点开始就能看到效果

图片

最后

人工智能工具集(AI 视频补帧、超分辨率、语音合成、目标检测、智能抠图等等)

夸克链接(不限速下载)https://pan.quark.cn/s/5d29c4782fa7

百度网盘链接:https://pan.baidu.com/s/1M0fUDBrC5hoA2kRTyRKJMg?pwd=35tv

祝:使用愉快

今天的分享就到这里啦

如果对您有用,可以帮小编来个三连,怎么连都可以滴~

原文链接:https://www.bilibili.com/read/cv18049289

正文完
 
不知道
版权声明:本站原创文章,由 不知道 2023-08-24发表,共计1293字。
转载说明:声明:本站内容均来自互联网,归原创作者所有,如有侵权必删除。 本站文章皆由CC-4.0协议发布,如无来源则为原创,转载请注明出处。