🗒️基于Edge,微软TTS文字转语音创作抖音视频

2024-2-19
| 2024-2-19
0  |  0 分钟
type
status
date
slug
summary
tags
category
icon
password
😀
本文介绍了如何使用基于Edge的微软TTS库实现文字转语音,并将语音文件添加到剪映中制作抖音视频。文章提供了中文的语言角色列表,并给出了Python脚本示例来演示文字转语音的过程。通过这种方式,可以方便地制作口播视频,并在剪映中添加字幕。

背景介绍

这两天创作了一个介绍OpenAI的SORA视频大模型的抖音视频,在用剪映创作的过程中,里面文字转语音的功能用的不太习惯,特别是部分声音还需要开通vip,作为一个白嫖党,怎么可能轻易屈服,就去开通会员呢,想到之前用到过edge下的微软tts,就借助微软tts,实现了文字转语音,最终把语音文件添加到剪映里面,完成了视频的制作。 抖音视频地址是:https://v.douyin.com/iNudmp5L/

基于Edge,微软TTS是什么东东

这里不做太多基础的介绍,想要了解更多的基础信息,自己上网搜索资讯信息就可以了解到了。
要提到的一点是,微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的,一如ChatGPT在NLP领域的随心所欲,予取予求。
几乎所有的抖音营销号口播均采用微软的语音合成技术,其影响力由此可见一斑,仅有的白璧微瑕之处就是价格略高,虽然国内也可以使用科大讯飞语音合成进行平替,但我们只想要最好的那一个,这里我们使用免费的开源库edge-tts来实现文本转语音操作,薅微软edge的羊毛。

TTS文本转语音基础使用方式

在终端下安装edge-tts库,无论你是Mac还是Window
安装完毕后,可以运行edge-tts --list-voices命令,打印Edge浏览器中,内置的语言角色列表。如果不能出现结果。要么是你没有安装Edge浏览器,要么是你刚刚的Python安装edge-tts库出了问题,排查一下,解决它,能看懂本文,相信你有足够的能力解决掉它。

中文edge-tts语言角色列表

我经过整理过滤后,这里列出来中文相关的语言角色列表,毕竟咱们做抖音,快手,视频号,都是面向国人嘛,英语或者其他语言是不需要我们考虑的。

编写python脚本,文字转语音

这里是为了方便记录整理音频文件,更加方便我自己的使用,才写的python脚本,实现文字转语音。也可以直接在终端,通过命令的方式生成音频文件
下面看一个示例
这个示例,就是我最上面那个抖音视频链接里面的音频内容,运行完这个脚本,最终会得到一个完整的mp3音频文件。导入到剪映中,就实现了口播视频的效果。当然了,之前的视频画面还是得你自己准备好。这块只是提供音频,再借助剪映的提取字幕功能,还可以把字幕显示出来。

总结

对于做这种口播相关的视频业务,都可以通过类似这样的方式来实现,先准备好视频画面,然后呢,把你想要介绍描述的文字准备好,再选择一个你喜欢的角色声音,通过脚本运行得到音频,接着再导入到剪映中,微调下视频画面长度,音频长度,最终就可以得到一个完整的视频啦。
 
技术分享
  • 技术分享
  • 用ffmpeg将youtube的视频分辨率转换为720*1280Java对象转JSONstring
    目录