Video description generation and automatic dubbing

视频描述生成和自动配音项目

迁移原作者仓库说明：VDG_README.md（Kamino666：视频描述生成部分）

介绍

本项目基于 Video-Captioning-Transformer项目魔改，在视频描述生成的基础上添加了TTS自动配音和添加字幕的功能。

！！！使用前需要完成的事情

配置腾讯云APIkey，在.env文件中配置TENCENT_SECRET_ID和TENCENT_SECRET_KEY。如下：

TENCENT_SECRET_ID = ""
TENCENT_SECRET_KEY = ""

下载已有的或自己训练模型，将模型文件放入checkpoint文件夹中。分别是
- clip4clip_msrvtt.pth
- clip4clip_msvd.pth 默认使用msrvtt模型，若要使用msvd模型，需在run.py中指定model和config文件。

整合运行脚本run：

指定视频：

python run.py -v input/your_video.mp4

可自行在run.py 中修改其他参数，请见main函数下的参数解析。

使用predict：

参数如下：

python predict_video.py -c configs/caption-task_baseline_modal_clip4clip_config.json -m checkpoint/clip4clip_msrvtt.pth -v input/test.mp4 --feat_type CLIP4CLIP-ViT-B-32 --ext_type uni_12 --greedy --cpu

Name		Name	Last commit message	Last commit date
Latest commit History 126 Commits
.idea		.idea
checkpoint		checkpoint
configs		configs
data		data
input		input
log		log
model		model
submodules		submodules
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
VDG_README.md		VDG_README.md
add_audio.py		add_audio.py
add_subtitles.py		add_subtitles.py
dataloader.py		dataloader.py
eval.py		eval.py
predict_video.py		predict_video.py
requirements.txt		requirements.txt
run.py		run.py
train.py		train.py
tts.py		tts.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Video description generation and automatic dubbing

视频描述生成和自动配音项目

介绍

！！！使用前需要完成的事情

整合运行脚本run：

使用predict：

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Video description generation and automatic dubbing

视频描述生成和自动配音项目

介绍

！！！使用前需要完成的事情

整合运行脚本run：

使用predict：

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages