暂无菜单项
将PDF文档转换为多语言语音朗读的跨平台AI工具
Read PDF Aloud是一款浏览器扩展工具,支持一百四十二种语言的网页与文档一键转语音,内置光学字符识别处理扫描件,可导出音频文件。免费版覆盖日常听读场景,离线收听与批量导出需借助替代方案。本文详解从安装到收听的完整流程及竞品对比,查看详情。
快速将视频和音频文件自动转录为文字,支持多格式导出
基于Whisper large-v3大模型的开源视频转文字工具video2text实测对比,支持TXT、SRT、VTT、JSON四种输出格式,完全离线运行且无需上传数据,最低要求NVIDIA显卡六GB显存。本文从转写引擎精度、硬件部署成本、输出管线集成三个维度与讯飞听见、Descript进行横向评测,查看完整对比。
专业高效的AI配音与语音合成工具
讯飞智作是科大讯飞推出的AI音视频生产平台,基于语音合成与虚拟人技术提供AI配音和数字人视频制作。本文详解注册后实操流程、声币消耗模式及功能边界,帮助判断是否适合你的内容生产场景,点击查看详情。