GitHub音频转文字本地运行能够批量快速免费使用」 - Reddo

Speech
Speech

Speechmatics提供的音频转文本API可免费使用,允许用户通过简单的文件上传无代码测试其转换准确性。这一工具方便用户批量处理音频文件,并在门户中管理API和使用情况。

Buzz - 离线音频转录与翻译工具
Buzz - 离线音频转录与翻译工具离线音频转录与翻译工具

Buzz是一款离线音频转录和翻译工具,基于OpenAI Whisper技术,支持导入多种格式的音频和视频文件。兼容Mac、Windows和Linux系统,并可将转录结果以多种格式导出,便于快速处理和使用。

Buzz是一款开源且免费的语音转文字工具,支持多种音频和视频格式的导入,能够实时转录并转换为TXT、SRT和VTT等文本格式。支持离线使用,适配Mac、Windows和Linux系统,广泛应用于会议记录和视频字幕制作。

MemoAI
MemoAI

MemoAI是一个AI驱动的音频和视频转文字工具,支持批量和快速转换本地音频文件为文本。提供多种语言间的翻译和实时字幕功能,确保用户数据的安全和隐私,完全支持离线使用

WEIFENG2333/AsrTools
WEIFENG2333/AsrTools

AsrTools是一款免费的音频转文字工具,支持批量处理功能,能够方便快速地将音频文件转换为SRT或TXT格式,非常适合需要高效处理音频的用户。

audio2text
audio2text

audio2text是一个免费工具,能够将不同音频文件转换为文本,支持多种语言,且准确率高。这使得它成为在GitHub上适合批量处理音频转录的工具。

Faster Whisper
Faster Whisper

Faster Whisper是一款基于OpenAI Whisper模型的音频转文字工具,支持离线使用,速度较快,并具备批量处理能力,适合需要大量音频转写的用户。

WhisperX
WhisperX

WhisperX是一个开源的音频转文字工具,具有高达70倍的转录速度,能处理批量音频文件。它支持字级时间戳和多说话者识别,基于OpenAI的Whisper模型优化,适合多种语言。

Whisper - 开源语音识别,助力语音处理技术的研究与应用。
Whisper - 开源语音识别,助力语音处理技术的研究与应用。开源语音识别,助力语音处理技术的研究与应用。

Whisper是由OpenAI开发的开源自动语音识别系统,支持多种语言的音频转文字功能,能够高效地进行批量处理,适用于多种场景,用户可本地运行并免费下载使用。

Whisper 是由 OpenAI 开发的音频转文字模型,支持多种音频格式的转录。它能够进行批量处理,提升转录效率,适用于各种应用场景。用户只需安装相关依赖并加载模型,就可以开始转录任务。

transcribe-anything
transcribe-anything

transcribe-anything 是一款免费、快速的音频转文字工具,支持本地文件和网络音频的批量转录,保护用户隐私。该工具基于 Whisper AI 技术,适用于多操作系统,能够高效生成字幕和文本。

Whisper Mate
Whisper Mate

Whisper Mate是一款本地应用程序,基于OpenAI的Whisper AI模型,能够快速批量将音频和电影文件转录为文本,保障用户隐私且免费使用。软件内置字幕编辑器,可逐段预览转录结果。

MacWhisper
MacWhisper

MacWhisper 使用 OpenAI Whisper 技术,可快速将音频文件转录文本,适用于会议和讲座等场景。虽然它提供高效转录功能,但未明确支持批量处理和免费服务。

UniScribe
UniScribe

UniScribe 是一款 AI 转录工具,快速将音频与视频转换为文本,适用于学习笔记和会议记录等。支持多种格式导出,能够满足多样化的转录需求,但未说明是否在本地运行或与GitHub相关。

Mr. Voice Bot
Mr. Voice Bot

Mr. Voice Bot是一款可以将语音和视频文件安全地转换为文字的工具,支持较大文件的处理。然而,未指明其在GitHub上的免费批量运行功能。

AdutorAI
AdutorAI

AdutorAI是一款音频转文字工具,支持多语言和自定义选项,适合快速转录会议和短音频内容。虽然提供了实用功能,但未详细说明其在GitHub上的免费提供情况。

VideoToWords AI
VideoToWords AI

VideoToWords AI是一款音频转文字的人工智能服务,支持多种语言并适合多类用户。虽然功能与请求有关,但未具体说明是否在GitHub上提供。

rsreetech/VideoTranscription-
rsreetech/VideoTranscription-

该项目是基于Jupyter Notebook音频转写工具,利用Hugging Face的wav2vec2库,能够将YouTube视频的音频内容转换为文本。用户可以选择语言和识别模式,提升视频内容的可访问性。

灵云听语
灵云听语

灵云听语是一款智能语音识别应用,支持音频文件转写和实时录音转文字,识别率高达98%。适用于工作、学习等多种场景,允许批量处理音频文件,但未明确指出为GitHub工具。

悦录
悦录

悦录是一款被多家媒体推荐的录音转文字工具,支持多种场景,如网课学习和采访录音,具备高质量录音和文本识别功能,适合快速整理学习笔记。然而,未明确支持批量处理和GitHub平台的整合。

Audiotext
Audiotext

Audiotext 是一个桌面应用程序,支持99种语言,可以处理多种音频与视频格式的转录。用户可选择使用Google Speech-to-Text API或Whisper API生成转录内容,但未说明是否支持批量处理免费使用

Insanely Fast Whisper API
Insanely Fast Whisper API

Insanely Fast Whisper API是一个基于OpenAI Whisper Large v3模型的开源音频转文字工具。它支持在GPU云平台上部署,并集成说话人识别功能,专为高并发处理设计。