Skip to content

fabianhtml/AudioInk

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

AudioInk

AudioInk es una app de escritorio para transcribir audio y video localmente con Whisper. Está construida con Tauri 2 y Rust, y el proyecto soporta macOS.

Estado del proyecto

  • Soporte actual: macOS 10.15+
  • Procesamiento: local, sin subir tus archivos a servicios externos

Qué hace

  • Transcribe archivos de audio y video desde tu Mac
  • Permite elegir entre varios modelos de Whisper, con Turbo como opción recomendada por defecto
  • Soporta detección automática o selección manual de idioma
  • Puede mostrar marcas de tiempo en la transcripción
  • Guarda historial de transcripciones
  • Permite usar subtítulos de YouTube o transcribir el audio con Whisper
  • Puede acelerar audio antes de transcribir usando ffmpeg

Formatos soportados

  • Audio: mp3, wav, m4a, flac, ogg
  • Video: mp4, mov, mkv

Requisitos

  • macOS 10.15+
  • Node.js 18+
  • Rust
  • Entre 75 MB y 1.55 GB libres por modelo, según el modelo de Whisper que uses

Dependencias opcionales

  • yt-dlp Se usa para flujos de YouTube. Instalar con:

    brew install yt-dlp
  • ffmpeg Se usa para acelerar audio y para postprocesado de YouTube. Instalar con:

    brew install ffmpeg

Instalación

Desarrollo

brew install node
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
npm install
npm run tauri dev

Build local

npm install
CI=true npx tauri build --bundles app,dmg

Los artefactos se generan en:

  • src-tauri/target/release/bundle/macos/AudioInk.app
  • src-tauri/target/release/bundle/dmg/

Uso

  1. Abre AudioInk.
  2. Descarga un modelo de Whisper desde la app.
  3. Elige una fuente: File para audio o video local. YouTube para subtítulos o transcripción con Whisper.
  4. Ajusta idioma, timestamps y velocidad si lo necesitas.
  5. Ejecuta la transcripción.
  6. Copia o exporta el resultado.

Modelos de Whisper

  • Turbo: recomendado por defecto, mejor equilibrio entre calidad y velocidad
  • Base: buen equilibrio general
  • Small: mejor precisión
  • Medium: alta precisión
  • Tiny: más rápido, menos preciso

Estructura

audioink-rs/
├── src/                 # Frontend en HTML, CSS y JavaScript
└── src-tauri/           # App de escritorio en Rust + Tauri
    └── src/
        ├── commands/    # Comandos Tauri
        ├── core/        # Whisper, audio, YouTube
        ├── models/      # Tipos y estructuras
        ├── persistence/ # Historial
        └── utils/       # Utilidades y manejo de errores

Stack

  • Frontend: HTML, CSS y JavaScript vanilla
  • Desktop: Tauri 2
  • Backend: Rust
  • Transcripción: whisper-rs (bindings de whisper.cpp con Metal en Apple Silicon)
  • Decodificación de audio: Symphonia

Licencia

MIT

Créditos

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors