Ты думаешь быстрее, чем печатаешь. Средняя скорость набора текста -- 40-60 слов в минуту. Скорость речи -- 120-150 слов в минуту. Диктуя вместо набора, ты фиксируешь мысли в 3 раза быстрее.
Но скорость -- не главное. Главное -- снижение порога. Открыть Obsidian, создать заметку, начать печатать -- это три барьера. А нажать клавишу и начать говорить -- это один. Идея, пойманная на лету, стоит больше, чем идея, которую "потом запишу".
Помнишь сколько у тебя было идей "надо записать"? И где они теперь? ))
Голосовой ввод особенно полезен для:
На курсе мы строим "второй мозг" в Obsidian. Голосовой ввод -- это самый быстрый путь из головы в хранилище.
Лично я (Макс) использую его Вот кстати моя реферальная ссылка на бесплатный месяц: https://aquavoice.com/share?code=MP-4C3N
Облачный сервис, который видит контекст твоего экрана и адаптирует распознавание. Если ты диктуешь в Obsidian-заметку про Zettelkasten -- он это "видит" и точнее распознаёт специфические термины.
Как работает: устанавливаешь приложение, оно получает доступ к экрану через Accessibility API. Два режима -- мгновенный (нажал-сказал-отпустил, 450мс задержка) и потоковый (текст появляется в реальном времени).
Платформы: macOS, Windows. Мобильного приложения нет.
Цена:
| Тариф | Цена | Что даёт |
|---|---|---|
| Free | $0 | 1 000 слов (одноразово, не в месяц) |
| Pro | $8-10/мес | Безлимит, 800 записей в словаре |
Сильные стороны:
Ограничения: только облако, нужен интернет. Бесплатный тариф -- по сути демо.
Установка: aquavoice.com/download
Я пользовался почти год, но переключился на Aqua Voice
Базовая транскрипция работает офлайн -- звук обрабатывается прямо на твоём компьютере через модели Whisper и Parakeet. Но "умные" режимы (форматирование, очистка текста через GPT/Claude) используют облако. То есть: распознавание речи -- локально, AI-обработка -- опционально в облаке.
Как работает: скачиваешь приложение, выбираешь размер AI-модели (от быстрой до максимально точной), назначаешь клавишу-триггер. Нажал -- говоришь -- отпустил -- текст появляется в активном окне. Работает в любом приложении, включая Obsidian.
Платформы: macOS, Windows, iOS, iPad.
Цена:
| Тариф | Цена | Что даёт |
|---|---|---|
| Free | $0 | 15 минут записи, базовые модели |
| Pro | $10/мес или $85/год | Безлимит, все модели, кастомные режимы |
Сильные стороны:
Установка: superwhisper.com/download или App Store.
Я сам не пользовался, но многие хвалят
Не просто диктовка, а голосовое управление текстом. Выделяешь абзац, говоришь "перепиши короче" -- и он переписывает. Это Command Mode, и он меняет подход к работе с текстом.
Платформы: macOS, Windows, iOS, Android.
Цена:
| Тариф | Цена | Что даёт |
|---|---|---|
| Free | $0 | 2 000 слов/неделю, словарь, 100+ языков |
| Pro | $15/мес | Безлимит, Command Mode, обучение стилю |
Сильные стороны:
Ограничения: только облако. Command Mode только в платной версии.
Установка: wisprflow.ai или App Store / Google Play.
Если не готов платить -- есть встроенные инструменты:
| Ситуация | Рекомендация |
|---|---|
| Приватность важна, работаю офлайн | SuperWhisper |
| Хочу максимальную точность | Aqua Voice |
| Хочу редактировать текст голосом | Wispr Flow |
| Не хочу платить, Mac | macOS Dictation |
| Не хочу платить, Windows | Win+H Voice Typing |
| Не хочу платить, хочу кастомизацию | Whisper.cpp + GUI |
| Нужен мобильный ввод | Wispr Flow (iOS/Android) или SuperWhisper (iOS) |
Для курса рекомендуем Aqua Voice или SuperWhisper Но если бюджет ограничен -- начни с macOS/Windows Dictation, это уже лучше, чем не диктовать вообще.
В SuperWhisper и Aqua Voice можно задать инструкции, как обрабатывать твою речь. Это кардинально меняет качество.
Пример для ежедневных заметок (SuperWhisper Custom Mode):
Ты переводишь устную речь в структурированную заметку для Obsidian.
Правила:
- Используй Markdown: заголовки ##, списки -, выделение **жирным**
- Убирай слова-паразиты (ну, вот, типа, как бы, в общем)
- Сохраняй смысл, но делай предложения короче
- Если я говорю "новый пункт" или "далее" -- начинай новый элемент списка
- Если я говорю "заголовок" -- создай ## заголовок из следующих слов
- Язык: русский, но технические термины оставляй на английском (Obsidian, markdown, vault, MCP)
Пример для идей и инсайтов:
Запиши мою мысль как атомарную заметку в стиле Zettelkasten.
Формат:
- Одна главная идея, сформулированная в одном предложении (заголовок)
- 2-3 абзаца раскрытия
- Секция "Связи:" -- предложи, с чем эта идея может быть связана
- Убери всё лишнее из речи, оставь суть
Добавь слова, которые модель часто распознаёт неправильно. Особенно важно для:
В SuperWhisper: Settings → Vocabulary. В Aqua Voice: Settings → Custom Dictionary.
Лучший подход -- не пытаться диктовать идеально. Диктуй сырой поток мыслей, потом дай AI привести в порядок:
Или используй Command Mode в Wispr Flow: выдели текст, скажи "перепиши как список" или "сократи до трёх предложений".
Потом попробуй SuperWhisper (15 бесплатных минут) или Wispr Flow (2 000 бесплатных слов/неделю) -- и почувствуй разницу с кастомным промптом.
💬 Промпт для LLM: Скопируй и вставь в Claude или ChatGPT:
Я хочу настроить голосовой ввод для ведения заметок в Obsidian. Мой стиль: [кратко опиши]. Я использую [Mac/Windows]. Мой бюджет: [сумма или "бесплатно"]. Помоги выбрать инструмент и написать системный промпт для диктовки заметок. Я часто использую термины: [перечисли 5-10 специфических слов из своей работы].
Устный и письменный языки различаются. Когда мы говорим голосом, мы используем определенную структуру предложений. Мы используем определенный синтаксис. По-другому выражаем свои мысли.
Когда мы печатаем, мы используем письменный язык. Исключение составляет общение в чатах. В чатах мы обычно печатаем на устном языке.
Лично я часть заметок диктую голосом. Но есть часть заметок, где мне важно напечатать текст на клавиатуре. Потому что в процессе печатания я лучше формулирую свои мысли.
У каждого из вас будет что-то похожее. Голосовой ввод очень полезен. Но не подходит для абсолютно всего.
Курс AI Obsidian — 3 недели, 9 встреч, максимум 20 человек
Записаться →