Голосовой ввод -- секретное оружие для заметок

Зачем это нужно

Ты думаешь быстрее, чем печатаешь. Средняя скорость набора текста -- 40-60 слов в минуту. Скорость речи -- 120-150 слов в минуту. Диктуя вместо набора, ты фиксируешь мысли в 3 раза быстрее.

Но скорость -- не главное. Главное -- снижение порога. Открыть Obsidian, создать заметку, начать печатать -- это три барьера. А нажать клавишу и начать говорить -- это один. Идея, пойманная на лету, стоит больше, чем идея, которую "потом запишу".

Помнишь сколько у тебя было идей "надо записать"? И где они теперь? ))

Голосовой ввод особенно полезен для:

Захват мыслей на ходу -- идея пришла в душе, на прогулке, в машине
Первые черновики -- не редактируй, пока говоришь. Просто вываливай мысли
Конспекты -- слушаешь подкаст или лекцию, диктуешь ключевые тезисы
Рефлексия -- проще говорить о том, что чувствуешь, чем печатать
Люди с RSI или усталостью рук -- долгая работа за клавиатурой утомляет

На курсе мы строим "второй мозг" в Obsidian. Голосовой ввод -- это самый быстрый путь из головы в хранилище.

Три лучших инструмента

Aqua Voice -- для максимальной точности

Лично я (Макс) использую его Вот кстати моя реферальная ссылка на бесплатный месяц: https://aquavoice.com/share?code=MP-4C3N

Облачный сервис, который видит контекст твоего экрана и адаптирует распознавание. Если ты диктуешь в Obsidian-заметку про Zettelkasten -- он это "видит" и точнее распознаёт специфические термины.

Как работает: устанавливаешь приложение, оно получает доступ к экрану через Accessibility API. Два режима -- мгновенный (нажал-сказал-отпустил, 450мс задержка) и потоковый (текст появляется в реальном времени).

Платформы: macOS, Windows. Мобильного приложения нет.

Цена:

Тариф	Цена	Что даёт
Free	$0	1 000 слов (одноразово, не в месяц)
Pro	$8-10/мес	Безлимит, 800 записей в словаре

Сильные стороны:

Deep Context -- видит, что на экране, и улучшает точность
Авто-форматирование -- убирает мусор из речи, добавляет пунктуацию, структурирует
49 языков, включая русский
Кастомный словарь (до 800 записей)
Кастомные инструкции -- опиши на естественном языке, как форматировать текст

Ограничения: только облако, нужен интернет. Бесплатный тариф -- по сути демо.

Установка: aquavoice.com/download

SuperWhisper -- для приватности и кастомизации

Я пользовался почти год, но переключился на Aqua Voice

Базовая транскрипция работает офлайн -- звук обрабатывается прямо на твоём компьютере через модели Whisper и Parakeet. Но "умные" режимы (форматирование, очистка текста через GPT/Claude) используют облако. То есть: распознавание речи -- локально, AI-обработка -- опционально в облаке.

Как работает: скачиваешь приложение, выбираешь размер AI-модели (от быстрой до максимально точной), назначаешь клавишу-триггер. Нажал -- говоришь -- отпустил -- текст появляется в активном окне. Работает в любом приложении, включая Obsidian.

Платформы: macOS, Windows, iOS, iPad.

Цена:

Тариф	Цена	Что даёт
Free	$0	15 минут записи, базовые модели
Pro	$10/мес или $85/год	Безлимит, все модели, кастомные режимы

Сильные стороны:

Транскрипция офлайн -- базовое распознавание работает без интернета (Apple Silicon лучше, Intel тоже поддерживается)
Кастомные режимы (Custom Modes) -- можно задать системный промпт для каждого типа задач (режимы с AI-обработкой требуют интернет)
Кастомный словарь -- добавь термины, которые модель часто распознаёт неправильно
100+ языков, включая русский
Автоопределение языка -- можно говорить по-русски и по-английски в одном потоке

Установка: superwhisper.com/download или App Store.

Wispr Flow -- для редактирования голосом

Я сам не пользовался, но многие хвалят

Не просто диктовка, а голосовое управление текстом. Выделяешь абзац, говоришь "перепиши короче" -- и он переписывает. Это Command Mode, и он меняет подход к работе с текстом.

Платформы: macOS, Windows, iOS, Android.

Цена:

Тариф	Цена	Что даёт
Free	$0	2 000 слов/неделю, словарь, 100+ языков
Pro	$15/мес	Безлимит, Command Mode, обучение стилю

Сильные стороны:

Command Mode (Pro) -- голосовые команды для редактирования текста
Обучается твоему стилю письма со временем
100+ языков, автоопределение переключений между языками
Бесплатный тариф щедрый -- 2 000 слов в неделю
Шёпот-режим -- для работы в тихих пространствах

Ограничения: только облако. Command Mode только в платной версии.

Установка: wisprflow.ai или App Store / Google Play.

Бесплатные варианты

Если не готов платить -- есть встроенные инструменты:

macOS Dictation (бесплатно)

Включить: System Settings → Keyboard → Dictation
Активировать: нажми Fn дважды (или назначь свою клавишу)
Офлайн: да, на Apple Silicon Mac
Русский: да
Работает в любом текстовом поле, включая Obsidian
Базовая пунктуация автоматически, голосовые команды: "new line", "period", "comma"

Windows Voice Typing (бесплатно)

Активировать: Win+H в любом текстовом поле
Русский: да
Автопунктуация, голосовые команды ("delete that", "select last sentence")
На Copilot+ ПК: "Fluid Dictation" с коррекцией грамматики

Whisper.cpp (бесплатно, open-source)

Локальный запуск модели OpenAI Whisper на своём компьютере
99 языков, включая русский
GUI-обёртки: VoiceInk (macOS, $39 или бесплатно из исходников), Handy (все платформы), OpenWhispr (все платформы)
Максимальная приватность -- всё локально

Какой выбрать

Ситуация	Рекомендация
Приватность важна, работаю офлайн	SuperWhisper
Хочу максимальную точность	Aqua Voice
Хочу редактировать текст голосом	Wispr Flow
Не хочу платить, Mac	macOS Dictation
Не хочу платить, Windows	Win+H Voice Typing
Не хочу платить, хочу кастомизацию	Whisper.cpp + GUI
Нужен мобильный ввод	Wispr Flow (iOS/Android) или SuperWhisper (iOS)

Для курса рекомендуем Aqua Voice или SuperWhisper Но если бюджет ограничен -- начни с macOS/Windows Dictation, это уже лучше, чем не диктовать вообще.

Настройка для максимальной пользы

Системный промпт (Custom Mode)

В SuperWhisper и Aqua Voice можно задать инструкции, как обрабатывать твою речь. Это кардинально меняет качество.

Пример для ежедневных заметок (SuperWhisper Custom Mode):

Ты переводишь устную речь в структурированную заметку для Obsidian.

Правила:
- Используй Markdown: заголовки ##, списки -, выделение **жирным**
- Убирай слова-паразиты (ну, вот, типа, как бы, в общем)
- Сохраняй смысл, но делай предложения короче
- Если я говорю "новый пункт" или "далее" -- начинай новый элемент списка
- Если я говорю "заголовок" -- создай ## заголовок из следующих слов
- Язык: русский, но технические термины оставляй на английском (Obsidian, markdown, vault, MCP)

Пример для идей и инсайтов:

Запиши мою мысль как атомарную заметку в стиле Zettelkasten.

Формат:
- Одна главная идея, сформулированная в одном предложении (заголовок)
- 2-3 абзаца раскрытия
- Секция "Связи:" -- предложи, с чем эта идея может быть связана
- Убери всё лишнее из речи, оставь суть

Кастомный словарь

Добавь слова, которые модель часто распознаёт неправильно. Особенно важно для:

Имена: коллеги, клиенты, бренды
Технические термины: Obsidian, Zettelkasten, PARA, wikilink, frontmatter, YAML, MCP, Claude Code
Аббревиатуры: AI, LLM, SPA, API
Твоя специфика: термины из твоей отрасли

В SuperWhisper: Settings → Vocabulary. В Aqua Voice: Settings → Custom Dictionary.

Советы для русско-английского микса

В SuperWhisper добавь в настройки языка подсказку на русском -- это улучшит автоопределение
Технические термины на английском распознаются лучше, если они есть в словаре
Wispr Flow лучше всех справляется с переключением языков внутри одного предложения
Если модель путает языки -- говори короткими фразами, по одному языку на фразу

Workflow: голос → текст → AI

Лучший подход -- не пытаться диктовать идеально. Диктуй сырой поток мыслей, потом дай AI привести в порядок:

Диктуй -- нажми горячую клавишу, говори свободно, не думай о структуре
Системный промпт делает 80% форматирования автоматически
Оставшиеся 20% -- вставь текст в Claude с промптом: "Приведи в порядок эту надиктованную заметку, сохрани смысл, добавь markdown-разметку"

Или используй Command Mode в Wispr Flow: выдели текст, скажи "перепиши как список" или "сократи до трёх предложений".

Попробуй прямо сейчас

Если у тебя Mac -- нажми Fn дважды прямо в Obsidian и скажи три предложения о том, над чем ты сейчас работаешь
Если Windows -- нажми Win+H и сделай то же самое
Посмотри, что получилось. Даже базовая встроенная диктовка -- это уже быстрее набора

Потом попробуй SuperWhisper (15 бесплатных минут) или Wispr Flow (2 000 бесплатных слов/неделю) -- и почувствуй разницу с кастомным промптом.

💬 Промпт для LLM: Скопируй и вставь в Claude или ChatGPT:

Я хочу настроить голосовой ввод для ведения заметок в Obsidian. Мой стиль: [кратко опиши]. Я использую [Mac/Windows]. Мой бюджет: [сумма или "бесплатно"]. Помоги выбрать инструмент и написать системный промпт для диктовки заметок. Я часто использую термины: [перечисли 5-10 специфических слов из своей работы].

Примечание

Устный и письменный языки различаются. Когда мы говорим голосом, мы используем определенную структуру предложений. Мы используем определенный синтаксис. По-другому выражаем свои мысли.

Когда мы печатаем, мы используем письменный язык. Исключение составляет общение в чатах. В чатах мы обычно печатаем на устном языке.

Лично я часть заметок диктую голосом. Но есть часть заметок, где мне важно напечатать текст на клавиатуре. Потому что в процессе печатания я лучше формулирую свои мысли.

У каждого из вас будет что-то похожее. Голосовой ввод очень полезен. Но не подходит для абсолютно всего.

Курс AI Obsidian — 3 недели, 9 встреч, максимум 20 человек

Записаться →