← Все записи releases macos open-source
HideMyData: нативный macOS-клиент на той же модели Privacy Filter
Сообщество выпустило Mac-приложение HideMyData: оно запускает модель openai/privacy-filter прямо на устройстве для маскирования PDF и изображений — та же модель, что и на нашем сайте, но нативно через MLX и Apple Vision.
Знакомое чувство: нужно отправить кому-то скриншот или PDF, и вы десять минут разглядываете документ в Просмотре в поисках имени, адреса электронной почты или номера счёта, который забыли замазать? Именно этот сценарий пытается убрать HideMyData.
Это нативное macOS-приложение от mkbula: версия v0.1.0 вышла 28 апреля. Что зацепило: оно использует ту же модель openai/privacy-filter, что и наш сайт — только нативно, через MLX-Swift, а OCR для PDF и изображений делает Apple Vision. Та же голова — другое тело.
Если вы пользовались Privacy Filter Online и мечтали, чтобы он смог пережевать стопку PDF без копипаста по страницам, теперь есть Mac-приложение, которое примерно это и делает. Локально. С открытым кодом. GPL-3.0. Делали не мы, но родство интересное и проект сделан с душой — стоит рассказать.
Что оно реально делает
Вы перетаскиваете PDF или картинку. HideMyData прогоняет файл через три слоя:
- Apple Vision OCR вытаскивает текст — в том числе из сканированных PDF и тех «битых» PDF, где встроенные шрифты не дают выделить текст (это отдельный уровень боли).
- Модель privacy-filter в MLX 8-битной квантизации делает тот же NER-инференс, что и у нас, но на Apple Neural Engine через единую память. Она ловит имена, e-mail, телефоны, адреса, даты и идентификаторы по контексту.
- Регулярки, поддерживаемые вручную, — на то, где контекст не помогает: IBAN, СНИЛС/ИНН, MAC-адреса, IPv4/v6, JWT, API-ключи, адреса крипто-кошельков. Регекс-слой ловит детерминированные штуки, чтобы модель занималась нечётким.
На выходе — черновик с прямоугольниками-маскировками. Их можно править: добавлять, удалять ложные срабатывания, двигать края. Два стиля маскировки: сплошной чёрный или матовое стекло. Размытие, честно говоря, выглядит сильно приличнее на скриншотах, которым нужно сохранить опрятный вид.
При сохранении маскировки запекаются в файл. Страницы растрируются и пересобираются — оригинальных глифов и текста в файле уже нет, они не просто закрыты сверху. Это важнее, чем кажется. Классическая ошибка PDF-маскирования — нарисовать чёрный прямоугольник поверх и отправить: текст под ним остаётся, его можно скопировать, и людей увольняют. HideMyData пересобирает страницу так, что под прямоугольником ничего восстановить уже нельзя.
Чем отличается от Privacy Filter Online
Мы хостим веб-версию. Та же модель, но через Transformers.js и WebGPU/WASM прямо во вкладке. Отличный вариант, когда у вас фрагмент текста или одна картинка и не хочется ничего ставить.
HideMyData удобнее, когда:
- У вас PDF, особенно многостраничные. Браузеры умеют их рендерить, но не маскировать с комфортом.
- Вы работаете со сканами, где качество OCR действительно важно — Apple Vision здесь правда силён.
- Вам не хочется каждый раз заново скачивать модель в кэш браузера, когда Chrome решает его очистить. Нативное приложение хранит модель в
~/Library/Application Support/HideMyData/. - Вам нужен сценарий «растрировать и пересобрать» при сохранении. Веб-версия размечает текстовые фрагменты для копирования, а PDF за вас не переписывает.
Та же идея, только нативно — с доступом к диску и GPU, который браузер дать не может.
Что любопытно в самой сборке
Несколько моментов, если вам интересно, как это сделано:
- MLX-Swift для инференса. На Apple Silicon MLX от Apple — правильный выбор: единая память избавляет от копирования между GPU и CPU, а 8-битная квантизация
openai/privacy-filterспокойно помещается в рабочей памяти. - OpenMedKit оборачивает загрузку модели. Это Swift-«клей», который превращает веса Hugging Face в нечто, что MLX готов проглотить.
- PDFKit + Vision + модель в одном конвейере. Каждый слой — нативный Apple: ни Python-сайдкара, ни Electron, ни раскручивающихся вентиляторов. Холодный старт быстрый.
Сборка ещё и обходит ловушку «умного авто-цензора, которому надо доверять». Перед сохранением есть ручной этап редактирования. Вы видите, что предложила модель, принимаете или меняете — и только потом всё фиксируется. Это правильное разделение труда для штуки, которая в случае ошибки утекает данные.
Ограничения
Это v0.1.0. Что важно знать:
- macOS 26 или новее, только Apple Silicon. На Intel-Mac бэкенд MLX не запустится.
- Пока без подписи разработчика. При первом запуске Gatekeeper заблокирует приложение. В README есть обходной путь:
xattr -rd com.apple.quarantine /Applications/HideMyData.app. - Первичная загрузка модели — около 1,5 ГБ. Учитывайте это, если сидите в гостиничном Wi-Fi.
- Лицензия GPL-3.0 — это важно, если думаете встраивать её куда-то коммерчески.
Открытый код на ранней стадии, как есть. Все нужные кирпичики на месте, демо-видео в репозитории выглядит чисто, но шероховатости будут — следите за issue-трекером.
Попробовать
- Репозиторий: github.com/mkbula/HideMyData
- Свежий релиз: v0.1.0
- Общая для проектов модель: openai/privacy-filter
Если вы соберёте что-то с этой же моделью на другой платформе — расскажите. Смысл открытой модели как раз в том, чтобы веб-инструмент, Mac-приложение и всё, что появится дальше, заходили на одну и ту же задачу с разных сторон.