→ كل المنشورات releases macos open-source

HideMyData: تطبيق macOS أصلي مبني على نفس نموذج Privacy Filter

تطبيق Mac من تطوير المجتمع باسم HideMyData يشغّل نموذج openai/privacy-filter على الجهاز لإخفاء البيانات في ملفات PDF والصور — نفس النموذج خلف هذا الموقع، لكن بشكل أصلي عبر MLX وApple Vision.

تعرف ذلك الشعور عندما تحتاج إلى مشاركة لقطة شاشة أو ملف PDF مع شخص ما، فتقضي عشر دقائق وأنت تدقّق في الملف داخل Preview بحثًا عن أي اسم أو بريد إلكتروني أو رقم حساب نسيت إخفاءه؟ هذا تحديدًا هو سير العمل الذي يحاول HideMyData إلغاءه.

التطبيق هو تطبيق macOS أصلي طوّره mkbula، وقد أُطلق الإصدار v0.1.0 في الثامن والعشرين من أبريل. ما لفت انتباهنا: إنه يشغّل نفس نموذج openai/privacy-filter الذي يدير هذا الموقع — لكن بشكل أصلي، عبر MLX-Swift، مع تكفّل Apple Vision بالتعرف الضوئي على الحروف في PDF والصور. الدماغ نفسه، الجسد مختلف.

لذلك إن كنت من مستخدمي Privacy Filter Online وتمنّيت لو يستطيع التهام كومة من ملفات PDF دون نسخ ولصق صفحة بصفحة، فهناك الآن تطبيق Mac يفعل شيئًا قريبًا من ذلك. محليًا. مفتوح المصدر. برخصة GPL-3.0. لم نبنِه نحن، لكن النسب مثير للاهتمام والمشروع جيد، ويستحق التغطية.

ماذا يفعل فعلًا

تُسقط فيه ملف PDF أو صورة. يمرر HideMyData الملف عبر ثلاث طبقات:

  1. Apple Vision OCR يستخرج النص — حتى من ملفات PDF الممسوحة ضوئيًا ومن تلك الملفات المعطوبة التي تمنع فيها الخطوط المضمّنة تحديد النص (وهي الأسوأ).
  2. نموذج privacy-filter بصيغة MLX 8-bit المكمَّمة يجري نفس نوع استدلال NER الذي نقوم به هنا، لكن على Apple Neural Engine عبر الذاكرة الموحَّدة. يلتقط الأسماء وعناوين البريد والهواتف والعناوين والتواريخ والمعرّفات حسب السياق.
  3. تعابير منتظمة (Regex) مصونة يدويًا لما لا يفيد فيه السياق: IBAN، أرقام الضمان الاجتماعي، عناوين MAC، IPv4/v6، JWT، مفاتيح API، عناوين محافظ العملات المشفّرة. تلتقط طبقة Regex العناصر الحتمية لكي يركّز النموذج على ما هو ضبابي.

تحصل على مسوّدة مستطيلات إخفاء يمكنك تعديلها — إضافة جديدة، حذف الإيجابيات الكاذبة، تعديل الحواف. هناك أسلوبان للإخفاء: أسود صلب أو ضبابية شبيهة بالزجاج المصنفر. صراحةً، الضبابية تبدو ألطف على لقطات الشاشة التي تريدها أن تظل احترافية.

عند الحفظ، يتم دمج الإخفاءات ضمن الملف. تُحوَّل الصفحات إلى نقاط ثم يُعاد بناؤها — تختفي الحروف والنص الأصلي من الملف، لا أنها مغطاة فحسب. هذا أهم مما يبدو. الخطأ التقليدي في إخفاء PDF هو رسم مستطيل أسود فوقه وإرساله: النص تحته لا يزال موجودًا، يمكن نسخه، والنتيجة فصل أناس من عملهم. أما HideMyData فيعيد بناء الصفحة بحيث لا يبقى شيء تحت المستطيل يمكن استرجاعه.

مقارنة بـ Privacy Filter Online

نحن نستضيف نسخة المتصفح. النموذج نفسه، لكنه يعمل عبر Transformers.js وWebGPU/WASM داخل تبويبك. هذه النسخة مناسبة جدًا حين يكون لديك مقطع نصي أو صورة واحدة لفحصها، ولا ترغب في تثبيت أي شيء.

‏HideMyData أنسب عندما:

  • لديك ملفات PDF، خاصة متعددة الصفحات. المتصفحات تستطيع عرضها لكنها لا تتعامل بسهولة مع إخفاء البيانات فيها.
  • تعمل مع مستندات ممسوحة ضوئيًا حيث تهمّ جودة OCR كثيرًا — وApple Vision قوي حقًا هنا.
  • تفضّل عدم إعادة تنزيل النموذج إلى ذاكرة المتصفح المؤقتة كلما قرّر Chrome مسحها. التطبيق الأصلي يحتفظ بالنموذج في ~/Library/Application Support/HideMyData/.
  • تحتاج إلى سلوك النقطنة وإعادة البناء عند الحفظ. النسخة الويب تحدد نطاقات نصية لتنسخها، لكنها لا تعيد كتابة ملف PDF نيابة عنك.

نفس الفكرة، لكن أصلية، مع وصول إلى القرص والـGPU لا يمكن للمتصفح توفيره.

ما هو لافت في طريقة البناء

بضع ملاحظات إن كنت مهتمًا بتفاصيل التنفيذ:

  • MLX-Swift للاستدلال. على Apple Silicon، MLX من Apple هو الخيار الصحيح — الذاكرة الموحدة تعني عدم الحاجة إلى نسخ بين GPU وCPU، والكمية 8-bit من openai/privacy-filter تتسع بسهولة في ذاكرة العمل.
  • OpenMedKit يغلّف عملية تحميل النموذج. هو الغراء البرمجي بـSwift الذي يحوّل أوزان Hugging Face إلى شكل يستهلكه MLX.
  • PDFKit + Vision + النموذج في خط أنابيب واحد. كل طبقة أصلية لـApple — لا عملية Python جانبية ولا Electron ولا مراوح تدور بشدّة. الإقلاع البارد سريع.

كذلك يتجنّب التطبيق فخّ “المخفي التلقائي الذكي الذي عليك أن تثق به”. هناك خطوة تحرير يدوي قبل الحفظ. ترى ما اقترحه النموذج، تقبل أو تعدّل، ثم يصبح الأمر دائمًا. هذا التقسيم الصحيح للأدوار في أداة قد تتسبب — إن أخطأت — في تسريب بيانات.

التحفّظات

إنه الإصدار v0.1.0. أمور يجب معرفتها:

  • macOS 26 أو أحدث، Apple Silicon فقط. الخلفية MLX لن تعمل على أجهزة Mac بمعالجات Intel.
  • غير موقّع بشهادة مطوّر بعد. سيمنع Gatekeeper التشغيل لأول مرة. ملف README يضم الحل البديل: xattr -rd com.apple.quarantine /Applications/HideMyData.app.
  • تنزيل النموذج لأول مرة بحدود 1.5 جيجابايت. خطّط لذلك إن كنت على شبكة فندق.
  • الترخيص GPL-3.0، وهو أمر مهم إن كنت تفكّر في تضمينه ضمن منتج تجاري.

مشروع مفتوح المصدر في طور مبكر، ببساطة. القطع كلها موجودة، وفيديو العرض في المستودع نظيف، لكن توقّع زوايا خشنة وراقب متعقّب المشكلات.

جرّبه

إن صنعت شيئًا بنفس النموذج على منصة أخرى، أخبرنا. جوهر النموذج المفتوح هو هذا تحديدًا: أداة المتصفح، تطبيق Mac، وما يأتي بعدهما، تستهدف المشكلة نفسها من زوايا مختلفة.