Skip to content

zettle-casters/obsidian-parser

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Obsidian Vault Processor

Инструмент для обработки Obsidian-хранилищ с иерархическим разделением документов.

Функционал

  • Загрузка документов из Obsidian vault с сохранением метаданных
  • Иерархическое разбиение текста по заголовкам (H1-H6) в древовидную структуру
  • Фильтрация по папкам - загрузка только нужных директорий
  • Анализ вики-ссылок - извлечение всех типов Obsidian-ссылок
  • Экспорт в JSON - структурированное сохранение результатов

Требования

Для установки зависимостей:

pip install -r requirements.txt

Пример использования

python parse.py --path "D:/Obsidian/vault" -o "data.json"

Выходные данные

Файл JSON содержит документы в формате:

[
  {
    "name": "filename.md",
    "path": "путь/к/файлу.md",
    "tags": ["tag1", "tag2"],
    "chunks": [
      {
        "data": "текст фрагмента",
        "links": [...]
      }
    ],
    "children": [
      {
        "title": "Заголовок",
        "level": 1,
        "chunks": [...],
        "children": [...]
        // иерархичная структура
      }
    ]
  }
]
  • chunks - текстовые фрагменты без заголовков
  • children - иерархическая структура блоков с заголовками
  • links - извлеченные Obsidian-ссылки с их атрибутами

Фильтрация

Гибкая фильтрация документов по путям:

include_paths=["/Notes", "/Projects"]    # Загружать только из этих папок
exclude_paths=["/Notes/Archive", "/Projects/Templates"]  # Исключить подпапки

Таким образом можно:

  • Загружать документы из папки /Notes, но исключить её подпапку /Notes/Archive
  • Включать всю папку /Projects, кроме шаблонов в /Projects/Templates
  • Комбинировать включение и исключение для точного контроля загружаемых документов

Пути указываются относительно корневой директории vault.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors