Экспорт статей Хабра в html, markdown
Url: https://habr.com/ru/post/665254
Author: Jessy_James
Date: 2022-05-11, 20:15
До меня было написано 4 статьи по экспорту статей с хабра в FB2 и pdf:
- Экспорт избранного Хабра в FB2
- Экспорт избранного Хабра в FB2 — скоростная PHP-версия
- Экспорт Хабра в FB2
- Экспорт Избранного на Хабре в PDF
Я захотел получить исходники своих статей. Поскольку для написания на хабре пользуюсь старым редактором и пишу в markdown, то и основная цель была получить исходник markdown. HTML пошел прицепом, т.к. статьи с хабра получаю в нем, а затем с помощью библиотеки markdownify и некоторых танцев с бубном получаю md.
Как пользоваться
Скрипт написан на python3, скачиваем с github, устанавливаем зависимости и запускаем:
|
|
Скачиваем статьи пользователя:
|
|
Скачиваем закладки пользователя:
|
|
Скачиваем одиночную статью:
|
|
Вместо jessy_james подставить имя нужного пользователя. Взять можно из ссылки профиля:
Вместо 665634 подставить id нужной статьи. Взять из ссылки на статью:
После запуска получаем такую картину:
|
|
Статьи скачиваются от последней написанной к первой. Нумерация будет в порядки написания или добавления в закладки.
Иерархия каталога будет такой:
Создается папка article, favorites или singles, далее папка с именем пользователя, далее папки с названиями статей. В папке со статьей будет два файла (.md и .html) и папка с картинками статьи.
Смотрим что получилось, берем содержимое полученного файла markdown и вставляем в редактор статей:
Почти работает как я хотел ;), есть некоторые проблемы с отображением изображений (исходник html отображает правильнее). Постараюсь их исправить.
Спасибо за внимание.