Конверсия вебсайта в серию книг?

Вопрос чайника - как конвертировать хороший и полезный веб сайт в книги?
На сайте много разделов, в каждом коллекция связанных HTML страниц.

Я сделал так:

1. Выкачал сайт с помошью WinHTTrack
2. Почистил HTML - это самое сложное
3. При помоши Calibre переконвертировал

Каждый шаг довольно сложный и муторный. Особенно конечно чистка HTML. Там и таблицы убирать, и динамические ссылки (со знаком вопроса) Calibre не ест и вообше...

Есть ли какие-то рекомендации?

Самое главное - потом НИКОГДА не заливать творчество Calibre в Либрусек!

Аватар пользователя Isais

Zadd написал:
Самое главное - потом НИКОГДА не заливать творчество Calibre в Либрусек!
ППКС!
Аватар пользователя Миррима

Isais написал:
Zadd написал:
Самое главное - потом НИКОГДА не заливать творчество Calibre в Либрусек!
ППКС!

+ много

Миррима написал:
Isais написал:
Zadd написал:
Самое главное - потом НИКОГДА не заливать творчество Calibre в Либрусек!
ППКС!

+ много
+65537! (факториал то бишь)

ozshots написал:
На сайте много разделов, в каждом коллекция связанных HTML страниц.
...
Есть ли какие-то рекомендации?

Коллекцию связанных HTML страниц можно, скажем, объединить Word’ом в один DOC, а потом каким-то проверенным конвертером (только не Calibre) этот DOC преобразовать в FB2. OOoFBTools, например, таблицы вполне переносит.

Ну и окончательная (ручная) доводка полученного FB2 в FB Editor. Без этого никак.

s_Sergius написал:
Коллекцию связанных HTML страниц можно, скажем, объединить Word’ом в один DOC, а потом каким-то проверенным конвертером (только не Calibre) этот DOC преобразовать в FB2. OOoFBTools, например, таблицы вполне переносит.

Ну и окончательная (ручная) доводка полученного FB2 в FB Editor. Без этого никак.

Это что же, вручную каждую страничку в Ворд копи-пастить? Хотелось бы автоматизировать процесс.

ozshots написал:
s_Sergius написал:
Коллекцию связанных HTML страниц можно, скажем, объединить Word’ом в один DOC, а потом каким-то проверенным конвертером (только не Calibre) этот DOC преобразовать в FB2. OOoFBTools, например, таблицы вполне переносит.

Ну и окончательная (ручная) доводка полученного FB2 в FB Editor. Без этого никак.

Это что же, вручную каждую страничку в Ворд копи-пастить? Хотелось бы автоматизировать процесс.

Я делаю так. Открываю в Word’e пустой файл, тыцкаю в опцию меню «Текст из файла...», выбираю из списка файлов нужные и нажимаю кнопочку «Вставить». Всё. Общий файл готов.

ozshots написал:
s_Sergius написал:
Ну и окончательная (ручная) доводка полученного FB2 в FB Editor. Без этого никак.

Это что же, вручную каждую страничку в Ворд копи-пастить? Хотелось бы автоматизировать процесс.
(неприлично ржёт) Попробуй автоматизировать процесс чтения. Чтобы не заливать книги, которые лично не читал.

http://www.web2fb2.net/ - попробуйте вот этот онлайн-сервис.
В строку закладываете адрес HTML-странцицы, на выходе получаете fb2.

justserge написал:
http://www.web2fb2.net/ - попробуйте вот этот онлайн-сервис.
В строку закладываете адрес HTML-странцицы, на выходе получаете fb2.

Боюсь, что в этом случае качество выходного файла не будет сильно отличаться от Calibre’вого.

s_Sergius написал:
justserge написал:
http://www.web2fb2.net/ - попробуйте вот этот онлайн-сервис.
В строку закладываете адрес HTML-странцицы, на выходе получаете fb2.

Боюсь, что в этом случае качество выходного файла не будет сильно отличаться от Calibre’вого.
Это очень сильно зависит от исходных HTML. Если простой, без новомодных изысков, чистый HTML, то превращает очень хорошо(в т.ч. и с картинками), только потом или до того нужно будет жанр и автора пргоставить и FBE скриптами пройтись не помешает. А вот если это, к примеру, Shtml, то фигвам!
Всё форматирование абзацев летит к чертям. А весь СИ как раз из SHTML построен, так что он сразу отпадает.
А вот Вики подходит.И "Мир фантастики" тоже можно, хотя и не нужно(при копипасте картинки более крупные)
А вообще, в любом случае после него править в FBE придется, потому как в HTML нет разбиения на главы, то и в результирующем FB2 не будет, придется скриптами искать болд и заменять в нужных местах на <title>

s_Sergius написал:
Боюсь, что в этом случае качество выходного файла не будет сильно отличаться от Calibre’вого.

Вот, вспомнил, присылали уже такие:
http://lib.rus.ec/b/177501
http://lib.rus.ec/b/177502
http://lib.rus.ec/b/177504
http://lib.rus.ec/b/177505
Это был результат конвертирования из TXT. Загоняется ВЕСЬ текст в один абзац.

Впрочем, это было давно.
Попробовал прямо сейчас. Лучше не стало. Задал адрес html-файла с СИ. Кроме шапки и подвала опять всё собирается в один абзац. Хреновато получается.

s_Sergius написал:
Попробовал прямо сейчас. Лучше не стало. Задал адрес html-файла с СИ. Кроме шапки и подвала опять всё собирается в один абзац. Хреновато получается.

См. предыдущий коммент
Zadd написал:
А вот если это, к примеру, Shtml, то фигвам!
Всё форматирование абзацев летит к чертям. А весь СИ как раз из SHTML построен, так что он сразу отпадает.

СИ как раз НЕ является HTML, так что он отпадает.

И я про то же.
Что http://www.web2fb2.net/, что Calibre — хрен редьки не слаще. Нет еще в природе хороших автоматических конвертеров для fb2.

Zadd написал:
s_Sergius написал:
Попробовал прямо сейчас. Лучше не стало. Задал адрес html-файла с СИ. Кроме шапки и подвала опять всё собирается в один абзац. Хреновато получается.

См. предыдущий коммент
Zadd написал:
А вот если это, к примеру, Shtml, то фигвам!
Всё форматирование абзацев летит к чертям. А весь СИ как раз из SHTML построен, так что он сразу отпадает.

СИ как раз НЕ является HTML, так что он отпадает.

подтверждаю - на СИ-подобных не работает, но, допустим, ПрозаРУ - даже с картинками конвертит

s_Sergius написал:
И я про то же.
Что http://www.web2fb2.net/, что Calibre — хрен редьки не слаще. Нет еще в природе хороших автоматических конвертеров для fb2.

Согласен. но всё легче, чем копипастить (если нужно страничек, например, 30-40)

Всем большое спасио за отзывы!

justserge написал:
http://www.web2fb2.net/ - попробуйте вот этот онлайн-сервис.
В строку закладываете адрес HTML-странцицы, на выходе получаете fb2.

Этот сервис не годится т.к. транслирует одиночную страничку, а мне нужно чтобы он по ссылкам ходил.
Забракованная всеми Calibre это делать умеет!

ozshots написал:
Этот сервис не годится т.к. транслирует одиночную страничку, а мне нужно чтобы он по ссылкам ходил.
Забракованная всеми Calibre это делать умеет!

Умеет — пользуйтесь.
Но потом таки FBE. Заполнение description и опять же ручная дообработка.

s_Sergius написал:
ozshots написал:
Этот сервис не годится т.к. транслирует одиночную страничку, а мне нужно чтобы он по ссылкам ходил.
Забракованная всеми Calibre это делать умеет!

Умеет — пользуйтесь.
Но потом таки FBE. Заполнение description и опять же ручная дообработка.

Каким образом http://www.web2fb2.net/ может следовать по ссылкам? У меня не получается.
Там надо какие-то опции надо выбрать?

Это я так невнятно выразился. Имелось в виду именно Calibre.
Если умеет, то и пользуйтесь. Но результат создания fb2 с помощью Calibre должен рассматриваться только как промежуточный.

ozshots написал:
Каким образом http://www.web2fb2.net/ может следовать по ссылкам? У меня не получается.
Там надо какие-то опции надо выбрать?
Умеет!
Напр. Как постепенно дошли люди до настоящей арифметики
Эту книгу делал с помощью(т.е. не полностью этим сервисом, но многие страницы вставлял скопом по несколько штук за раз, потом естественно, ещё пришлось дополнительно редактировать в FBE) указанного сервиса. Естественно, с доводкой. К сожалению, некоторые тогдашние правила валидации помешали сделать полностью адекватный файл(тогда невалидным считалось, если после рисунка строка продолжается дальше, да и CoolReader2 тоже этого не любит, сейчас, по новым правилам, такая конструкция валидна), ну и кое-какие спец.знаки(например титло(знак над буквой, обозначающий у древних славян(а также римлян),что эта буква на самом деле и не буква вовсе, а цифра)) тоже не знал, есть ли в ассортименте FB2, также пришлось дроби заменять рисунками дробей и т.д., всё-таки формат Фикшен-бук не предназначен для научных книг. Но в целом, именно данная прога со своей задачей склеить много интернет-страниц в одну книгу справилась зорошо, если не предъявлять к ней завышенных требований(т.е. не ждать от неё, что сразу получится годный файл). Вообще после любого, даже самого наилучшего конвертера, нужно править в редакторе FBE.

Лично моё мнение -- скачанный полезный сайт имеет смысл конвертировать в компилированное HTML-руководство (CHM). По крайней мере, мне не видится такой необходимости. Однако я допускаю, что такие сайты, которые стоит переделать в FictionBook, имеются. Не поделитесь ли ссылкой на такие? Интересно почитать.

Насчёт правки в редакторе -- согласен. (Пример: как-то раз скачал откуда-то "Золотого телёнка". Половина текста была размечена стихами: верный признак использования конвертора Any2FB.)

Staniclaw написал:
Лично моё мнение -- скачанный полезный сайт имеет смысл конвертировать в компилированное HTML-руководство (CHM). По крайней мере, мне не видится такой необходимости. Однако я допускаю, что такие сайты, которые стоит переделать в FictionBook, имеются. Не поделитесь ли ссылкой на такие? Интересно почитать.

Насчёт правки в редакторе -- согласен. (Пример: как-то раз скачал откуда-то "Золотого телёнка". Половина текста была размечена стихами: верный признак использования конвертора Any2FB.)

Сайт который мне захотелось перевести в ebook - это Азбука Веры - http://azbyka.ru

Там очень много разделов, из каждого вышла бы неплохая книга:
Например: Есть ли Бог? - http://azbyka.ru/vera_i_neverie/o_boge/
Зачем мы приходим в церковь? - http://azbyka.ru/tserkov/o_tserkvi/

Calibre сваяла вполне читаемый epub. Я понимаю что на либрусеке используется fb2

X