Вы здесьОбновление скрипта "Поиск по набору регэкспов" для FBE - тестируем!
Опубликовано пт, 06/09/2019 - 04:13 пользователем TaKir
Дошли руки существенно дополнить, обновить, почистить и структурировать по смыслу скрипт "Поиск по набору регэкспов" для Fiction Book Editor (FBE). Автор этого скрипта (как и многих других скриптов для FBE) - Sclex, за что ему отдельное гран мерси. Наполнение скрипта мое, Sclex-а + учтены все возможные пожелания книгоделов из двух старых здешних тем: Типичные ошибки распознавания... Пользоваться и тестировать могут все желающие, отзывы, примеры, предложения по улучшению категорически приветствуются. Просьба приводить конкретные примеры: - ошибок скрипта, ложных срабатываний Очень приветствуется помощь тех, кто хорошо знаком с регулярными выражениями для дальнейшего совершенствования скрипта. Ссылка на последнюю версию скрипта (30-09-2019): альтернативные ссылки: Заменить этим файлом имеющийся файл (или положить новый вариант скрипта рядом) в папке: Скрипту удобнее назначить горячую клавишу F2 (меню: Сервис-Настройки-Клавиши-Скрипты-Поиск по набору регэкспов). Перед запуском данного скрипта лучше обработать текст скриптами "Генеральная уборка", "Латиница в кириллице" По мере накопления отзывов о работе скрипта, планирую периодически пополнять скрипт и выкладывать обновленную версию. P.S. На Флибусте открыта аналогичная тема, можно писать в любую.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
sem14 RE:Подайте бедному копеечку на книжку с литреса... 1 день
nehug@cheaphub.net RE:Кнопка ЧИТАТЬ 1 день Darkenlightener RE:Как стать гениальным художником, не имея ни капли таланта 2 дня s_Sergius RE:Ух, как я не люблю спамеров! 2 дня alexk RE:Опять кончился сертификат 5 дней Саша из Киева RE:Последняя тайна 1 неделя nehug@cheaphub.net RE:Багрепорт - 2 1 неделя Sinekura1204 RE:Анкета 2 недели tvv RE:Не скачиваются книги! 2 недели Моржехрен RE:Анна Радклиф - Итальянец 2 недели Кирка3105 RE:Книга Мари Лоуренс «Реванш империй» 2020 2 недели sveik74 RE:Правила пользования библиотекой Либрусек 2 недели larin RE:Загрузка книг 2 недели Zadd RE:Роскомнадзор 3 недели Paul von Sokolovski RE:Всех с Новым Годом!!!!!!!!! 3 недели chas RE:С Новым Годом! С новым глюком :) 3 недели alexgor1 RE:список книг, сделанных для Либрусека 1 месяц Lasyavati RE:Хождения 1 месяц Впечатления о книгах
Amir про Вишневский: Пест-серебрушка [litres] (Боевая фантастика, Фэнтези)
26 01 Уфф, реально мое мнение-отличная серия, послевкусие как после прочтения Ведьмака, давно такого удовольствия не получал от чтения, молодец автор
decim про Жаринов: Империя Круппов. Нация и сталь (История)
26 01 См. книгу: Уильям Манчестер. "Стальная империя Круппов. История легендарной оружейной династии", Центрполиграф, 2003 г. Оригинал: The arms of Krupp, 1587-1968, Boston, Little, Brown [1968] Первое издание на русском: ………
mysevra про Шеффилд: Летний прилив [Summertide ru] (Космическая фантастика)
26 01 Очень необычно и не скучно. Событий много, и развиваются они быстро. И сплошные загадки, просто шкатулка с ништяками. Нестандартные персонажи. Обязательно буду читать вторую часть. Оценка: отлично!
Lena Stol про Шарапов: Брошенная колония [litres] (Фэнтези)
25 01 Читала до середины с интересом, потом понемногу интерес стал угасать, к концу просто перелистывала страницы.
ippolit20132 про Искажающие реальность
25 01 Хорошая серия, мне понравилось, да и концовка как бы есть.. Хорошо.
Никос Костакис про Валериев: Отряд [СИ] (Альтернативная история, Самиздат, сетевая литература)
25 01 «Всё интереснее становиться с этим шпионом, и всё больше вопросов появляется» Если "становитЬся", тогда почему не "появляетЬся"?
Studentomori про Поселягин: Охота (Фэнтези, Самиздат, сетевая литература)
25 01 (4/5) На фоне последних книг автора эта выделяется. Нет, главный герой не обрел моральных принципов, такой же идейный клептоман и шовинистический урод, но здесь автор сам признаётся что ему интересно писать именно о становлении ……… Оценка: хорошо
скунс про Муравьев: Тайная жизнь города (Фэнтези, Самиздат, сетевая литература)
25 01 Автор подкидывает ГГ еще роялей , но читать интересно))) Оценка: хорошо
Vasyan2000 про Машковцев: Время красного дракона (Альтернативная история)
25 01 Обожаю ублюдочные перестроечные помои. Такая незамутненная хрень. Оценка: нечитаемо
Nicout про Лебедев: Вингер. Начало (Альтернативная история, Самиздат, сетевая литература)
25 01 Шаблонно, безграмотно, уныло, суконный язык, сюжет отсутствует. Текст в стиле акынов: степь едем - степь поём, горы едем - горы поём. Короче - читать не советую, скучища. Автору лучше заняться чем-нибудь другим, не писательством, ……… Оценка: плохо
Sanyok89 про Кафка: Процесс [Восстановленный по рукописям] [Der Prozess ru] (Классическая проза)
25 01 «Замок» намного лучше, как мне кажется, но это тоже ничего. Кафка есть Кафка... Оценка: хорошо
Yuriko про Мазуров: Тени некрополя (СИ, неоконченная) (Боевая фантастика)
25 01 Ну и какого ты её залил, если она неокончена? |
Комментарии
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
В FBE есть проверка по словарю. "Орфография" F7 тыц. У поиска по набору регэкспов другая задача.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Не буду спорить. Свою задачу я вижу в том, чтобы набрать статистику. Что из нее учитывать, а что не учитывать, думаю должны решать разработчики.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Идеальный скрипт в любом случае не сделать.
Писалось выше - улучшить бы "Генеральную уборку".
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Пока не вижу примеров для доработки скрипта, кроме прилипшего многоточия и удаления пробела перед маркером сноски.
Какие улучшения нужны?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
А апостроф?
...предусмотреть замену всех возможных различных вариаций апострофов - ´ ʼ ′ ˙ ΄ - на ' (буква «э» на англ. раскладке), который U+0027.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, вы, вообще, в курсе, что пробел и нижнее подчеркивание, это разные символы?
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Прошу прощения, но не совсем понял, в связи с чем возник этот вопрос? Если ответить коротко - да, в курсе, но, по-моему, про нижнее подчеркивание я ничего не писал? И на его проверку не жаловался. Может, конечно, что-то запамятовал, уточните, если не сложно, почему вы меня об этом спрашиваете.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
V_E, потому что во многих ваших книгах, загруженных сюда, в названии книги вместо пробелов стоят нижние подчеркивания.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Можно попросить ссылку? И уточните, о чем идет речь: о названии книги (печатное издание) или имени файла? Нижнее подчеркивание использую в имени файла. Это давняя привычка, обусловленная определенными причинами. А вот в названии книги - что-то за собой такого не помню. Если дадите ссылку, проверю по своим оригиналам. Может быть, это какая-то ошибка, тем более, что она есть "во многих файлах". Надо посмотреть, что это такое.
RE:Обновление скрипта "Поиск по набору регэкспов" для FBE -...
Теперь еще по поводу работы скрипта, столкнулся с моментами, вызвавшими легкое удивление:
скрипт иногда обнаруживает, а иногда пропускает полужирное начертание отдельной буквы предлог "и", местоимение "я". Удивило, что иногда полужирное начертание обнаруживается, а иногда нет. Может, конечно, он реагирует на что-то иное, совпадающее с полужирным начертанием.
Также пропускает сочетание ., (точка и запятая). Также пропускает слово нащ (должно быть - наш). Но это, видимо, тоже относится к орфографическим ошибкам, которые скрипт не проверяет?
Добавлено позже:
Обрабатывал скриптом книгу, в которой при распознавании был пропущены все дефисы в словах типа как-то, кто-то кто-либо, когда-либо и т.д. Заметил, что скрипт пропускает словосочетание дватри (два-три); и тотмто (том-то в выражении "в том-то и дело")
Страницы