О создании OCR-слоя в дежавю. Вопрос знатокам
Опубликовано вс, 14/04/2013 - 00:19 пользователем sad369
Forums: Есть одна проблема с работой DjvuOCR, может кто-то знает решение?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
weis RE:Прошу переформатировать, распознать, etc... 3 дня
Океана RE:Подайте бедному копеечку на книжку с литреса... 13 часов larin RE:Заплатила, а абонемента нет и скачать ничего не могу! 1 неделя sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 неделя akorish RE:Регистрация 1 месяц Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 месяц Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 месяц konst1 RE:Ух, как я не люблю спамеров! 1 месяц tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 2 месяца konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 месяца fixel RE:Пропал абонемент 2 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 3 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 4 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 4 месяца Впечатления о книгах
Chernovol про Созонтов: История России в датах. 100 главных событий (История)
08 06 Пропущенные вехи истории: голодомор, ввод советских войск в Чехословакию. А советские войска не вошли, а напали на Польшу в 1939 г. Оценка: неплохо
Никос Костакис про Шиляев: Телохранитель Генсека. Том 7 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
08 06 о присвоении его к званию Героя Советского Союза" ____ Йа! Рузский йазыка есть очень трудное!
Barbud про Воронцов: Петербургский врач. Часть 1 [СИ] (Альтернативная история, Самиздат, сетевая литература)
08 06 Да что же такое, еще один попадун пенициллин на коленке варить собрался!) Впрочем, это же ИИшное творчество - нейросеть, наверное, просто выдернула из других, гораздо более одиозных опусов идею создания антибиотиков из подручных средств. Оценка: плохо
mysevra про Березин: Пентаграмма Осоавиахима [litres] (Альтернативная история, Современная проза, Городское фэнтези)
08 06 Как той собачке, ничего не светит, акцент выборочно-минорный. Но язык хорош, улыбнуло. Оценка: хорошо
mysevra про Мороз: Мгла [СИ] (Фэнтези, Самиздат, сетевая литература)
08 06 Сейчас много таких книг: золотая идея, оригинальная и интересная, а изложить человек не в состоянии – ни словарного запаса, ни фантазии, ни таланта плести словесные кружева или же просто изъясняться чётко и внятно. Таким надо ……… Оценка: неплохо
mysevra про Реньжина: Бабушка сказала сидеть тихо (Современная проза)
08 06 Эта книжка упоминалась в каком-то списке самых жутких историй, поэтому я и ждала чего-то запредельного и щекочущего воображение. А это просто женская проза, милая и грустная. Не люблю такое. Оценка: неплохо
xZiminxx про Воронцов: Петербургский врач. Часть 4 [СИ] (Альтернативная история, Самиздат, сетевая литература)
07 06 чем дальше тем хуже . это альтернативка или техническая литература? Оценка: нечитаемо
Lan2292 про Антонов: Портальщик. Частная практика [СИ] (Фэнтези, Попаданцы, Самиздат, сетевая литература)
07 06 Хорошая идея, но вот исполнение.... Не знаю, не стала дочитывать Оценка: неплохо
xZiminxx про Дорин: В небе 1941-го (Альтернативная история, Боевая фантастика, Самиздат, сетевая литература)
07 06 Автор в начале книги бред несет . В Украине бои ведутся 10-20 км до линии соприкосновения так что сбить его могли только в начале войны . да и героя могли дать за драмтеатор в Мариуполе 300-600 погибших Оценка: неплохо
irukan про Ланцов: Пробуждение (Альтернативная история, Социальная фантастика, Самиздат, сетевая литература)
05 06 Прочиталось на одном дыхании. Особенно концовка. Попаданец в последнего императора Византии. Можно ли что-то сделать, когда все сдались и всё вроде бы ясно? Оценка: отлично!
Isais про Перес-Реверте: Добрые люди [Hombres buenos ru] (Исторические приключения)
05 06 Век Просвещения... интриги и заговоры, плащи и шпаги, тайные общества и безродные авантюристы, маски и пасквили, философия везде, даже в будуаре, а эротика -- во дворцах, безбожные аббаты и знаменитые разбойники, роскошные ……… Оценка: плохо |
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
На этом сайте: http://djvu-soft.narod.ru/index.htm пробовали пошарится, вопросы позадавать?
На нём спецов по работе с форматом DjVu гораздо больше, чем здесь.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Судя по числу дежавю книг, появившихся здесь за последний год, здесь тоже книгоделов хватает. Но, разумеется я задал тот же вопрос на специализированном форуме у Ершова.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
занимаюсь дежавюками, но с таким не сталкивался и не заморачивался, поскольку встроенная в djvu express editor оцр от iris коряво понимает русский язык, а ежли через файнридер распознавать - нафига тогда джвю? :D сразу уж тогда в фб2
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Что-то у меня туго с объединением. Я использую сильно облегченную версию DEE, кажется, там нет этой функции. Если я правильно понял, то полная версия может объединить графику одного файла с текстовым слоем другого?
OCR от DEE использовать смысла нет. Проще заново весь файл через файнридер прогнать. Но проблема в том, что в файле №1 уже был спеллчек сделан перед сохранением в дежавю. Терять такую работу это не выход.
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Может поможет эта тема?
Отв: О создании OCR-слоя в дежавю. Вопрос знатокам
Совет господина Zadd
успешно сработал! Премного благодарен! Хотя немного муторно по одной странице косяки вычищать, но другого способа видимо нет. Правда распознавал "чистовую" версию с черно-белым текстом, а как повел бы себя DjvuOCR на этот раз не скажу. Обошелся файнридеровскими дежавюшками (несколько файлов по одной странице), которые прикрепил к итоговому файлу.
Небольшая поправка: раньше делали. Сейчас это уже моветон.
Upd. По здравому размышлению хочу добавить, что проблема разрешена лишь частично. Все же примерно 60 страниц (из 560) окажутся с новым, не таким качественно исправленным текстовыи слоем, каким он был после спеллчека Голмы1. Так что жалоба на работу djvuOCR остается в силе.