Вы здесьКак правильно отсканировать?
Опубликовано сб, 14/03/2009 - 12:36 пользователем thirteen
Есть сканер, есть Файнридер, есть книга, которую хочу выложить, точно знаю, что в сети её нет. Посоветуйте правильные настройки при сканировании (разрешение, цвет...) и в каком формате лучше сохранять? Я пытался в ПДФ, но он даже при скромных размерах книги получается почти 60 мег. Что я делаю не так?
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Океана RE:Подайте бедному копеечку на книжку с литреса... 17 часов
sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 неделя sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 2 недели sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 2 недели larin RE:Пропал абонемент 1 месяц Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 1 месяц sem14 RE:Серия "Символы времени" издательства "Аграф" 1 месяц Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц tvv RE:faq brainstorm =) 1 месяц Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 1 месяц Larisa_F RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя larin RE:абонемент не обновлен 1 месяц sem14 RE:За иллюминатором (серия) - чего не хватает? 2 месяца sem14 RE:Собираем серию: "Мастер серия", издательство "Лимбус". 2 месяца Larisa_F RE:Книжная серия «Сlio» издательства "Евразия" 2 месяца tvv RE:DNS 2 месяца MrMansur RE:<НРЗБ> 2 месяца Stager RE:Беженцы с Флибусты 2 месяца Впечатления о книгах
Darja68 про Маринина: Посох двуликого Януса (Детективы: прочее)
14 03 Господи, какая немыслимая чушь. Это ж надо так. (( Стерла из читалки. А какой была хорошей детективщицей!
udrees про Володин: Газлайтер. Том 10 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
14 03 Достаточно рядовое продолжение серии, читается увлекательно, если не обращать внимания на примитивные описания и несерьезные разговоры. Школа у героя закончилась, но школа в его голове осталась. Сам он так же крут, всех врагов ………
udrees про Володин: Газлайтер. Том 9 [СИ] (Альтернативная история, Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
14 03 Для любителей серии и кого устраивают такие «взрослые сказки». Главный герой все так же крут, что спокойно побеждает даже своих учителей в Академии. Ну и кстати наконец-то заканчивает свою школу. Проблемную тему с любовным ……… Оценка: неплохо
udrees про Вальтер: Браконьер 2 (Боевая фантастика, Приключения: прочее, Постапокалипсис, Самиздат, сетевая литература)
14 03 Автору понравилась своя вселенная про вампиров, что параллельная история приключений еще одного героя тоже не стала лишней. В принципе сюжет 1 и 2 книг похожи на сюжет из аналогичной серии Морзе. Герой все такой же быстро ……… Оценка: хорошо
Олег Макаров. про Повар
14 03 Отлично же. Какой-то Макс Фрай прямо даже местами. И написано хорошо, и герои объёмные, и авторы почти не переигрывают
Stager про Валин: Развод по-шпионски (Героическая фантастика, Фэнтези)
13 03 Я наконец понял, что меня раздражает в последних книгах автора. В самом начале в произведениях были как бы положительные герои. Ну, умные, добрые, честные... В конце - всё по культурному, по-европейски: все одинаковое ……… Оценка: неплохо
Олег Макаров. про Бывает и хуже?
12 03 Как будто дубль книги “Двадцать два несчастья” авторов Д.Сугралинов, А. Фонд Ну прямо очень похоже, и написано так же неуклюже. И ту я тоже не дочитал, бросил
Sello про Кавабата: Тысячекрылый журавль (Современная проза)
11 03 Очень многоплановое произведение, в котором, как это свойственно вообще японской литературе, через пунктирное вырисовывание характеров героев, противопоставляются красота и уродство, красота живая, полная переживаний (Оота ……… Оценка: отлично!
nik_ol про Донцова: Зеркало бедного зайца (Иронический детектив, Детективы: прочее)
11 03 Да когда же вы новое выложите уже, а, ребятки?... Оценка: хорошо
Oleg68 про Зоран Чирич
11 03 Книга сильно изобилует ненормативной лексикой. если ее убрать , то получится неплохая криминальная драма
Isais про Голотвина: Домашний учитель для чудовища [СИ] (Боевая фантастика, Социальная фантастика, Самиздат, сетевая литература)
08 03 «Домашний учитель для чудовища» — то же, что и «Педагогическая баллада» этих же авторов, сюжет и фабула совпадают. Но за счет добавления деталей, их переакцентировки, более прописанного социального фона именно этот вариант ……… Оценка: хорошо
Barbud про Смолин: Ван Ван из Чайны 4 (Социальная фантастика, Попаданцы, Самиздат, сетевая литература)
08 03 Первые три части были более-менее читабельны, на четвертой я сломался. Смрадным потоком попёрло политиканство, рассуждения о патриотизме, охаивание тех, кто не разделяет идеи этого самого китайского патриотизма и т.д. Читать дальше не вижу смысла. Оценка: нечитаемо |
Комментарии
Отв: Как правильно отсканировать?
Тут кт-то писал про сканирование фотоаппаротом.
Вот несколько мыслей из моего опыта.
Требования к фотоаппарату
Сразу и бесповоротно – мыльницы не подойдут.
За редким исключением. Например такие как некоторые модели Canon
В фотоаппарате должны быть.
1. Минимум – 6 Мпиксел, Оптимально – 8 Мпиксел Идеал – 12 и более Мпиксел.
2. Обязательным условием является наличие оптического (не электронного!) стабилизатора ихображения
3. Желательно наличие дистанционного пульта управления.
4 Из обязательных условий – наличие ручной настройки и фокусировки. Автоматика исключается...
Для сканирования фотоаппаратом нужно собрать установку. Основой лучше всего является штативная стойка фотоувеличителя.
Но главное внимание нужно уделить освещению. Вспышка – исключена. Сканируемый текст должен быть освещён с обеих сторон ярким рассеянным светом.
Преимущества фотоаппарата огромны.
Во-первых, можно сканировать разворот, превышающий стандартный для многих сканеров формат A4.
Во – вторых появляется возможность уже в процессе сканирования убрать лишний мусор. То есть перекрывать кусками белой бумаги нумерацию страниц, колонтитулы и прочее...
Есть ещё много мелких преимуществ, но это главные.
Отв: Как правильно отсканировать?
Все, вроде, так и есть, как написано. У меня как раз есть опыт работы "мыльницей", подтверждаю, что результаты не очень :(. И, следовательно, нужно оставить даже мысль о том (как думают некоторые), что сканировать фотоаппаратом - дешевле, легче и т.п. Один хороший штатив чего стоит, освещение, и прочее. Для рабочего места не полметра на столе, а куда больше требуется. Сложности большие, по сравнению со сканером в $50 (не идеал, конечно, но позволяет получить результат куда качественнее, чем обычная камера в $100). Преимущества совсем в другом!
Отв: Как правильно отсканировать?
Согласно данным требованиям, яндекс-маркет выдает следующее:
http://market.yandex.ru/guru.xml?CMD=-RR=9,0,0,0-PF=4390456%2BGT%2Bsel%2B8-PF=15504541%2BTR%2Bsel%2Bselect-VIS=1F2-CAT_ID=100514-EXF=1-EXC=1-PG=10&hid=91148&filter=&num=&greed_mode=false
Ценник от 16 тыс. рублей за Sony Alpha DSLR-A100 Kit и выше.
Добавим к стоимости еще пару тысяч рублей минимум на установку со светом.
И вычеркнем из жизни пару-тройку квадратных метров площади квартиры. (У меня собрана такая штука, так что я в курсе, о чем говорю).
Согласен. Помимо скорости съемки - пока это единственное преимущество, которое я вижу.
На сканере это еще проще и быстрее )) Но не на всех книгах это реально сделать из-за бездарной верстки.
Но для книг давно есть книжные сканеры типа Plustek OpticBook 3600
http://market.yandex.ru/model.xml?hid=91112&modelid=858007
http://www.document-scan.ru/descr99.htm
Ценник - те же 15-16 тыщ, скорость скана высокая - только успевай листать, спец софт, спец конструкция сканера, высочайшее качество сканов, места занимает гораздо меньше фото-установки, в эксплуатации дешевле.
Отв: Как правильно отсканировать?
Распозновать надо, без сохранения структуры документа. То есть без колонок, картинок и всяких прочих ненужностей. Но всё равно, при передаче в Word, страницы не стыкуются. Странно, что Finerider не обрабатывает страницы как целое. Они сохраняются, каждая в отдельном разделе.
Чтобы соединить текст в одно целое, вроде бы достаточно убрать все разрывы раздела. Да не тут то было... В случае качественного оригинала три ситуации:
1. При стыковке должен получится новый абзац
2. При стыковке должна склеится строка
3. При стыковке должна склеится строка с удалением знака переноса, если слово в тексте переносится на следующую страницу.
При некачественном оригинале, нужно провести предварительную обработку, заключающуюся в удалении всех пробелов до знака конца абзаца. В принципе, это не помешает в любом случае.
Алгоритм склейки такой...
1. Ищется разрыв раздела
2. Анализируется стык на один из трёх вышеупомянутых случаев
3. Производится стыковка
4. Переход к другому разрыву.
В простейшем случае это реализуется четырьмя макросами.
Их вызов осуществляется кнопками выведенными на панель инструментов.
Первый макрос просто ищет первый разрыв раздела.
Анализ проводит человек и выбирает один из трёх других макросов, в зависимости от ситуации.
В принципе это можно автоматизировать, написав простейший анализатор, но в любом случае – автоматика может дать сбои. И поэтому лучше, если место стыка окрасить каким-нибудь цветом, для последующего контроля.
Вот 4 макроса, для полуавтоматической обработки.
Sub Разрыв_раздела_Поиск()
'
' Разрыв_раздела_Поиск Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Новая_строка()
'
' Новая_строка Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeParagraph
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Соединение_строк()
'
' Соединение_строк Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeText Text:=" "
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Sub Удаление_переноса()
'
' Удаление_переноса Макрос
' Макрос записан 03.03.2009 Kitten
'
Selection.Delete Unit:=wdCharacter, Count:=1
Selection.TypeBackspace
Selection.Find.ClearFormatting
With Selection.Find
.Text = "^p^b"
.Replacement.Text = ""
.Forward = True
.Wrap = wdFindContinue
.Format = False
.MatchCase = False
.MatchWholeWord = False
.MatchWildcards = False
.MatchSoundsLike = False
.MatchAllWordForms = False
End With
Selection.Find.Execute
End Sub
Но это не всё... есть ведь ещё и колонки....
Отв: Как правильно отсканировать?
Я тут начал для затравки про макросы писать.
Пробовал кто-нибудь?
Продолжать дальше или нет?
Отв: Как правильно отсканировать?
А Вы не хотите написать все, чем можете поделиться и, выложив на Либрусеке, дать ссылку? Смотреть лучше все в комплекте, а не выискивать по кусочкам. Пригодится это обязательно - на самом деле довольно много людей, даже зная как, не умеют это объяснить другим. Туда же и макросы напишите. Это очень, leoparrd, полезное дело Вы придумали.
Отв: Как правильно отсканировать?
Не устану повторять:
НЕ НАДО djvu!!!!!
Djvu - могила для текста.
Делайте PDF. Кого анноит размер - делайте правильно.
И ещё - не надо фотоаппаратов... Тем более - "простеньких". Сделать приемлемый скан фотоаппаратом - достаточно нетривиальная задача. И решить её - не проще, чем добыть нормальный сканер.
А 200 страниц - на любом сканере несложно.
Отв: Как правильно отсканировать?
Обоснуй ))
Распознавал с правильно сделанных дежавю неоднократно - иногда качество распознанного лучше, чем я сам сканером получаю.
Криво сделанный pdf не лучше криво сделанного дежавю. Плюс размер нехилый.
Отв: Как правильно отсканировать?
Скажите пожалуйста, а почему могила-то? Мне приходилось окрить с ДежаВю с прекрасными результатами распознавания, почти без ошибок. Или Вы о чем-то другом пишете?
Отв: Как правильно отсканировать?
Аналогично.
Страницы