Вы здесьПроверка валидности fb2-файла при загрузке ???
Опубликовано ср, 27/08/2008 - 05:42 пользователем Ghost mail
Forums: Сложно ли добавить автоматическую проверку валидности книг перед их загрузкой на сайт и "не пропускать" невалидные файлы ???
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 2 дня
tvv RE:DNS 5 дней sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 6 дней sem14 RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 неделя sem14 RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 неделя larin RE:Заблокирован 2 недели alexk RE:Прошу переформатировать, распознать, etc... 2 недели konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 4 недели Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 1 месяц fixel RE:Пропал абонемент 1 месяц sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 1 месяц sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 1 месяц Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 2 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 2 месяца tvv RE:faq brainstorm =) 2 месяца Larisa_F RE:Серия "Что есть что" издательства "Слово"(чего не хватает) 2 месяца larin RE:абонемент не обновлен 3 месяца sem14 RE:За иллюминатором (серия) - чего не хватает? 3 месяца Впечатления о книгах
udrees про Мансуров: Восемнадцатое царство [СИ] (Боевик, Самиздат, сетевая литература)
17 04 Не очень большая книга в стиле Стивена Кинга – забрались мальчишки на какой-то заброшенный секретный объект. Ну и нашли на свою задницу приключений. В целом написано, скажу, неплохо, грамотно, кому-то покажется стиль простым, ……… Оценка: неплохо
udrees про Мансуров: Жёсткий отбор (Боевая фантастика, Социальная фантастика, Эротика, Приключения: прочее, Самиздат, сетевая литература)
17 04 Книга слабее чем многие другие произведения автора, хотя сюжет немного похож на «Адонис» и еще другие книги. Вообще напоминает компьютерную игру, герой просыпается в зале с оружием и противниками. В процессе обзаводится товарищами ……… Оценка: неплохо
udrees про Вальтер: Браконьер 5 (Боевая фантастика, Приключения: прочее, Постапокалипсис, Самиздат, сетевая литература)
17 04 Отличное продолжение. Начинается с того места, как герой потерял свою девушку. Правда мир уже изменился и вампиры с людьми стали жить дружно. Но это конечно видимая часть. Герой это сразу просек и погрузился в недра интриг. ……… Оценка: хорошо
udrees про Вальтер: Браконьер 4 (Боевая фантастика, Приключения: прочее, Постапокалипсис, Самиздат, сетевая литература)
17 04 Хорошо написанное продолжение. Главный герой все также угрюм, грязен, упорен и непредсказуем. Отряд уже не дуэт, а трио, но действует все также эффективно. История героя переплетается с Жаждой, серией про Морзе. Диалоги нормальные, ……… Оценка: хорошо
udrees про Атаманов: Полигон [litres] (Боевая фантастика)
17 04 Если не воспринимать серьезно, то читается очень даже неплохо. Если бы вместо школьниц были взрослые, то история могла бы прокатить. Но и так книга написана неплохо, пускай и идеалистично про выживание в постапокалипсисе. ……… Оценка: неплохо
udrees про Иноземцев: Несовременная страна. Россия в мире XXI века (Публицистика)
17 04 Правильная книга про современную Россию и сложившееся в ней в настоящее время положение, плюс даны исторические оценки того, почему так всегда получалось и что нас ждет. Считаю, что в целом верно приведены факты, насчет положения ……… Оценка: неплохо
Sello про Дрент: Вагина. История заблуждений (Культурология, Документальная литература, Эротика, Секс)
17 04 В общем-то интересное сплетение медицины, истории, удивительных фактов, сексологии, странных случаев, этики, социологии и даже литературы. Юмора как такового не заметил. Внимание обратил на следующее. Буквально на днях, уже ……… Оценка: неплохо
xZiminxx про Валериев: Пионер. Книга 1 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
17 04 автор успел пару раз лизнуть жопу путина Оценка: нечитаемо
Nicout про Валериев: Пионер. Книга 1 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
15 04 Очередная унылая, бездарная и безграмотная графомань, безуспешная попытка подрочить на сдохший совок, да еще и суконным языком. Фу, КГ/АМ! Оценка: нечитаемо
ejik.v про Гилмор: Книжный магазин «Булочка с корицей» (Современные любовные романы)
14 04 Незатейливый сюжет. Особых восторгов не вызывает, но неплохо читается, чтобы отвлечься от проблем и пасмурной погоды. Оценка 4
Олег Макаров. про Таксист
13 04 К сожалению, бросил на 33% второй книги. Чем дальше, тем более нудно, с постоянными повторами, периодической потерей логики. Идея отличная. Но реализацию её автор не вытянул.
francuzik про Москаленко: Маг. Книга 1 [СИ] (Фэнтези, Боевик, Самиздат, сетевая литература)
12 04 Не советую. Полный отстой. До этого автор писал более менее на троечку. Тут же не знаю что и думать. Может случилось что? Оценка: нечитаемо |
Отв: Проверка валидности fb2-файла при загрузке.
Сложно ли вам, Ghost mail, указать в своем сообщении утилиту для "проверки валидности" fb2, которую вы предлагаете ???
Отв: Проверка валидности fb2-файла при загрузке.
Однако, эти редакторы-утилиты для работы с командной строки, а нужна проверка на php, которая бы работала на веб-сервере перед загрузкой файла книги.
В-действительности, прежде всего этот вопрос нужно решить "политически" - нужно или не нужно 8-)
Мое личное мнение,- нужно. Лучше пусть будет немного меньше книг, но они будут "качественнее" (будут соответствовать стандарту FB2)
Отв: Проверка валидности fb2-файла при загрузке.
Предлагаете "прикрутить" FBE? Или fb2fix? :)
Идеально "валидных" fb2-файлов на сегодня не существует, как и программы, которая бы это определяла - и все благодаря "стандарту FB2". За работой скриптов приходится убирать вручную, валидность книги - определять "на глазок".
От "политического" решения ничего не изменится - кроме громких фраз: программа не появится, вычитка файлов не улучшится. Кроме того, найдя незакрытый тег в fb2-книге - гораздо легче его закрыть, чем брезгливо отбросить этот файл и отсканировать книгу по-новой.
Отв: Проверка валидности fb2-файла при загрузке ???
И файл может быть невалидным, но содержать полный текст, и другого в библиотеке может не быть. Невалидность мы поправим.
Отв: Проверка валидности fb2-файла при загрузке ???
Не пропускать невалидные файлы - это вряд ли реально нужно, а вот некая пометка, позволяющая невалидников обнаружить - не помешала бы.
Отв: Проверка валидности fb2-файла при загрузке ???
А кто-нибудь более-менее формально описать процедуру валидации может?
Разобрать XML, проверить возможность тэгов и словарно-кодируемых полей?
Всё?
Если всё, я в свой скрипт могу это добавить (XML-разбор там уже есть)...
Он, правда, не на ПХП, а на Питоне, но не думаю, что это нынче проблема для большинства хостингов.
Отв: Проверка валидности fb2-файла при загрузке ???
Формализовать процедуру "исправления" невалидного файла, чтобы он стал валидным, почти невозможно. Можно только пытаться проверять и исправлять набор часто встречаемых ошибок (как-то : неправильный порядок тегов 'title' и 'epigraph'; тег 'title' в середине текста; оформление стихов в тексте тегом 'epigraph' и так далее).
Однако задавая вопрос в теме топика я имел в виду : проверять валидность перед загрузкой на сервер и в случае ошибок,- сообщать пользователю об этом и не загружать невалидный файл. Подразумевается, что после этого пользователь потратит еще 1-2 минуту на исправление своего файла, и загрузит этот файл исправленным 8-)
Отв: Проверка валидности fb2-файла при загрузке ???
>тег 'title' в середине текста
А это из чего следует что невалидно? это допускает схема, и, более того, явно присуствует в примерах на fictionbook.org.
Это какой-то тогда не XML уже получается, а некий формат издалека напоминающий XML :-)
Отв: Проверка валидности fb2-файла при загрузке ???
title должно быть в начале секции. Это переводится как заголовок, если вы не в курсе. В середине секции title быть не может.
Правильно:
<section>
<title></title>
<p></p>
<p></p>
</section>
Не правильно:
<section>
<p></p>
<title></title>
<p></p>
</section>
Отв: Проверка валидности fb2-файла при загрузке ???
Отв: Проверка валидности fb2-файла при загрузке ???
Проверка валидности очень не помешала бы.
В некоторых файлах, (в них сказано что сделаны они в "LibRusEc kit") пометки, сноски, перевод разных понятий заключены в знаки < >,хотя по спецификации XML они должны быть в виде
< >соответственно, также иногда попадается знак & (амперсанд) хотя и он должен быть написан не прямо, а специально вот так&Из-за таких нарушений формата разметки XML некоторые файлы не возможно читать программами которые четко следуют спецификации XML
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Проверка валидности при загрузке fb2-файлов от автора "LibRusEc kit" - хорошая шутка, спасибо :)
Если серьезно - дайте ссылки на книги, а еще лучше - давайте исправим их вместе.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Я могу сгенерить список. Только, боюсь, в нем будет несколько десятков тысяч (не несколько тысяч, а несколько десятков тысяч) книг. И што мы будем с ими делать?
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
Точнее, 47 642 : http://lib.rus.ec/stat/document-author .
Проверить на другие варианты файла - скачать - открыть - поиск символов с автозаменой - сохранить - залить на Либрусек.
repeat
Всего по 23 821 на рыло.
Отв: Проверка валидности fb2-файла от автора "LibRusEc kit".
:) Да, рыла могут треснуть.
На самом деле немножко меньше: у меня готовятся что-то в районе четырех тысяч книг с Алдебарана/Литреса, которые будут заменой Либрусек-Киту. Но пока никак не приспособлюсь чтобы залить их без ручных разборок с дублями... :((
С другой стороны - супротив 47-ми тысяч оно не то чтобы совсем уж мертвому припарки... но и ненамного больше.