Вы здесьПоиск книг по DC++ хабам
Опубликовано ср, 01/04/2009 - 16:16 пользователем Bill_G
вот нашел интересный ресурс: http://dc-poisk.no-ip.org Цитата: запущен сервер поиска магнет ссылок http://dc-poisk.no-ip.org:17000. Его задача показать: как легко организовать поиск книг и журналов в хабах. Теперь любой энтузиаст без написания строчки кода может создать базу данных из миллионов ссылок на документы.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
нэнси RE:Подайте бедному копеечку на книжку с литреса... 18 часов
weis RE:Прошу переформатировать, распознать, etc... 4 дня larin RE:Заплатила, а абонемента нет и скачать ничего не могу! 1 неделя sibkron RE:Серия "Библиотека французской литературы" (Макбел) 1 неделя akorish RE:Регистрация 1 месяц Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 1 месяц Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 1 месяц konst1 RE:Ух, как я не люблю спамеров! 1 месяц tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 2 месяца larin RE:Заблокирован 2 месяца konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 месяца fixel RE:Пропал абонемент 2 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 3 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 4 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 4 месяца Впечатления о книгах
Niarbagem про Пехов: Птицелов (Фэнтези, Самиздат, сетевая литература)
11 06 На мой взгляд не хуже первой, сюжет, интрига - все присутствует. Однозначно стоит читать, если первая понравилась. Оценка: хорошо
Barbud про Шелест: Мельница (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
10 06 Какое-то невнятное писево с картонными героями, совершенно не зацепило. Оценка: нечитаемо
tamuh2 про Горелик: Пасынки (Альтернативная история, Самиздат, сетевая литература)
10 06 книжка классная! как здорово раскрыта психология двух различных рас, взгляды на жизнь и мир, причём люди и эльфы поставлены из-за этих сходств и различий на одно поле боя. жду продолжения, очень огорчусь, если его не будет!
Gilean про Алим Тыналин
09 06 Все книги читабельны )) Прочитал серию Биржевик, Фарцовщик и читаю Криминалиста. Мне нравится, неплохая подача материала, да и ошибок в тексте мало.
Sello про Пинчон: Выкрикивается лот 49 [The Crying of Lot 49 ru] (Современная проза)
09 06 Начальный Пинчон", - сыроват, с некоторыми неувязками (например, после связи с Метцгертом, Эдипа, размышляя, говорит о "своем единственном любовнике", забывая почему-то об "основном", Пирсе), немного затянут в поисках ответа ……… Оценка: хорошо
Chernovol про Созонтов: История России в датах. 100 главных событий (История)
08 06 Пропущенные вехи истории: голодомор, ввод советских войск в Чехословакию. А советские войска не вошли, а напали на Польшу в 1939 г. Оценка: неплохо
Никос Костакис про Шиляев: Телохранитель Генсека. Том 7 [СИ] (Альтернативная история, Попаданцы, Самиздат, сетевая литература)
08 06 о присвоении его к званию Героя Советского Союза" ____ Йа! Рузский йазыка есть очень трудное!
Barbud про Воронцов: Петербургский врач. Часть 1 [СИ] (Альтернативная история, Самиздат, сетевая литература)
08 06 Да что же такое, еще один попадун пенициллин на коленке варить собрался!) Впрочем, это же ИИшное творчество - нейросеть, наверное, просто выдернула из других, гораздо более одиозных опусов идею создания антибиотиков из подручных средств. Оценка: плохо
mysevra про Березин: Пентаграмма Осоавиахима [litres] (Альтернативная история, Современная проза, Городское фэнтези)
08 06 Как той собачке, ничего не светит, акцент выборочно-минорный. Но язык хорош, улыбнуло. Оценка: хорошо
mysevra про Мороз: Мгла [СИ] (Фэнтези, Самиздат, сетевая литература)
08 06 Сейчас много таких книг: золотая идея, оригинальная и интересная, а изложить человек не в состоянии – ни словарного запаса, ни фантазии, ни таланта плести словесные кружева или же просто изъясняться чётко и внятно. Таким надо ……… Оценка: неплохо
mysevra про Реньжина: Бабушка сказала сидеть тихо (Современная проза)
08 06 Эта книжка упоминалась в каком-то списке самых жутких историй, поэтому я и ждала чего-то запредельного и щекочущего воображение. А это просто женская проза, милая и грустная. Не люблю такое. Оценка: неплохо |
Комментарии
Отв: Поиск книг по DC++ хабам
Идея отличная, но хорошо бы ещё список хабов. Или это специальная уловка, чтобы копирасты задолбались искать? :)
Отв: Поиск книг по DC++ хабам
Десяток хабов и жалкие 14 тысяч проиндексированных пользователей?
Это смешно.
Отв: Поиск книг по DC++ хабам
Rogue
Трудно сказать,
вопрос скорее к автору,
впрочем список книжных хабов я уже давал,
Hutt
вопрос скорее всего упирается в железо,
попробуйте у себя дома поднять такую базу.
и никакие они не жалкие, там на несколько Петабайт инфы.
Отв: Поиск книг по DC++ хабам
Извиняюсь за оффтоп, но после поисков в сети я не нашёл решения вопроса, возникающего при нажатии на магнет ссылку. Жму, открывается окно клиента (мюторрент), и больше ничего не происходит, а ведь, как я понял, должна открыться закачка, которая начнётся, как только подойдёт раздающий. Если кто может - подскажите, что сделать.
Отв: Поиск книг по DC++ хабам
тут вроде нужен особый клиент ДЦ++ а Торренты не подходят.
Отв: Поиск книг по DC++ хабам
О, спасибо, и впрямь клиент отдельный нужен.
Отв: Поиск книг по DC++ хабам
Я когда-то пользовался StrongDC клиентом. неплохая весчь
Отв: Поиск книг по DC++ хабам
Пока это разумная достаточность. Если книга есть в электронном виде, то с высокой долей вероятности вы ее найдете в этом поисковике. Т.к. индексировались хабы РФ, то вероятность для русскоязычной литературы выше. Почему только 14000? Т.к. канал доступа в инет 512Кбит, много файл-листов для последующей индексации скачать не получается.
В новости есть ошибочка :
http://dc-poisk.no-ip.org:17000 поисковик на основе Яндекс-сервера
http://dc-poisk.no-ip.org поисковик на основе Сфинкса
Т.е. два разных поисковика. http://dc-poisk.no-ip.org проиндексировал 247 863 661 имя файла, в http://dc-poisk.no-ip.org:17000 только около 8 000 000 и все. Для http://dc-poisk.no-ip.org:17000 думаю уйти от поиска всего и заточить только под книги, добавив туда возможность поиска по нескольким страницам с начала и конца книги. Загвоздка только в вычислительных мощностях, на моей машине нужно несколько месяцев непрерывной работы, т.к большинство книг не содержат текстового слоя и его надо создавать с помощью OCR. В принципе сейчас это может сделать любой, кто имеет большую коллекцию книг. Для этого используйте SSearch, Яндекс Сервер, FindISBN. После того как получите текстовые слои, надо дописать маленькую программку в несколько экранов кода, которая сканирует файловое дерево с книгами, вычисляет их TTH, находит, где хранится HTML файл описатель, который создан SSearch (его имя «TTH_книги-размер_файла.HTML») и дописывает туда текстовый слой, полученный FindISBN. Все! индексируйте эти «TTH_книги-размер_файла.HTML» яндек сервером и получаете что-то типа http://books.google.ru/ .
Найти где сейчас "тусуется" юзер, расшаривший нужный файл можно здесь: http://www.publichublist.nl/ или http://www.dchublist.com/ . Т.е. вы найдете имя хаба к которому подключён юзер в данный момент.