|
Ссылки - Советы |
|
ldn-knigi.lib.ru -
основная
страница
Важная
информация для всех
скачивающих книжки из
интернета.
(обновление
- 11.07.2009)
Уважаемые читатели!
Уже ряд лет существуют в интернете частные, не коммерческие библиотеки книг в электронной форме, владельцы которых все бумажные книги сами переводят в электронную форму (напр. http://ldn-knigi.lib.ru), также библиотеки, на которых трудятся сами владельцы и им помогают в качестве волонтеров другие книголюбы. (напр. http://lib.ru, http://belolibrary.imwerden.de/, http://militera.lib.ru/ и другие).
Такая работа состоит из поиска нужных книг в бумажных библиотеках, самом сканировании, переводе в электронную форму; часто также подбор дополнительного материала из других источников.
В
качестве
единственной награды за свой труд, ОЦР-щики обычно пишут свое имя или
ник в
начале электронного текста. Читатели
могут, имея данные ОЦР-щика,
обратится к нему по поводу выложенной книги, поскольку ОЦР-щик
обычно сохраняет отсканированные
материалы (пока жив...) в графическом формате – tif,
jpg, gif. Данные
ОЦР-щика нужны
также читателю,
если он находит неточность в правке или
желает напр.
некоторые страницы текста в другом формате.
Подбирая к
существующим темам книги,
коллеги по
сайтам
ОЦР иногда, чтобы не делать двойную работу, помещают уже обработанные
тексты с
других сайтов. При этом оставляя данные первого ОЦР-щика,
даже если
при переводе в другой формат им пришлось и самим поработать над
текстом. С этим большинство
ОЦР-щиков согласны.
Как
уже всем стало
известно...
капитализм некоторых развращает и не все уважают
труд
других. Особенно
в
последние годы появляются все чаще сайты, основная цель которых
–
нажива.
Электронные
книги
являются у них в основном только приманкой неопытных
читателей.
Зарабатывают
такие сайты на рекламе совсем других продуктов, включительно
порнографию, которая
появляются на мониторе и без желания читателя. Недобросовестные
и жадные на легкую прибыль персоны скачивают книжки
с
ОЦР-сайтов и
выкладывают на
своих.
Переделывая
для
своих нужд чужой текст, они не только убирают данные ОЦР-щика
и взамен
вписывают свое имя, они
часто снижают и
ценность текста,
убирая фотографии,
номера страниц,
примечания.
Одни делят
текст на много частей (напр.
HTM) чтобы за
каждый дополнительный
вызов им
начислялось - больше платили за рекламу, другие даже имеют наглость
требовать за скачивание денег.
У некоторых
можно скачивать книги только после регистрации.
Обнаружил напр. такую «работу» у
библиотеки Aldebaran,
написал уже об этом в
гостевой нашей
страницы. Заметил недавно, на сайте http://www.mirknig.com/-
нами
обработанную
книгу 1910
г., выложенную на нашей
странице в формате DjVu. Чтобы
убрать ссылку на наш сайт, они конвертировали
DjVu-bmp,
bmp опять в DjVu – при этом качество
конечно ухудшилось.
Где были
только
эти «умники», когда еще не было сайтов первых
идеалистов
ОЦР-щиков?!
Неуважение к чужому труду показывает соответствующую мораль и некоторую
детскую
наивность!
Нужно
при этом упомянуть также
одну из новых библиотек, которая, пока не в корыстных целях, помещает
вовсю
работу других, (из нашего и других сайтов) снимая данные ОЦР-щиков:
библиотека либрусек
(http://lib.rus.ec - в Эквадоре). Тексты выдаются у них без фотографий,
часто без
нумерации
страниц - что особенно важно в книгах напр.
исторического содержания;
также
отсутствуют данные о том, где, когда была издана книга.
В итоге у них на сайте
находятся
много
«голых»
текстов, читатель получает э. книгу, у которой словно бы ободрали
обложки
и вырвали титульные
листы.
Совершенно
непонятно,
зачем так уродовать текст?!
–
копирайт эквадорианца ведь не волнует! Очевидно одно - сайт запущен
без единых, обязательных правил подготовки текста; лишь бы побыстрее и
побольше
книг на сайт... получился в итоге просто склад текстов, большинство
которых
неизвестного
происхождения!
Библиотека
lib.rus.ec
одна из многих, таким образом уродующих оригинальный электронный текст.
Почти все
электронные библиотеки с «огромным количеством»
книг, которые в течении
года-двух появились на сцене, берут вовсю к
себе готовые тексты с частных сайтов, убирая данные ОЦР-щиков.
Большинство
ОЦР-щиков не возмущались бы самим фактом размножения книг на других
серверах –
если бы их данные в оцифрованных ими текстах сохранялись.
Посмотрел
нами
оцифрованные
книги в разных такого типа библиотеках... каждый глумился над текстом
по своему
– наверно и сам автор узнал бы свое сочинение только с
большим трудом!
Книгами
с сайтов ОЦР иногда «делятся» коммерческие
библиотеки, между
которыми существуют явно торговые связи.
Напр.
наша работа, «Дело
Бейлиса, стенографический отчет, в трех
томах», сначала попала, кроме других, на сайт
infanata.org, у нее эти файлы взяла
страница mirknig.com с
соответствующей пометкой. Жаль, что «по
дороге» у них пропали
дополнительные
файлы, которые мы выдали в другом формате.
Таким образом от сайта к
сайту
«путешествующий» текст, у которого уже сняли данные
ОЦР-щика, не может
быть при
надобности восстановлен, ибо читатель не знает к кому обращаться!
Наш сайт (и наверно большинство других такого типа) бороться с такими «пиратами» не имеет ни возможности ни желания – жалко времени и сил, в интернете появляются постоянно новые, такого типа сайты, «распространителей» книг!
Мы
хотели бы
поэтому посоветовать нашим читателям: при поисках книг в
интернете не
ленится,
сравнивать, искать
первоисточный электронный вариант на бесплатном сайте, проверять выдана
ли книга
полностью – с фотографиями и иллюстрациями, если таковые имелись в бумажном
оригинале!
Желаем Вам всем в этом удачи!
Прим.
Наверно
уже настало время
составить список «белых» электронных библиотек, у
которых находятся только первоисточные оцифрованные книги.
Кто же за такую работу возьмется?
Ему/ей были бы очень
благодарны все читатели,
которые смогли бы свой поиск книг начать с сайтов
ОЦР-щиков
и этим сэкономили бы себе много времени. Им стал бы
сразу доступен полный э. вариант со всеми дополнениями и примечаниями,
они
избавили бы себя от надобности смотреть ненужную рекламу,
регистрироваться,
платить за быстрый download и т.д.
Главная
предпосылка для ОЦР-щика – уважение перед бумажной книгой, ее
автором,
редактором, переводчиком, иллюстратором; уразуметь, что без основных
данных о
том когда, где, в каком издании вышла книга, она теряет свою ценность
как
носитель информации. Для напр. студента, историка, литературоведа,
электронный
текст без таких данных – совершенно никчемный, они
не будут на
чтение такого
текста даже время тратить!
Не каждый
умеющий читать и немножко работать на компьютере должен брать на себя
задачу
переделывать электронные тексты или оцифровывать бумажные книги (ОЦР),
но если
ему/ей очень уж хочется... пусть сначала поучится на примере
оцифрованных текстов
старых частных электронных библиотек; сформирует для себя шаблон правил
обработки текста. Самого себя контролировать, быть редактором
собственной
работы дано не каждому!
Леон Дотан (19.06.2009)
Библиотеки
http://lib.ru - большая э.
библиотека
Максима Мошкова
http://www.belousenko.com/- Электронная библиотека
Александра
Белоусенко
„.. русская художественная и документальная проза, а также
стихи, статьи,
очерки,
биографии, интервью; малоизвестные авторы, которые вынуждены
были
покинуть
СССР и были преданы забвению...“
http://www.franklang.ru/ - страница
Ильи Франка,
полезная информация для изучающих
языки: немец., англ.,
франц., испанск., итальянск., турецкий.
Книги с параллельным текстом на двух языках, советы, грамматика...
http://forumklassika.ru/ -
Форумы - музыка,
важная информация
Thema: Die
schleichende Islamisierung Europas
Тема: Ползучая экспанция ислама в Европу (тихая
исламизация)
Материалы на русском и немецком. In
Russisch
und Deutsch.
Страницы с книгами на разных языках:
http://gutenberg.spiegel.de/ -
книги на немецком (классика) или
http://www.grass-gis.de/bibliotheken/buecher.html
-
книги
на
немецком, английском и других языках
http://digital.library.upenn.edu/books -
книги на английском и других языках
http://digital.library.upenn.edu/books/archives.html#foreign
http://www.lysator.liu.se/runeberg/katalog.html
http://www.fh-augsburg.de/~harsch/germanica/Chronologie/d_chrono.html
http://www.literature.at/webinterface/library
http://www.antologija.lt/ - Lietuviskos knygos (Книги на литовском)
http://www.onlinenewspapers.com/russia.htm - русская
пресса
http://www.onlinenewspapers.com/
- мировая пресса
http://ldn-knigi.lib.ru/EvrLinki.htm
- Ссылки к Judaica
(еврейские
стр.
на разных языках, Израиль, Ветхий- Новый Завет...)
Поисковые Системы:
http://www.rubricon.com/
- Энциклопедический ресурс интернета
http://www.kulichki.com/inkwell -
удобный поиск книг, ссылки к библиотекам
http://www.google.com/
- очень
быстрый поиск, можно искать на нескольких
языках
одновременно
http://www.telefonbuch.com/europe.htm
- Телефонные справочники Европы, Америки ...
Программы
(freeware, shareware)
FlashGet–
Рекомендуем для
скачивания эту программу, можно скачивать
одновременно несколько
файлов и эта программа „запоминает“
и
не боится
временного прекращения связи.
Все файлы скачиваются в C:\Downloads. (быстрее чем с Microsoft)
WinComander
= TotalCommander– очень удобный Filemanager-
стандартные распаковочные
и упаковочные
программы
(и
FTP) в
нем уже интегрированы.
Советы:
если
вызов вам знакомой страницы длиться слишком
долго,
можно
с FlashGet не вызывая ее, прямо скачать к
себе
на H.D., там открыть и с нее же вызывать желаемые
ссылки.
Также
можно
ускорить скачивание текстов, которые сначала
нужно
вызвать на
экране – идет быстрее, если
сразу
скачать
с
FlashGet! (правой мышкой на ссылку – скачать с FlashGet)
Если
у вас нет
программы Винворд 2000 (WinWord 2000) – можно удобно читать
форматы
*.doc (WW2000) а также *.rtf , *.txt –
программой «MicrosoftWordViewer».
С
ее помощью
можно читать тексты (и с картинками), также распечатать.
Скачать ее можно бесплатно у фирмы Microsoft.
Название
фил'а
(для поиска и скачивания) - wd97vwr32.exe
(величина 4,1 Mb)
или
Wordview.exe
Читать
тексты и
просматривать картинки в формате *.tif, *.bmp, *.jpg и др., удобно с помощью
бесплатной
программы IrfanView (view32.exe). Искать через Яндекс или Google.
Ей
можно
просматривать, читать, распечатывать, обрабатывать.
Работая
с этой
программой вы можете менять величину объектов, перелистывать (мышкой и
тастатурой),
поворачивать,
записать в другом формате.
Также
можно, по
одной, вставлять *.tif; *.jpg в файл *.doc (программа ВинВорд) и там просматривать
и
распечатывать...
О
формате
DjVu
WinDjView 0.4.2 (или новая версия,
напр. 1.0.3) - удобная программа для просмотра DjVu файлов под Windows, в которой впервые реализован
непрерывный режим
просмотра.
Программа основана на свободно распространяемой библиотеке DjVuLibre.
Формат DjVu позволяет распространять документы
и
картинки высокого качества при минимальном размере
файла; сжатие 5,0-6,5
раз, притом качество не ухудшается.
Таким образом отсканированная книга в картинках (формат *.tif) напр. 25 MB, будет
в формате djVu всего
прим. 4,0 MB.
Работая с WinDJView можно регулировать качество
изображения на мониторе (File-Settings) и очень комфортабельно
распечатывать.
Работая
с WinDJView
можно регулировать качество изображения
на мониторе. Советую попробовать разные установки «Gamma».
Напр.
при слишком
светлом шрифте: «File-Settings-Gamma», «Gamma» установить 0,6-0,8. Если же шрифт слишком
«жирный», «Gamma» установить 1,2 или
больше.
Иногда
лучше
читать, если качество неудовлетворительное - установить в
прог. WinDjView: по одной странице, «Fit Width-По ширине», если монитор большой
– то «View-Fullscreen – Вид на полный
экран».
Последующие страницы вызывать (как и в
прог. IrfanView)
клавишой Space, назад клавишой Backspace.
Установка
для
распечатывания (для примера - книга Альберт Швейцер «Иоганн
Себастьян Бах»: Left-12, Top-8, Right-2, Bottom-5, Portrait, Center
image, Scale to fit media. Printproperties -
качество: normal
или best.
File-Print: тут можно установки менять,
изменения
видны сразу на картинке диалога. Напр. если
вы желаете страницу
нот увеличить: Center image, Auto rotate,
Landscape, Scale –
100-110%,
Ignore printer margins, Margin: left-1, right-1, top-2, bottom-1.
Есть
также
возможность с WinDJView отдельные страницы
записывать-переводить в формат *.bmp который можно напр. вставлять
в *.doc.
английская - http://sourceforge.net/project/showfiles.php?group_id=114927
или здесь http://ldn-knigi.lib.ru/WinDjView-1.0.3-Setup.exe
Важно! есть отдельные версии для систем Win-XP и Win-98!
Под системой Win-98 версия для Win-XP – не работает!
Для более смелых:
С этой программой, после инсталирования, вы сможете в: InternetExplorer, Mozilla-Firefox, прямо вызывать
файл djvu. Около
6,7 MB.
Работает как плагин AcrobatReader-а для файла pdf.
http://djvu-inf.narod.ru/
Еще ссылки к страницам с информацией о djvu и даже целыми
библиотеками в формате djvu
http://www.biografia.ru/odjvu.html
http://www.biografia.ru/knigi1.html
http://sci-lib.com/
http://lib.mexmat.ru/helpdesk.php
Дополнительно о работе с файлами DjVu
Вопросы читателя:
К сожалению, чтение книг
в формате DjVu (в библиотеке
появилось очень много ценных книг в этом формате) для меня очень трудно.
Существует ли возможность конвертировать книги из DjVu в Microsoft Word? Могу ли я сам переводить книги в другой формат и как это сделать?
Ldn-knigi, ответ:
Если Вы инсталлировали
плагин djvu для InternetExplorer, (Mozilla-Firefox) то сможете вызвать файлы
djvu и в тех браузерах, может быть так будет Вам удобнее...
Самый быстрый и удобный метод получить отдельные файлы tif , jpg из djvu –
покупной программой FineReader.
Потом можно удобно читать напр. с
бесплатной IrfanView.
Есть также возможность с WinDJView отдельные страницы, по одной,
записывать-переводить в формат *.bmp, который можно напр. вставлять в *.doc
(как картинку) или тоже читать по одной странице с IrfanView.
Или разбить файл DjVu - одним приказом на отдельные файлы --- см. ниже!
Вопросы читателя:
Существует ли возможность перевода DjVu-файла в Pdf-файл,а из Pdf-файла можно ли перевести в Microsoft-Word (не как картинку, а с изменением шрифта и формата текста)?
Ldn-knigi, ответ: Способ прямо из DjVu перевести в Pdf мне не известен, может быть будет
когда ни будь. Pdf можно создавать или из картинок, форматы tif, bmp, jpg, или
с программой OCR, напр. FineReader 9, сначала узнать, перевести из tif, bmp в
текст, который, после обработки и форматирования (c прог. WinWord) можно
соединить в Pdf разными программами. Такой файл Pdf, из узнанного текста, будет
меньше чем файл Pdf из картинок.
Если уже имеется
файл Pdf, созданный из картинок, его можно разбить на отдельные картинки и
потом перевести в текст, с программой OCR напр. FineReader 9; после этого можно
создать файл doc в WinWordе.
Если же имеется файл Pdf, созданный из текста, то с программой OCR напр. FineReader 9 можно сразу весь текст узнать (OCR), послать его в программу WinWord и там его обрабатывать.
Способ с программой IrfanView (version 4+) одним приказом разбить файл DjVu на отдельные файлы, по желанию: tif, jpg, bmp.
(Читать тексты и просматривать картинки в формате *.tif, *.bmp, *.jpg и др.,
удобно с помощью
бесплатной программы IrfanView (view32.exe). http://www.irfanview.com/ инсталлировать
прог. вместе с PlugIns)
(Подробно, для начинающих.)
Сначала надо вызвать прог. IrfanView и «открыть» желаемый файл DjVu (до того выбрать в окне диалога тип файлов
- DjVu.)
Когда первая страница файла видна, в прог. IrfanView пойти на меню (наверху) и нажать «сервис-извлечь
все кадры». Тут программа предлагает вам возможность выбрать папку, в которую
вы желаете поместить файлы из DjVu и выбрать графический формат файлов; все
установив, нажать на "выполнить".
Прим. Если в книге-файле DjVu только текст, можно выбрать формат tif, если же имеются цветные иллюстрации, фотографии
– то лучше выбрать формат jpg, bmp.
Практически разница в величине файлов, самые малые – tif (черно-белые); файлы цветных страниц - форматы
jpg больше, bmp еще больше. Если в книге всего несколько
цветных страниц, то оптимально сначала файл DjVu разбить на отдельные файлы tif, а после этого вызвать файл DjVu с программой WinDjView и эти цветные страницы по одной записать
в ту же папку в формате jpg
или bmp. Для этого надо
щелкнуть на желаемую страницу в прог. WinDjView левой мышкой, (на изображение с правой стороны),
потом на нее щелкнуть правой мышкой. В окошечке выбрать опцию „Export Page“. Сейчас осталось только указать папку, куда записать файл и формат файла,
напр. jpg или bmp. (WinDjView Version 1.0.3+)
Имея отдельные файлы страниц, вы сможете их читать (и распечатать, обработать)
так же программой IrfanView.
Вызвать первую страницу и тастатурой или стрелками (см. меню, наверху в прог. IrfanView) «вперед-назад» двигаться по страницам.