Ссылки - Советы

 

ldn-knigi.lib.ru  - основная страница    



Важная информация для всех
скачивающих книжки из интернета.
(обновление - 11.07.2009)


Уважаемые читатели!

 

Уже ряд лет существуют в интернете частные, не коммерческие библиотеки книг в электронной форме, владельцы которых все  бумажные книги сами переводят в электронную форму (напр. http://ldn-knigi.lib.ru), также библиотеки,  на которых трудятся сами владельцы и им помогают в качестве волонтеров другие книголюбы.  (напр. http://lib.ru, http://belolibrary.imwerden.de/, http://militera.lib.ru/  и другие).

 

Такая  работа состоит из  поиска  нужных книг в бумажных библиотеках, самом сканировании, переводе в электронную форму; часто также подбор дополнительного материала из других источников.

 

В качестве единственной награды за свой труд, ОЦР-щики обычно пишут свое имя или ник в начале электронного текста.  Читатели могут, имея данные ОЦР-щика, обратится к нему по поводу выложенной книги, поскольку  ОЦР-щик обычно сохраняет отсканированные материалы (пока жив...) в графическом формате – tif, jpg, gif.  Данные ОЦР-щика нужны также читателю, если он находит неточность в правке или желает напр. некоторые страницы текста в другом формате.
Подбирая к существующим темам книги, коллеги по сайтам ОЦР иногда, чтобы не делать двойную работу, помещают уже обработанные тексты с других сайтов. При этом оставляя данные первого ОЦР-щика, даже если при переводе в другой формат им пришлось и самим поработать над текстом. С этим большинство ОЦР-щиков согласны.


Как уже всем стало известно... капитализм некоторых развращает  и  не все уважают труд других.  Особенно в последние годы появляются все чаще сайты, основная цель которых – нажива.

Электронные книги являются у них в основном только приманкой неопытных читателей.  Зарабатывают такие сайты на рекламе совсем других продуктов, включительно порнографию, которая появляются на мониторе и без желания читателя.  Недобросовестные и  жадные на легкую прибыль персоны скачивают  книжки с ОЦР-сайтов и выкладывают на своих.

Переделывая для своих нужд чужой текст, они не только убирают данные ОЦР-щика и  взамен вписывают свое имя, они часто снижают и ценность текста, убирая фотографии, номера страниц, примечания. 

Одни делят текст на много частей (напр. HTM) чтобы за каждый дополнительный вызов им начислялось - больше платили за рекламу, другие даже имеют наглость требовать за скачивание денег.
У некоторых можно скачивать книги только после регистрации.

  
Обнаружил напр. такую «работу» у библиотеки
Aldebaran, написал уже об этом в гостевой нашей страницы. Заметил недавно, на сайте  http://www.mirknig.com/- нами обработанную книгу 1910 г., выложенную на нашей странице в формате DjVu.  Чтобы убрать ссылку на наш сайт, они конвертировали DjVu-bmp, bmp  опять в DjVu – при этом качество конечно ухудшилось.


Где были только эти «умники», когда еще не было сайтов первых идеалистов ОЦР-щиков?!  Неуважение к чужому труду показывает соответствующую мораль и некоторую детскую наивность!

Нужно при этом упомянуть также одну из новых библиотек, которая, пока не в корыстных целях, помещает вовсю работу других, (из нашего и других сайтов) снимая данные ОЦР-щиков: библиотека либрусек (http://lib.rus.ec - в Эквадоре). Тексты выдаются у них без фотографий, часто без нумерации страниц - что особенно важно в книгах напр. исторического содержания; также отсутствуют данные о том, где, когда была издана книга.
В итоге у них на сайте находятся  много «голых» текстов, читатель получает э. книгу, у которой словно бы ободрали обложки и
вырвали  титульные листы.

Совершенно непонятно, зачем так  уродовать  текст?! –  копирайт эквадорианца ведь не волнует! Очевидно одно - сайт запущен без единых, обязательных правил подготовки текста; лишь бы побыстрее и побольше книг  на сайт... получился в итоге просто склад текстов, большинство которых  неизвестного происхождения! 

Библиотека lib.rus.ec одна из многих, таким образом уродующих оригинальный электронный текст.
Почти все электронные библиотеки с «огромным количеством» книг, которые в течении года-двух появились на сцене, 
берут вовсю к себе готовые тексты с частных сайтов, убирая данные ОЦР-щиков.

Большинство ОЦР-щиков не возмущались бы самим фактом размножения книг на других серверах – если бы их данные в оцифрованных ими текстах сохранялись.  

 

Посмотрел нами оцифрованные книги в разных такого типа библиотеках... каждый глумился над текстом по своему – наверно и сам автор узнал бы свое сочинение только с большим трудом!

Книгами с сайтов ОЦР иногда «делятся» коммерческие библиотеки, между которыми существуют явно торговые связи.

Напр. наша работа, «Дело Бейлиса, стенографический отчет, в трех томах», сначала попала, кроме других, на сайт  infanata.org, у нее эти файлы  взяла страница mirknig.com с соответствующей  пометкой. Жаль, что «по дороге» у них пропали дополнительные файлы, которые мы выдали в другом формате.


Таким образом от сайта к сайту «путешествующий» текст, у которого уже сняли данные ОЦР-щика, не может быть при надобности восстановлен, ибо читатель не знает к кому обращаться!

 

Наш сайт (и наверно большинство других такого типа) бороться с такими «пиратами» не имеет ни возможности ни желания – жалко времени и сил, в интернете появляются постоянно новые, такого типа сайты, «распространителей» книг!

 

Мы хотели бы поэтому  посоветовать нашим читателям: при поисках книг в интернете не ленится, сравнивать,  искать первоисточный электронный вариант на бесплатном сайте, проверять выдана ли книга полностью – с фотографиями и иллюстрациями, если таковые имелись в бумажном оригинале!

Желаем Вам всем в этом удачи!


Прим.

Наверно уже настало время составить список «белых» электронных библиотек, у которых находятся только первоисточные оцифрованные книги.

Кто же за такую работу возьмется?  

Ему/ей  были бы очень благодарны все читатели, которые смогли бы свой поиск книг начать с сайтов  ОЦР-щиков и этим сэкономили бы себе много времени. Им стал бы сразу доступен полный э. вариант со всеми дополнениями и примечаниями, они избавили бы себя от надобности смотреть ненужную рекламу, регистрироваться, платить за быстрый download и т.д.

Заметки для начинающих ОЦР-щиков.

Главная предпосылка для ОЦР-щика – уважение перед бумажной книгой, ее автором, редактором, переводчиком, иллюстратором; уразуметь, что без основных данных о том когда, где, в каком издании вышла книга, она теряет свою ценность как носитель информации. Для напр. студента, историка, литературоведа, электронный текст без таких  данных – совершенно никчемный, они не будут на чтение такого текста даже время тратить!  
Не каждый умеющий читать и немножко работать на компьютере должен брать на себя задачу переделывать электронные тексты или оцифровывать бумажные книги (ОЦР), но если ему/ей очень уж хочется... пусть сначала поучится на примере оцифрованных текстов старых частных электронных библиотек; сформирует для себя шаблон правил обработки текста. Самого себя контролировать, быть редактором собственной работы дано не каждому!


 

Леон Дотан   (19.06.2009)

 




Библиотеки

 

http://lib.ru - большая  э. библиотека  Максима Мошкова 
 
   
http://www.belousenko.com/-  Электронная библиотека Александра Белоусенко 
„.. русская художественная и документальная проза, а также стихи, статьи, очерки,
 
 биографии, интервью; малоизвестные авторы, которые вынуждены были покинуть
 
 СССР и были преданы забвению...“
 
   
http://www.franklang.ru/ - страница Ильи Франка, 
полезная информация для изучающих   языки: немец., англ., франц., испанск., итальянск., турецкий.
 
Книги с параллельным текстом на двух языках, советы, грамматика...
 
      
http://forumklassika.ru/   -   Форумы  - музыка, важная информация

 

Thema: Die schleichende Islamisierung Europas   
Тема: 
Ползучая экспанция ислама в Европу (тихая исламизация)
Материалы на русском и немецком.   In  Russisch   und   Deutsch.
 

 

 

Страницы с книгами на разных языках:

 

http://gutenberg.spiegel.de/ - книги на немецком (классика)  или 

http://projekt.gutenberg.de/

 

http://www.grass-gis.de/bibliotheken/buecher.html   - 

книги на немецком, английском и других языках

 

http://digital.library.upenn.edu/books  - книги на английском и других языках

 

http://abu.cnam.fr/index.html

 

http://digital.library.upenn.edu/books/archives.html#foreign

 

http://www.tolleseite.de/

 

http://www.lysator.liu.se/runeberg/katalog.html

 

http://www.bartleby.com/

 

 

http://www.fh-augsburg.de/~harsch/germanica/Chronologie/d_chrono.html

 

http://www.literature.at/webinterface/library

 

http://www.antologija.lt/  - Lietuviskos  knygos  (Книги на литовском)

 

 


http://www.onlinenewspapers.com/russia.htm -  русская пресса

 

http://www.onlinenewspapers.com/   - мировая  пресса

 

http://ldn-knigi.lib.ru/EvrLinki.htm  - Ссылки к Judaica

(еврейские стр. на разных языках, Израиль, Ветхий- Новый Завет...)

 


Поисковые Системы:

 

 

http://www.rubricon.com/   -   Энциклопедический ресурс интернета

 

http://www.yandex.ru/

 

http://www.narod.ru/

 

http://www.kulichki.com/inkwell - удобный поиск книг,  ссылки к библиотекам

 

 

http://www.yahoo.com/   

 

http://www.google.com/  -  очень быстрый поиск, можно искать на нескольких

языках одновременно

 

http://www.telefonbuch.com/europe.htm  - Телефонные справочники Европы, Америки ...


Программы

(freeware, shareware)

 

FlashGet– Рекомендуем  для скачивания эту программу, можно  скачивать

одновременно несколько файлов и эта программа  „запоминает“

и не боится временного прекращения связи.

Все файлы скачиваются в C:\Downloads. (быстрее чем с Microsoft)

 


 

WinComander = TotalCommander– очень  удобный  Filemanager-

                    стандартные распаковочные и упаковочные программы

(и FTP) в нем уже интегрированы.

 

Советы: если вызов вам знакомой страницы длиться слишком

долго, можно с  FlashGet не вызывая ее, прямо скачать к 

себе   на H.D., там открыть и с нее же вызывать желаемые

ссылки.

Также можно ускорить скачивание текстов, которые сначала

нужно вызвать на экране – идет быстрее, если  сразу  

скачать с FlashGet! (правой мышкой на ссылку – скачать с FlashGet)

 


 

Если у вас нет программы Винворд 2000 (WinWord 2000) – можно удобно читать

форматы *.doc (WW2000) а также *.rtf , *.txt – программой «MicrosoftWordViewer».

С ее помощью можно читать тексты (и с картинками), также распечатать.

          Скачать ее можно бесплатно у фирмы Microsoft.

Название фил'а (для поиска и скачивания) -  wd97vwr32.exe  (величина 4,1 Mb)   

или   Wordview.exe 

 


 

Читать тексты и просматривать картинки в формате *.tif, *.bmp, *.jpg и др., удобно с помощью

бесплатной программы  IrfanView (view32.exe). Искать через Яндекс или Google.

Ей можно просматривать, читать, распечатывать, обрабатывать.

Работая с этой программой вы можете менять величину объектов, перелистывать (мышкой и тастатурой),

поворачивать, записать в другом формате.

Также можно, по одной, вставлять *.tif; *.jpg в файл *.doc  (программа ВинВорд) и там просматривать и распечатывать...


 

 

О формате  DjVu

 

WinDjView 0.4.2 (или новая версия, напр. 1.0.3)  - удобная программа для просмотра DjVu файлов под Windows, в которой впервые реализован непрерывный режим просмотра. 
Программа основана на свободно распространяемой библиотеке
DjVuLibre.

Формат DjVu позволяет распространять документы и картинки высокого качества при минимальном размере файла; сжатие 5,0-6,5 раз, притом качество не ухудшается. 
Таким образом отсканированная книга в картинках (формат 
 *.tif) напр. 25 MB, будет в формате djVu всего прим.  4,0 MB.


Работая с 
WinDJView можно регулировать качество изображения на мониторе (File-Settings) и очень комфортабельно распечатывать. 

Работая с WinDJView можно регулировать качество изображения на мониторе. Советую попробовать разные установки «Gamma».

Напр. при слишком светлом шрифте: «File-Settings-Gamma», «Gamma» установить 0,6-0,8.  Если же шрифт слишком «жирный», «Gamma» установить 1,2 или больше.

Иногда лучше читать, если качество неудовлетворительное - установить в прог. WinDjView: по одной странице, «Fit Width-По ширине», если монитор большой – то «View-Fullscreen Вид на полный экран». 
Последующие  страницы вызывать (как и в прог. 
IrfanView) клавишой Space, назад клавишой Backspace.

Установка для распечатывания (для примера - книга Альберт Швейцер «Иоганн Себастьян Бах»: Left-12, Top-8, Right-2, Bottom-5, Portrait, Center image, Scale to fit media. Printproperties - качество: normal или best.

File-Print: тут можно установки менять, изменения видны сразу на картинке диалога. Напр. если вы желаете страницу нот увеличить: Center image, Auto rotate, Landscape, Scale – 100-110%, 
Ignore printer margins, Margin: left-1, right-1, top-2, bottom-1.


Есть также возможность с WinDJView отдельные страницы записывать-переводить в формат *.bmp который можно напр. вставлять в *.doc. 


английская - http://sourceforge.net/project/showfiles.php?group_id=114927  
или  здесь    http://ldn-knigi.lib.ru/WinDjView-1.0.3-Setup.exe
 

Важно! есть отдельные версии для систем  
Win-XP и  Win-98! 
Под системой 
Win-98 версия для Win-XP – не работает!


Для более смелых:
 
С этой программой, после инсталирования, вы сможете в: 
InternetExplorer, Mozilla-Firefox, прямо вызывать файл djvu.  Около 6,7 MB
Работает как плагин 
AcrobatReader-а для файла pdf.
http://djvu-inf.narod.ru/


Еще ссылки к страницам с информацией о 
djvu  и даже целыми библиотеками в формате djvu

http://www.biografia.ru/odjvu.html 
http://www.biografia.ru/knigi1.html 
http://sci-lib.com/ 
http://lib.mexmat.ru/helpdesk.php

 

 Дополнительно о работе с файлами DjVu


Вопросы читателя:

К сожалению, чтение книг в формате DjVu (в библиотеке появилось очень много ценных книг в этом формате) для меня очень трудно.

Существует ли возможность конвертировать книги из DjVu в Microsoft Word? Могу ли я сам переводить книги в другой формат и как это сделать?

 

Ldn-knigi, ответ:
Если Вы инсталлировали плагин djvu для InternetExplorer, (Mozilla-Firefox) то сможете вызвать файлы djvu и в тех браузерах, может быть так будет Вам удобнее...
Самый быстрый и удобный метод получить отдельные файлы tif , jpg из djvu – покупной программой FineReader.

Потом можно удобно читать напр. с бесплатной IrfanView.
Есть также возможность с WinDJView отдельные страницы, по одной,  записывать-переводить в формат *.bmp, который можно напр. вставлять в *.doc (как картинку) или тоже читать по одной странице с IrfanView.

 Или  разбить  файл  DjVu - одним приказом на  отдельные файлы   ---   см. ниже!   

 

Вопросы читателя:

Существует ли возможность перевода DjVu-файла в Pdf-файл,а из Pdf-файла можно ли перевести в Microsoft-Word  (не как картинку, а с изменением шрифта и формата текста)?

 

Ldn-knigi, ответ: Способ прямо из DjVu перевести в Pdf мне не известен, может быть будет когда ни будь. Pdf можно создавать или из картинок, форматы tif, bmp, jpg, или с программой OCR, напр. FineReader 9, сначала узнать, перевести из tif, bmp в текст, который, после обработки и форматирования (c прог. WinWord) можно соединить в Pdf разными программами. Такой файл Pdf, из узнанного текста, будет меньше чем файл Pdf из картинок.

Если уже  имеется файл Pdf, созданный из картинок, его можно разбить на отдельные картинки и потом перевести в текст, с программой OCR напр. FineReader 9; после этого можно создать файл doc в WinWordе.

Если же имеется файл Pdf, созданный из текста, то с программой OCR напр. FineReader 9 можно сразу весь текст узнать (OCR), послать его в программу WinWord и там его обрабатывать.

 

Способ с программой IrfanView (version 4+) одним приказом разбить файл DjVu на отдельные файлы, по желанию: tif, jpg, bmp.


(Читать тексты и просматривать картинки в формате *.
tif, *.bmp, *.jpg и др., удобно с помощью 
бесплатной программы
  IrfanView (view32.exe)http://www.irfanview.com/  инсталлировать прог. вместе с PlugIns) 
(Подробно, для начинающих.)
 
Сначала надо вызвать прог.
IrfanView и «открыть» желаемый файл DjVu  (до того выбрать в окне диалога тип файлов - DjVu.)
Когда первая страница файла видна, в прог.
IrfanView пойти на меню (наверху) и нажать «сервис-извлечь все кадры». Тут программа предлагает вам возможность выбрать папку, в которую вы желаете поместить файлы из  DjVu и выбрать графический формат файлов; все установив, нажать на "выполнить". 
Прим. Если в книге-файле
DjVu только текст, можно выбрать формат tif, если же имеются цветные иллюстрации, фотографии – то лучше выбрать формат jpg, bmp. 
Практически разница в величине файлов, самые малые –
tif (черно-белые);  файлы цветных страниц - форматы jpg  больше, bmp еще больше. Если в книге всего несколько цветных страниц, то оптимально сначала файл DjVu разбить на отдельные файлы tif, а после этого вызвать файл DjVu с программой WinDjView и эти цветные страницы по одной записать в ту же папку в формате jpg или bmp. Для этого надо щелкнуть на желаемую страницу в прог. WinDjView левой мышкой, (на изображение с правой стороны), потом на нее щелкнуть правой мышкой. В окошечке выбрать опцию „Export Page“. Сейчас осталось только указать папку, куда записать файл и формат файла, напр. jpg или bmp.  (WinDjView Version 1.0.3+) 
Имея отдельные файлы страниц, вы сможете их читать (и распечатать, обработать) так же программой
IrfanView. Вызвать первую страницу и тастатурой или стрелками (см. меню, наверху в прог. IrfanView) «вперед-назад» двигаться по страницам.