kommari: (Default)
[personal profile] kommari
-Партийная ячейка приняла решения передать сапоги более нуждающимся беспартийным.
-Партийные все такие?
- Все!
(с) к/ф "Бумбараш"


я, хотя формально беспартийный, но сторонник свободного распространения информации (и бесплатного) 
поэтому выкладываю первую мной отсканнированную книгу

"Зимняя война 1939-1940. Политическая история", Москва, "Наука", 1999 г.

http://aleksandr-kommari.narod.ru/talvisota_1.htm

По технике сканирования.
Я никак не могу полюбить форматы pdf и djvu, сколько меня не убеждают в обратном.
Однако сканировать в Word - геморрой жуткий - не со сканированием, а с проверкой орфографии и форматированием текста.

В приложении фотография - как происходил процесс. По телику смотрел какие-то трэшовые фильмы категории "B" - одновременно сканируя страницу за страницей.

Формат

Date: 2008-01-30 10:20 am (UTC)
From: [identity profile] berdychevsky.livejournal.com
Для таких простых книг как эта - HTML наиболее подходящий вариант. Но для сложных книг, где много графики, карт, схем, формул и т.д. лучше всего наверное будет djvu.

Re: Формат

Date: 2008-01-30 10:24 am (UTC)
From: [identity profile] kommari.livejournal.com
да, там карт не было - хотя ход сражений на Перешейке и Севере довольно подробно описан

но так как эта книга научное издание, то проверять примечания и ссылки было страшно муторно

и потом - даже хороший сканнер - а это специальный, из Франции пригнали - все равно читает например иногда "гр" как "ф" - и потом вылавливать такие блохи - очень много времени

следующую попробую в djvu

Re: Формат

Date: 2008-01-30 10:39 am (UTC)
From: [identity profile] berdychevsky.livejournal.com
"следующую попробую в djvu" - если там только две-три карты, то не стоит. Лучше отсканировать их отдельно и вставить как изображения в HTML.

Re: Формат

Date: 2008-01-30 10:51 am (UTC)
From: [identity profile] kommari.livejournal.com
честно говоря я не понимаю - как картинки вставлять? так места же займет слишком много?

Re: Формат

Date: 2008-01-30 11:06 am (UTC)
From: [identity profile] berdychevsky.livejournal.com
Это зависит от формата и смотря с каким разрешением сканировать. Если Вы немного знаете HTML, то у Вас особых сложностей быть не должно. Если нет, то вот Вам помощь:

http://www.intuit.ru/department/internet/htmlintro/4/
http://www.intuit.ru/department/internet/htmlbasics/7/

Date: 2008-01-30 11:15 am (UTC)
From: [identity profile] 1504.livejournal.com
хорошо!


когда приду власти - заменю тебе расстрел на пожизненный цик с гвоздями

Date: 2008-01-30 12:27 pm (UTC)
From: [identity profile] krf.livejournal.com
А почему страница за страницей?
Мне кажется, что эта книга поместилась бы всем разворотом - т.е. вы можете сканировать сразу две страницы, а нормальная программа должна это распознавать и эти две страницы разбивать (например, FineReader это умеет).
Я всегда так делаю - получается в два раза быстрее.

Date: 2008-01-30 12:38 pm (UTC)
From: [identity profile] kommari.livejournal.com
я пробовал - в центре много ошибок тогда получается - на стыке двух страниц
а этот сканнер удобен - у него кромка сделана так, что прижимается страница очень хорошо, при этом не деформируется книга - можно же так досканироваться, что книга развалится - а если библиотечная, да еще в мягкой обложке? - у нас совесть есть :)
потом, сканировать, как пока у меня выходит - не самое трудно - пока сидишь на полу, какую муру одним глазом смотришь - очень весело получается

а вот текст потом чистить от ошибок - трудно, долго и муторно

Date: 2008-01-30 12:53 pm (UTC)
From: [identity profile] krf.livejournal.com
Ну, если распознавать - то да.
А я, кстати, и не распознаю
В pdf или djvu можно перегнать и не распознавая.
Файл, правда, тяжеловатый получается.
Но сейчас и не такое по сети качают.

Date: 2008-01-30 01:35 pm (UTC)
From: [identity profile] kommari.livejournal.com
ну, более того - в pdf или djvu сохранятеся аутентичность книги - например, для научных работников это важно

Date: 2008-01-30 01:40 pm (UTC)
From: [identity profile] krf.livejournal.com
И это тоже, конечно.

Date: 2008-01-30 05:38 pm (UTC)
From: [identity profile] caliban-upon.livejournal.com
Спасибо за книгу!

Date: 2008-01-30 05:46 pm (UTC)
From: [identity profile] kommari.livejournal.com
Служу Советскому Союзу!

Спасибо!

Date: 2008-01-30 09:42 pm (UTC)
From: [identity profile] harding1989.livejournal.com
Если вы ещё не видели, то вот:
http://v-n-baryshnikov.narod.ru/

Re: Спасибо!

Date: 2008-01-31 03:25 pm (UTC)
From: [identity profile] kommari.livejournal.com
видел - и был страшно рад
это книга стоящая - финны сколько ни шипели в обзорах - но ключевой факт признали - никакого "благородства" Маннергейма, "пожлевшего" Ленинград - петербург его молодости не было - а была страшная мясорубка в районе Белоострова - и, как сказал один финский генерал немцам - еще месяц таких боев - и в Финляндии не останется мужчин

Re: Спасибо!

Date: 2008-01-31 05:47 pm (UTC)
From: [identity profile] harding1989.livejournal.com
О, там вообще многофакторная штука. На самом деле, надо всё это в кучу собрать как-нибудь, потому что есть много фактов, много исследований, но всё это разбросано. У Барышникова, Иринчеева, etc.

В частности, вот здесь можно почитать статью Иринчеева про отказы финских солдат переходить старую государственную границу: http://www.kaur.ru/articles/refusals.php

Date: 2008-01-31 03:58 am (UTC)
From: [identity profile] rexy-craxy.livejournal.com
Спасибо. И техническое:

1) выкладываемые в сеть книжки лучше сжимать;

2) сканировать лучше сразу разворотами; не знаю, как в винде, а у нас командлайновыми утилитами из пакета ImageMagic с картинками можно делать все, что угодно; я, например, повороты и "разрезание" делаю в пакетном режиме, не хватало еще на это человеко-часы тратить!

3) докУменты, вроде книг, имеющие официальные вых. данные, лучше сохранять в DjVu; с распознаванием не стОит мучаться, кому надо -- и почистит, и распознает, и может даже результат в сеть выложит :)

Date: 2008-01-31 03:29 pm (UTC)
From: [identity profile] kommari.livejournal.com
по последнему пункту - мне уже не раз говорили

но вот я люблю Word - из него и легко html сделать, и в КПК загнать, и делать выписки

а djvu - картинки фактически

но время - да, время жалко безумно

в общем, биографию Карла Маркса буду делать в djvu

Date: 2008-02-01 03:48 am (UTC)
From: [identity profile] rexy-craxy.livejournal.com
> но вот я люблю Word - из него и легко html сделать
Да Вы посмотрите, какой учудищный код он порождает! Объем файла раза в 1,5...2 больше необходимого.

> а djvu - картинки фактически
Неправда. Можно вставить текстовый слой. Не знаю, чем Вы DjVu смотрите, но обращайте внимание на панель инструментов: кнопочка "выделить текст" не на всех файлах серая.

А вообще Вам, наверное, стоит поинтересоваться такими вещами как *TeX, Texinfo, SGML-DocBook etc., если хотите текст из одного источника получать в куче разных форматов. Поверьте, Word (и вообще WYSIWYG-поделки) для этого малопригодны.

Date: 2008-01-31 08:52 pm (UTC)
From: [identity profile] zmej.livejournal.com
о, спасибо!

November 2017

S M T W T F S
   1234
56 78 91011
12131415 161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 12th, 2026 06:14 am
Powered by Dreamwidth Studios