kommari: (Default)
[personal profile] kommari

Воспользовавшись идеей [livejournal.com profile] kouzdra создал сообщество [info]gutenberg_ru


Первый пост оттуда размещаю у себя:


1. В данном сообществе книг для скачивания и чтения нет и не будет.

2. Участвовать в сообществе предлагается тем, кто лично готов:

- заниматься сканированием книг (если готовых сканов нет)
- заниматься вычиткой книг - то есть исправлением неизбежных ошибок
- заниматься форматированием полученного текста согласно оригиналу: разбиение на главы, абзацы, курсивы, выделения, подчеркивания, сноски, примечания и прочее
- заниматься конвертацией полученных текстов в разные форматы: doc/html/fb2 и другие
- заниматься размещением полученных текстов где угодно - на трекерах, в сетевых библиотеках, на личных и иных сайтах

Книги исключительно исторической, философской, политической и культурной тематики (то есть детективов или НФ или романов не будет), при этом научные и научно-популярные, при этом же - строго прогрессивного направления (то есть никаких Блаватских или Александров Никоновых)

В общем, добро пожаловать всем, кто готов лично работать, а не только скачивать и читать сделанное другими.

Общество не подменяет сообщество http://community.livejournal.com/znanie_vlast/ - которому и впредь желаем успешной работы, а дополняет его (как и всякие другие).

Date: 2010-10-01 09:51 pm (UTC)
From: [identity profile] neklyueva.livejournal.com
А что такое "прогрессивное направление"?

Date: 2010-10-01 09:55 pm (UTC)
From: [identity profile] kommari.livejournal.com
Социалистического и около.

Date: 2010-10-01 10:06 pm (UTC)
From: [identity profile] neklyueva.livejournal.com
Не понятно...
Вот например "Церковная история народа англов" Беды Достопочтенного, это прогрессивненько или реакционненько?
Мне кажется, что в делении книг по такому критерию есть что-то изначально порочное.
В своей электронной библиотеке я не пожалела места для Блаватской и исторических опусов Фоменко, хотя отношусь к ним не лучше Вашего.

Date: 2010-10-01 10:11 pm (UTC)
From: [identity profile] kommari.livejournal.com
Это очень ценная книга - но при таком походе можно утонуть - хороших книг море.

Я и многие мои ЖЖ-френды (с кем я еще не поругался) - коммунисты, социалисты, левые - и хотелось бы, чтобы литература нашей направленности распространялась бы как можно более широко.

Date: 2010-10-01 10:14 pm (UTC)
From: [identity profile] neklyueva.livejournal.com
Будем следить:)

Date: 2010-10-01 10:19 pm (UTC)
From: [identity profile] kommari.livejournal.com
Вы, значит, не поняли.
Это сообщество для тех кто делает книги - просто сговариваться, кто, например, какую главу вычитывает - но не для размещения.

Date: 2010-10-01 10:25 pm (UTC)
From: [identity profile] neklyueva.livejournal.com
Я поняла. Сама я не готова ни вычитывать, ни сканировать, но у меня есть большое множество книг в "плохих" форматах, которые я готова предоставлять, если их по каким-то причинам нельзя найти где-то еще. Так бывает:)
Хотя лично мне "плохой" формат djvu нравится больше всего. Он надежнее.
В том числе это и книги по интересующей вас тематике.

Date: 2010-10-01 10:31 pm (UTC)
From: [identity profile] kommari.livejournal.com
Я сам читаю много в djvu - хотя хорошей читалки пока под нее нет.

Но вот как, например, извлечь оттуда кусок текста?

А как бы узнать, чего у Вас есть (и чего нет у меня - потому что я старательно собираю всю левую литературу, даже столь ненавистных мне в последнее время евролеваков).

Date: 2010-10-01 10:46 pm (UTC)
From: [identity profile] neklyueva.livejournal.com
На самом деле, я и сама не знаю:)
Поиск у меня есть, рубрикация тоже, но это общая проблема больших электронных библиотек: книги не визуализированы, их не помнишь.
Всякой "околополитики" у меня тоже полно, но я это еще не разбирала, так что и искать смысла нет, но я постепенно разбираю, так что могу делать на эту тему сообщения:)
То, что меня действительно интересовало, что уже разобрано и чего много - классики истмата, авторы типа Льюиса Моргана.
Но вот вам сверхзадачка: нормального, читабельного ПСС Ленина в сети нет. Есть нечто несуразное в формате ворда с текстом враскарячку.
А по истмату могу составить список.

Date: 2010-10-01 11:38 pm (UTC)
From: [identity profile] int19h.livejournal.com
>> Я сам читаю много в djvu - хотя хорошей читалки пока под нее нет.
>> Но вот как, например, извлечь оттуда кусок текста?

В общем случае напрямую это невозможно в силу специфики формата djvu (т.к. часть, а то и весь текст там могут храниться в виде картинок). Он все-таки заточен под архивирование "pixel perfect" сканов документов (когда важен не только текст, но и внешний вид в целом).

Но никто не мешает подать djvu на вход какому-нибудь OCR, и вручную подкорректировать результаты. Если djvu уже есть, это в любом случае быстрее, чем вручную сканировать бумажную книгу.

Date: 2010-10-02 06:52 am (UTC)
From: [identity profile] kommari.livejournal.com
Ну так вот именно потому и ставится задача перегонки pdf и djvu в другие форматы.

Date: 2010-10-02 08:26 am (UTC)
From: [identity profile] stepanishchev.livejournal.com
Формат djvu допускает наличие OCR-слоя (распознанного текста). Слой имеет привязку к расположению текста на странице. Из такого файла можно извлечь кусок текста просто выделив его и скопировав в буфер обмена (операция "Select text in selected area"). Можно также делать поиск слова или фрагмента в файле.

Вот пример: http://mk.semico.ru/text/dyakonov_3.djvu

Другой вопрос, что создателям файлов нередко лень делать "лишнюю" работу по очистке сканов от мусора, распознаванию, вычитке и прикреплению текста. Увы. Поэтому djvu-файлов с прикреплённым текстом в десятки раз меньше, чем без него.

Понятие "хорошая читалка" достаточно условно. Например, читать fb2 под Линуксом затруднительно, хотя существуют PyBookReader, OrnamentBook или FBReader. Можно, конечно, читать его как обычный текст, но не совсем удобно. Вряд ли разумно затруднять доступ к коммунистической литературе нынешним пользователям СПО. ;)

Date: 2010-10-02 08:31 am (UTC)
From: [identity profile] kommari.livejournal.com
В принципеп Вы же сами и ответили, почему я н очень любллю djvu:

"Поэтому djvu-файлов с прикреплённым текстом в десятки раз меньше, чем без него".

И именно для того, чтобы увеличить число читателей (и, кстати, не только комлитературы - хорошая научпопкнига по экономике или истории не менее хорошая вещь - и полезна коммунизму :), чем сложный труд какого-нибудь Бородатого Гения)

Date: 2010-10-02 08:45 am (UTC)
From: [identity profile] stepanishchev.livejournal.com
Только не вполне понятно, кто мешает делать новые djvu сразу с текстом? Приемлемые читалки этого формата есть под большинство ОС, про возможное наличие OCR-слоя они знают.

Но это всё вторично. Имея текст и сканы можно конвертировать книгу в любой формат - дело вкуса и времени.

Однако, если тенденция к сползанию в тёмные века не сменится, коммунизму будет полезно всё что угодно, вплоть до инструкций по пользованию туалетной бумагой. Было бы только кому их читать.

Date: 2010-10-02 05:17 am (UTC)
From: [identity profile] trilirium.livejournal.com
Идея прекрасная.

Date: 2010-10-02 06:51 am (UTC)
From: [identity profile] kommari.livejournal.com
Но требует времени - занудное это дело.
Плюс вкусы могут не совпадать - одни хотят книжек про Троцкого, другие - против оного. И все заканчивается срачем и массовыми расфрендами.
Плюс опыт опказывает, что многие хорошие идеи умирают в младенческом обществе.

Так что программа минимум - небольшая команда, которая пусть понемногу, но работала бы.

Date: 2010-10-02 06:26 pm (UTC)
From: [identity profile] sandblaster.livejournal.com
...Гутенберги, Розенберги, Айзенберги, всякие там Абрамовичи... Двадцать лет, как жизни нет... ;-)
А пачиму не федоров-ру?

Date: 2010-10-02 07:08 pm (UTC)
From: [identity profile] kouzdra.livejournal.com
Я только предлагаю все-таки выкладывать ссылки на сами тексты (хоть в djvu) - чтобы можно было оценить книгу. Во-вторых - у меня вот в личной очереди стоят "История партии С.-Д." Спиридовича и мемуары Бурцева - на html-изацию и мемуары Герасимова на OCR etc.

Это, безусловно, литератуа политическая - но есть вопрос с направлением - вряд ли историю СД "от жандарма" можно назвать прогрессивной (хотя она объективна - никоим образом не агитка) - но с моей точки зрения это очень полезный "документ времени", да и очерк неплохой.

Date: 2010-10-03 06:08 am (UTC)
From: [identity profile] kommari.livejournal.com
Определение "прогрессивный" не очень удачное - и уважаемая Неклюева в своем комментарии верно указала на это, но, кроме того что мне нравится это слово :), это еще попытка ограничить немного тематику левосоциалистическими книгами (иначе, как я спорил с модераторами "Знания - власть", нужно распорстранять и учебники по сопромату - это тоже прогрессивная литература - особенно в сравнении с какой-нибудь "Как правильно держать православный пост").
Бурцев и Спиридович тем не менее подходят очень хорошо - их книги многое позволяют понять в Русской революции - так что их обработкой заняться можно и даже нужно.

Date: 2010-10-03 07:12 am (UTC)
From: [identity profile] stepanishchev.livejournal.com
> ...нужно распространять и учебники по сопромату - это тоже прогрессивная литература - особенно в сравнении с какой-нибудь "Как правильно держать православный пост"

Очень правильная мысль, между прочим.

ПМСМ, бесплатный доступ к запасам накопленных человечеством знаний, в том числе технических, организованный коммунистами в противовес идиотическим буржуйским запретам под вывеской "авторских" и "цифровых" прав - это даже полезнее для дела, чем бесконечные свары левых о том, кто кому что дословно сказал в конце позапрошлого века. При всём моём почтении, разумеется, к истории вообще и истории Октябрьской Революции в частности, - но не это тревожит массы и является первоочередной угрозой, а наступление мракобесия по всем фронтам и подлое шельмование реальных достижений советского социализма.

Отзывчивее надо быть к требованиям момента, товарищи. ;)

Date: 2010-10-13 01:55 pm (UTC)
From: [identity profile] i-ddragon.livejournal.com
http://www.litportal.kiev.ua/2010/10/07/megamolekuli.html (http://www.litportal.kiev.ua/2010/10/07/megamolekuli.html)

Вроде такого.

November 2017

S M T W T F S
   1234
56 78 91011
12131415 161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 11th, 2026 11:18 pm
Powered by Dreamwidth Studios