?

Log in

No account? Create an account

Previous Entry | Next Entry

И снова Poisson d'avril, или как не была создана Российская компьютерная библиотека..
Я лет 20 тому назад начал активно заниматся созданием цифровой библиотеки. Дело в том, что мне удалось получить доступ к частной библиотеке, где хранились совершенно уникальные книги, в том числе книги принадлежавшие Альберту Эйнштейну и Николе Тесла. Достаточно сказать, что мне с двумя друзьями удалось оцифровать почти 2 миллиона страниц, работая по вечерам в свободное от работы время. Причем оборудование покупалось на весьма скромные доходы аспиранта. Хозяин библиотеки был очень пожилой и очень больной человек и он был категорически против выноса книг за пределы своей квартиры, а его родственнки хотя и появлялись очень редко, но тем не менее могли стать серьезным препятствием для этого проекта Поэтому установка для сканирования должна была быть компактной, малозаметной доступной финансово, но, вместе с тем, достаточно высоко производительной.
В ходе этого информационной эскапады, получившей шутливое название "Комиссия по ликвидации культурологических последствий четвертого крестового похода" была создана уникальная технология сканирования и обработки информации, соответствующая вышеизложенным обстоятельствам. Дело в том, что рынок сканеров и цифровых камер уже в то время был поделен между производителями профессионального оборудования, находившегося за пределами наших финансовых возможностей, и производителями так называемого "consumer level" оборудования которое не позволяло высоко производительное сканирование в силу софтверных ограничений. Нам после некоторого эксперементирования удалось преодолеть последствия этого картельного сговора и voila - почти 2 миллиона страниц было просканировано с качеством, позволяющим Abby Fine reader весьма достоверно распознавать результаты. Я попробовал предложить эту технологию Ленинской библиотеке, но они предпочли прибегнуть к помощи специалистов из США, которые предложили им просканировать всю советскую периодику, да еще заплатить за это 11 миллионов долларов.
Было это до начала масштабной глобализации, и в то время Москва весьма быстро приходила в себя после дефолта.. Дело в том, что глобализация приводит к нарушению компенсаторных механизмов, позволявшим народам, оказавшимся в условиях финансово-экономического кризиса, продолжать экономическую деятельность и даже обеспечивать опережающее развитие. Например, падение национальной валюты в результате дефолта привело к удешевлению рабочей силы и сделало множество товаров российской промышленности конкурентоспособными. Но все это возможно если при этом падает соответствующим образом стоимость жизни - например поездка на частнике из Шереметьево в центр Москвы стоила тогда примерно 7 долларов, а квартиру в Москве можно было купить за 30 тысяч долларов. Кроме того, дешевизна рабочей силы позволяла с весьма скромными средствами осуществлять весьма масштабные общенациональные проекты. Одним из них могла бы быть национальная компьютерная библиотека, но, к сожалению, ментальность советской номенклатуры, ее низкопоклонство перед западными технологиями, не позволила это сделать. Экономически бессмысленно сажать за установку стоимостью в 30 тысяч долларов и ресурсом полмиллиона сканирований работника, зарплата которого составляет 300 долларов в месяц. При работе же по моей технологии такие зарплаты позволяли обеспечить себестоимость сканирования примерно 1 рубль/страница. Между тем работники таких библиотек как ГПНТБ, РГБ, Историческая библиотека провели незадолго до этого свои собственные исследования на основе "профессиональных" западных технологий и указали в отчетах наверх себестоимость сканирования в 20 рублей/страница. А, например в Библиотеке Иностранной литературы, стоимость коммерческого сканирования доходила до 50 рублей за страницу, хотя работник библиотеки получал в то время примерно 150 долларов в месяц. Но и это не предел - я случайно попал в библиотеку, где стоимость сканирования доходила до 250 рублей/страница, причем качество сканирования было намного хуже, чем у меня. Естественно такие цены не позволяли пост-дефолтной России обеспечить создание сколько ни будь конкурентоспособной компьютерной библиотеки, так как одним из главных качеств компьютерных библиотек является их объем и полнота представленной литературы.
Пришлось РГБ, отказавшейся от моих услуг, прибегнуть к помощи новых друзей России из-за океана, представленных частной, никому неизвестной, но очень хорошо организованной фирмой, условно говоря, "СРУ, Интернатионал". Они с огромным удовольствием просканировали всю советскую периодику, а потом пришли в дирекцию РГБ и сказали, что они уезжают и оставляют в счет долга за любезно предоставленную возможность просканировать советские газеты сканеры, которые, кстати, выработали свой ресурс. И адьё, бай-бай, чао-бамбино-сори.. Интересно передали ли они РГБ копию результатов сканирования? Судя по тому, что Татьяна Борисовна Юмашева, руководитель "Фонда Первого Президента России Б. Н. Ельцина", вынуждена просить своих коллег из "Президентского центра Б.Н.Ельцина" оцифровать те газеты, которые ей нужны для ведения блога, нет не передали.
С первым апреля руководство РГБ, ГПНТБ и Иностранки. Историчка, кстати все таки прислушалась хоть к каким-то советам – и в результате появилась статья 19.2 закона об авторских правах, которая до сих пор позволяет совершенно легально создавать государственные компьютерные библиотеки, не вступая в конфликт с Женевской конвенцией об авторских правах:
«Допускается без согласия автора и без выплаты авторского вознаграждения предоставление во временное безвозмездное пользование библиотеками экземпляров произведений, введенных в гражданский оборот законным путем. При этом экземпляры произведений, выраженных в цифровой форме, в том числе экземпляры произведений, предоставляемых в порядке взаимного использования библиотечных ресурсов, могут предоставляться во временное безвозмездное пользование только в помещениях библиотек при условии исключения возможности создать копии этих произведений в цифровой форме.»
(Федеральный закон от 20 июля 2004 г. N 72 ФЗ)
Но нельзя оторвать идею от породившего ее человека без ущерба для этой идеи и пользы пока от этого мало.
С наступившей весной Вас, дорогие мои. Над Москвой весенний ветер веет!

Comments

( 18 comments — Leave a comment )
jkl_jkl
Apr. 2nd, 2011 06:58 am (UTC)
слова, вроде, все правильные, и расставлены
грамотно, а смысл не доходит, Сандро! ;)
abrod
Apr. 2nd, 2011 07:16 am (UTC)
Re: в каждой шутке...
ну во первых это первое апреля, а во вторых - я могу ответить на вопросы. Специально я ничего не запутывал - у меня просто мозги так устроены.
abrod
Apr. 2nd, 2011 07:27 am (UTC)
Re: слова, вроде, все правильные, и расставлены
Над Москвой весенний ветер веет! -надо понимать в прямом значении слова, без всяких ассоциаций. Ну может быть как сслку на источник некоего понравившегося мне выражения.
jkl_jkl
Apr. 2nd, 2011 07:49 am (UTC)
в отличие от вас, Сандро, Лебедев-Кумач, написав
над СТРАНОЙ весенний ветер веет,
с каждым днём всё радостнее жить,
и никто на свете не умеет,
лучше нас СМЕЯТЬСЯ и ЛЮБИТЬ


не имел в виду шизофрению ;)
abrod
Apr. 2nd, 2011 01:04 pm (UTC)
Re: в отличие от вас, Сандро, Лебедев-Кумач, написав
Каждому времени свой овощ.
abrod
Apr. 2nd, 2011 02:02 pm (UTC)
Re: в отличие от вас, Сандро, Лебедев-Кумач, написав
да и Вы тоже не плотник.
(Deleted comment)
abrod
Apr. 2nd, 2011 01:09 pm (UTC)
Рукой. А на мышку(педаль) нажималось ногой . 6 секунд страница.
(Deleted comment)
abrod
Apr. 2nd, 2011 01:19 pm (UTC)
Камерой или сканером. Зависело от книги.
(Deleted comment)
abrod
Apr. 2nd, 2011 01:22 pm (UTC)
Сканером быстрее. Камера требует выдержать время для наводки на резкость. Есть такие сканеры, которые сканировали страницу 300 dpi за 5 секундю
(Deleted comment)
abrod
Apr. 2nd, 2011 01:39 pm (UTC)
Да нет втягиаешься и работаешь на автомате. Мне было легче на сканере. Но с антикварными книгами сканером нельзя. Да и руки должны быть в перчатках. Резиновые не годятся. Лайку пришлось покупать. Работа с камерой очень сложна. По мере перелистования страница все время уползает из фокуса и области сканирования. Да и контроль результатов очень сложен, поскольку расфокусировку очень трудно заметить. По сути только после распознования можно было считать работу законченой, и часто приходилось досканировать, а это очень много времени занимало. Я планировал платить за работу с камерой зарплату в 2 раза больше.
(Deleted comment)
abrod
Apr. 2nd, 2011 01:48 pm (UTC)
не двигается обложка, а страница двигается, поскольку страниц под страницей становиться меньше, и направо она ползет. А сканером надо сканировать в кварцевых очках - глаза сожгешь. Ой там такая технология возникла - страшно вспомнить. Всего и не расскажешь
jkl_jkl
Apr. 2nd, 2011 06:25 pm (UTC)
Xerox сделал великолепные копировальные машины
для книг и журналов, в которых прозрачное окно начинается прямо с угла

по этому пути нужно идти и для сканеров

правда скорости перелистования страниц это не увеличит, но книги и журналы портит явно в меньшей степени ;)
abrod
Apr. 2nd, 2011 06:27 pm (UTC)
Re: Xerox сделал великолепные копировальные машины
Что сейчас происходит я уже не знаю. да и не важно это. Поезд ушел.
ilanocka
Sep. 18th, 2011 09:30 pm (UTC)
Спасибо за проделанную работу. Представляю каой сложности это труд.
Так вам удалось создать собственную электронную библиотеку?
(с оригинальными книгами Энштейна))
abrod
Sep. 18th, 2011 09:40 pm (UTC)
и не только. В основном она посвящена христианству. Проблема в том, что библиотеки никому не нужны - "зачем книжки читать, когда мы и так все знаем, у нас и бумажка есть об этом". Книги по науке я обещал не публиковать до 2015. Уже немного осталось. Но боюсь что и это никому не понадобится по той же причине.
ilanocka
Sep. 18th, 2011 09:51 pm (UTC)
Ваш Труд обязательно понадобится! Даже и не думайте так!
Когда пройдёт этот промежуток "пустоты" мозга и нравов, начнётся интеллектуальный голод.
Книги ветшают, их уничтожают, что само по себе и есть настоящее варварство.
Именно медиотеки в будущем приобретут повсеметную популярность.
Только вот где их хранить и как обмениваться, вопрос.
abrod
Sep. 18th, 2011 10:00 pm (UTC)
Спасибо. Я тоже так думаю. Иногда. Придумаем что нибудь. ФТР можно сделать. Только мои книги нужны специалистам, а их нет.
ilanocka
Sep. 18th, 2011 10:02 pm (UTC)
Специалисты есть, только они должны откуда-то узнать, что у вас есть для них. Типа Библиотеки Машкова, о которой все знают.
( 18 comments — Leave a comment )

Latest Month

November 2019
S M T W T F S
     12
3456789
10111213141516
17181920212223
24252627282930

Tags

Powered by LiveJournal.com
Designed by Lilia Ahner