HOW TO DOWNLOAD
Руководство по «скачиванию» диссертаций с сайта РГБ.
Алгоритм действий такой:
1. Заходим на сайт РГБ rsl.ru, ищем диссер.
2. Идем по ссылке, выбираем DVS, залогиниваемся и получаем доступ к диссеру.
3. Жмем символ замка и получаем полный доступ к диссеру.
4. Теперь следуем инструкциям в прикрепленном файле Manual_diss_2, знакомимся с новой программой Clickermann. Идея простая: автокликером отскриншотить всю диссертацию. Скрипт Diss_active.cms прилагается.
5. Диссертацию отскриншочена, файлы сохранены в разрешении bmp.
6. Теперь ее нужно распознать файнридером. Для этого открываем все файлы файнридером (FineReader), в опциях перед открытием файлов ставим а) черно-белое изображение, б) отключить предобработку изображений. Все файлы открыты, заходим во внутренний редактор изображений, жмем Ctrl +A, чтобы выделить все файлы, выделяем область обрезки и обрезаем. Теперь жмем кнопку "Распознать". После распознавания сохраняем диссертацию только в формате pdf.
7. Теперь у нас имеется распознанный файл в pdf, объем которого намного меньше изначального.
Полезные замечания:
1. Для вменяемго качества распознования размер вашего монитора должне быть не меньше 21 дюйма, так чтобы масштаб на сайте РГБ был не меньше 150%
2. Монитор невозможно повернуть в положение Portrait. Для этого добавляем пару строк в скрипт после //FIRST DISSERTATION
LCLICK(470,20)//rotation the page, coordinates in the ACTIVE WINDOW! WAITMS(100)//waits 100 ms
и постоянно вращаем саму страничку.
3. Рекомендуется в качестве браузера исльзовать Firefox. Очень стабильно работает, не грузит комьютер.
4. Попробуйте интерпретатор jpg, скриншоты получаются меньшего размера, Файнридер их проглатывает значительно быстрее. Для этого заходим в настройки, жмем влкадку интерпретация, потом скриншот в jpg. Все работает? Отлично. Не работает? Перезагружаем браузер и пробуем еще. Все еще не работает? Делаем скриншоты в bmp.
5. Чтобы ускорить процесс закачки можно одновременно запускать несколько браузеров и несколько автокликеров, логиниться под разными аккаунтами. Cкриншоты будут отличаться и обрезать их придется по разному, так что времени экономится немного.